基于增強學(xué)習(xí)的虛擬機服務(wù)遷移的關(guān)鍵技術(shù)研究及應(yīng)用
發(fā)布時間:2021-02-06 11:35
作為新一代分布式計算的基礎(chǔ)設(shè)施,云計算平臺由于其在性能和價格上相對于傳統(tǒng)平臺的優(yōu)勢,已經(jīng)成為近些年學(xué)術(shù)界和工業(yè)界研究的一個熱點,其應(yīng)用領(lǐng)域在不斷擴展。相對于普通云服務(wù),移動云計算的典型特點是訪問延遲的敏感性和訪問時空域的變化性。從用戶的角度來說,能最大化地獲得服務(wù)是非常重要的。但隨著用戶群體的增長,訪問量的增加,這種獲得性對云服務(wù)提供者來說變得愈加困難,同時也愈加迫切。因此,如不考慮這些因素的情況下提供服務(wù),可能會顯著增加訪問延遲。更糟的是增大網(wǎng)絡(luò)流量,導(dǎo)致服務(wù)中斷和性能下降。為了緩解這個問題,將服務(wù)遷移到網(wǎng)絡(luò)中靠近用戶的某些有利位置是最小化訪問延遲并降低網(wǎng)絡(luò)成本的一個有效方式。憑借云計算虛擬化技術(shù),我們可將服務(wù)封裝在一組虛擬機中,并根據(jù)需要遷移到一個或不同的數(shù)據(jù)中心,實現(xiàn)用戶的就近訪問。將服務(wù)遷移到離用戶較近的位置不僅能夠降低服務(wù)訪問延遲,而且還會降低服務(wù)提供商的網(wǎng)絡(luò)租賃成本。因此,服務(wù)遷移問題對于實時服務(wù)來說顯得異常重要。然而,服務(wù)遷移以批量數(shù)據(jù)傳輸和可能的服務(wù)中斷為代價,增加了總體服務(wù)成本。為了在減少服務(wù)成本的同時獲得服務(wù)遷移的益處,本文基于增強學(xué)習(xí)的方法提出Mig-RL遷移框架...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
增強學(xué)習(xí)框架圖
基于增強學(xué)習(xí)的虛擬機服務(wù)遷移的關(guān)鍵技術(shù)研究及應(yīng)用書中直接將滿足馬爾可夫性的增強學(xué)習(xí)任務(wù)定義為馬爾可態(tài)和動作都是有限空間的 MDP 定義為有限馬爾可夫決策)(Sutton, 1998)。在馬爾可夫決策過程中,智能體必須在狀態(tài),并且采取行動進(jìn)而影響狀態(tài)。馬爾可夫決策過程標(biāo)三個簡單的形式。馬爾可夫決策過程是強化學(xué)習(xí)的數(shù)
圖 2.2 馬爾可夫決策過程視圖Figure 2.2 Markov Decision Process是一個馬爾可夫決策過程的視圖,描述了智能體在狀態(tài) s 下,選擇動作一個狀態(tài) 并得到相應(yīng)的回報值 r。這個過程說明獎賞是通過行動引起后得到的。馬爾可夫決策過程是強化學(xué)習(xí)的理論基礎(chǔ)。我們的目標(biāo)是選作,使全部的累積回報值最大。累積回報計算方式如公式 2.1。 = = (馬爾可夫決策過程是一個智能體與環(huán)境交互的過程,因此在離散的時間 ,在每一個時刻 t,智能體都會處于一個表示環(huán)境的狀態(tài) 表示所有的狀態(tài)集合。
【參考文獻(xiàn)】:
期刊論文
[1]云計算技術(shù)在數(shù)字圖書館中的應(yīng)用與分析[J]. 趙海濤,趙建軍. 科技情報開發(fā)與經(jīng)濟. 2014(07)
[2]云計算:體系架構(gòu)與關(guān)鍵技術(shù)[J]. 羅軍舟,金嘉暉,宋愛波,東方. 通信學(xué)報. 2011(07)
[3]云計算:系統(tǒng)實例與研究現(xiàn)狀[J]. 陳康,鄭緯民. 軟件學(xué)報. 2009(05)
本文編號:3020543
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
增強學(xué)習(xí)框架圖
基于增強學(xué)習(xí)的虛擬機服務(wù)遷移的關(guān)鍵技術(shù)研究及應(yīng)用書中直接將滿足馬爾可夫性的增強學(xué)習(xí)任務(wù)定義為馬爾可態(tài)和動作都是有限空間的 MDP 定義為有限馬爾可夫決策)(Sutton, 1998)。在馬爾可夫決策過程中,智能體必須在狀態(tài),并且采取行動進(jìn)而影響狀態(tài)。馬爾可夫決策過程標(biāo)三個簡單的形式。馬爾可夫決策過程是強化學(xué)習(xí)的數(shù)
圖 2.2 馬爾可夫決策過程視圖Figure 2.2 Markov Decision Process是一個馬爾可夫決策過程的視圖,描述了智能體在狀態(tài) s 下,選擇動作一個狀態(tài) 并得到相應(yīng)的回報值 r。這個過程說明獎賞是通過行動引起后得到的。馬爾可夫決策過程是強化學(xué)習(xí)的理論基礎(chǔ)。我們的目標(biāo)是選作,使全部的累積回報值最大。累積回報計算方式如公式 2.1。 = = (馬爾可夫決策過程是一個智能體與環(huán)境交互的過程,因此在離散的時間 ,在每一個時刻 t,智能體都會處于一個表示環(huán)境的狀態(tài) 表示所有的狀態(tài)集合。
【參考文獻(xiàn)】:
期刊論文
[1]云計算技術(shù)在數(shù)字圖書館中的應(yīng)用與分析[J]. 趙海濤,趙建軍. 科技情報開發(fā)與經(jīng)濟. 2014(07)
[2]云計算:體系架構(gòu)與關(guān)鍵技術(shù)[J]. 羅軍舟,金嘉暉,宋愛波,東方. 通信學(xué)報. 2011(07)
[3]云計算:系統(tǒng)實例與研究現(xiàn)狀[J]. 陳康,鄭緯民. 軟件學(xué)報. 2009(05)
本文編號:3020543
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3020543.html
最近更新
教材專著