基于深度強(qiáng)化學(xué)習(xí)的高效能云任務(wù)調(diào)度算法研究
發(fā)布時(shí)間:2023-02-21 10:08
云計(jì)算是現(xiàn)代信息社會重要的基礎(chǔ)設(shè)施,云任務(wù)調(diào)度作為云計(jì)算中最重要的一項(xiàng)技術(shù),直接關(guān)乎用戶和云服務(wù)提供商的利益。傳統(tǒng)的云任務(wù)調(diào)度算法往往采用固定的策略進(jìn)行調(diào)度,這類算法實(shí)現(xiàn)簡單,同時(shí)擁有較高的調(diào)度效率,在一定程度上解決了離線任務(wù)調(diào)度問題。隨著云計(jì)算的廣泛應(yīng)用和任務(wù)調(diào)度規(guī)模日益增加,在線任務(wù)調(diào)度存在數(shù)據(jù)中心集群高異構(gòu)性、集群運(yùn)行環(huán)境和任務(wù)提交數(shù)量高波動性、優(yōu)化目標(biāo)多樣性等問題,傳統(tǒng)的算法不能夠動態(tài)的改變自己的調(diào)度策略來高效的進(jìn)行在線任務(wù)調(diào)度。近年來,深度強(qiáng)化學(xué)習(xí)在理論研究上取得了巨大的成功,本文旨在研究基于深度強(qiáng)化學(xué)習(xí)的云任務(wù)調(diào)度算法來改善上面的問題。本文的主要內(nèi)容及貢獻(xiàn)如下:1)在單數(shù)據(jù)中心任務(wù)調(diào)度的場景下,針對數(shù)據(jù)中心集群高異構(gòu)性問題,本文通過對深度強(qiáng)化學(xué)習(xí)中智能體的動作、狀態(tài)和獎勵(lì)進(jìn)行建模,提出了基于改進(jìn)深度Q學(xué)習(xí)算法的云任務(wù)調(diào)度算法。為了增強(qiáng)智能體的探索能力,算法中使用了Boltzmann動作探索策略對傳統(tǒng)的動作探索策略進(jìn)行改進(jìn)。在模擬數(shù)據(jù)集上的實(shí)驗(yàn)顯示,該算法擁有良好的收斂性,CPU利用率標(biāo)準(zhǔn)差降低了6.7%,有效促進(jìn)了集群負(fù)載均衡,任務(wù)的指令響應(yīng)時(shí)間比提升了5.3%,實(shí)現(xiàn)了高效...
【文章頁數(shù)】:105 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 云計(jì)算和云任務(wù)調(diào)度
1.2.2 深度強(qiáng)化學(xué)習(xí)
1.3 論文主要工作及貢獻(xiàn)
1.4 論文的組織結(jié)構(gòu)
第2章 云任務(wù)調(diào)度及深度強(qiáng)化學(xué)習(xí)概述
2.1 云計(jì)算中的任務(wù)調(diào)度
2.1.1 云任務(wù)調(diào)度基本流程
2.1.2 云任務(wù)調(diào)度優(yōu)化目標(biāo)
2.1.3 云任務(wù)調(diào)度常見算法
2.2 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.2.1 馬爾科夫決策過程
2.2.2 常用強(qiáng)化學(xué)習(xí)方法
2.3 深度強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.3.1 深度神經(jīng)網(wǎng)絡(luò)模型
2.3.2 深度Q學(xué)習(xí)算法
2.3.3 深度確定性策略梯度算法
2.4 本章小結(jié)
第3章 基于深度強(qiáng)化學(xué)習(xí)的云任務(wù)調(diào)度
3.1 場景建模與優(yōu)化目標(biāo)
3.1.1 云任務(wù)調(diào)度環(huán)境建模
3.1.2 優(yōu)化目標(biāo)公式化
3.2 基于深度Q學(xué)習(xí)的云任務(wù)調(diào)度
3.2.1 狀態(tài)空間、動作空間、獎勵(lì)函數(shù)設(shè)計(jì)
3.2.2 Boltzmann動作探索策略
3.2.3 云任務(wù)調(diào)度算法設(shè)計(jì)
3.3 基于深度確定性策略梯度的云任務(wù)調(diào)度
3.3.1 狀態(tài)空間、動作空間、獎勵(lì)函數(shù)設(shè)計(jì)
3.3.2 基于最早調(diào)度算法的動作探索策略
3.3.3 動作網(wǎng)絡(luò)離線訓(xùn)練改進(jìn)方法
3.3.4 云任務(wù)調(diào)度算法設(shè)計(jì)
3.4 仿真實(shí)驗(yàn)及結(jié)果分析
3.4.1 實(shí)驗(yàn)環(huán)境及配置
3.4.2 實(shí)驗(yàn)數(shù)據(jù)
3.4.3 基于深度Q學(xué)習(xí)的云任務(wù)調(diào)度算法實(shí)驗(yàn)
3.4.4 基于深度確定性策略梯度的云任務(wù)調(diào)度算法實(shí)驗(yàn)
3.5 本章小結(jié)
第4章 基于深度確定性策略梯度的多數(shù)據(jù)中心云任務(wù)調(diào)度
4.1 場景建模與優(yōu)化目標(biāo)
4.1.1 多數(shù)據(jù)中心云任務(wù)調(diào)度環(huán)境建模
4.1.2 優(yōu)化目標(biāo)公式化
4.2 基于深度確定性策略梯度的多數(shù)據(jù)中心云任務(wù)調(diào)度
4.2.1 狀態(tài)空間、動作空間、獎勵(lì)函數(shù)設(shè)計(jì)
4.2.2 成本感知的動作探索策略
4.2.3 云任務(wù)調(diào)度算法設(shè)計(jì)
4.3 仿真實(shí)驗(yàn)及結(jié)果分析
4.4 本章小結(jié)
第5章 云任務(wù)調(diào)度仿真系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 需求分析
5.2 系統(tǒng)總體設(shè)計(jì)
5.3 各功能模塊設(shè)計(jì)與實(shí)現(xiàn)
5.3.1 數(shù)據(jù)生成模塊
5.3.2 任務(wù)模塊
5.3.3 調(diào)度算法模塊
5.3.4 集群模塊
5.3.5 虛擬機(jī)模塊
5.3.6 數(shù)據(jù)存儲與分析模塊
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
作者簡歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號:3747542
【文章頁數(shù)】:105 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 云計(jì)算和云任務(wù)調(diào)度
1.2.2 深度強(qiáng)化學(xué)習(xí)
1.3 論文主要工作及貢獻(xiàn)
1.4 論文的組織結(jié)構(gòu)
第2章 云任務(wù)調(diào)度及深度強(qiáng)化學(xué)習(xí)概述
2.1 云計(jì)算中的任務(wù)調(diào)度
2.1.1 云任務(wù)調(diào)度基本流程
2.1.2 云任務(wù)調(diào)度優(yōu)化目標(biāo)
2.1.3 云任務(wù)調(diào)度常見算法
2.2 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.2.1 馬爾科夫決策過程
2.2.2 常用強(qiáng)化學(xué)習(xí)方法
2.3 深度強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.3.1 深度神經(jīng)網(wǎng)絡(luò)模型
2.3.2 深度Q學(xué)習(xí)算法
2.3.3 深度確定性策略梯度算法
2.4 本章小結(jié)
第3章 基于深度強(qiáng)化學(xué)習(xí)的云任務(wù)調(diào)度
3.1 場景建模與優(yōu)化目標(biāo)
3.1.1 云任務(wù)調(diào)度環(huán)境建模
3.1.2 優(yōu)化目標(biāo)公式化
3.2 基于深度Q學(xué)習(xí)的云任務(wù)調(diào)度
3.2.1 狀態(tài)空間、動作空間、獎勵(lì)函數(shù)設(shè)計(jì)
3.2.2 Boltzmann動作探索策略
3.2.3 云任務(wù)調(diào)度算法設(shè)計(jì)
3.3 基于深度確定性策略梯度的云任務(wù)調(diào)度
3.3.1 狀態(tài)空間、動作空間、獎勵(lì)函數(shù)設(shè)計(jì)
3.3.2 基于最早調(diào)度算法的動作探索策略
3.3.3 動作網(wǎng)絡(luò)離線訓(xùn)練改進(jìn)方法
3.3.4 云任務(wù)調(diào)度算法設(shè)計(jì)
3.4 仿真實(shí)驗(yàn)及結(jié)果分析
3.4.1 實(shí)驗(yàn)環(huán)境及配置
3.4.2 實(shí)驗(yàn)數(shù)據(jù)
3.4.3 基于深度Q學(xué)習(xí)的云任務(wù)調(diào)度算法實(shí)驗(yàn)
3.4.4 基于深度確定性策略梯度的云任務(wù)調(diào)度算法實(shí)驗(yàn)
3.5 本章小結(jié)
第4章 基于深度確定性策略梯度的多數(shù)據(jù)中心云任務(wù)調(diào)度
4.1 場景建模與優(yōu)化目標(biāo)
4.1.1 多數(shù)據(jù)中心云任務(wù)調(diào)度環(huán)境建模
4.1.2 優(yōu)化目標(biāo)公式化
4.2 基于深度確定性策略梯度的多數(shù)據(jù)中心云任務(wù)調(diào)度
4.2.1 狀態(tài)空間、動作空間、獎勵(lì)函數(shù)設(shè)計(jì)
4.2.2 成本感知的動作探索策略
4.2.3 云任務(wù)調(diào)度算法設(shè)計(jì)
4.3 仿真實(shí)驗(yàn)及結(jié)果分析
4.4 本章小結(jié)
第5章 云任務(wù)調(diào)度仿真系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 需求分析
5.2 系統(tǒng)總體設(shè)計(jì)
5.3 各功能模塊設(shè)計(jì)與實(shí)現(xiàn)
5.3.1 數(shù)據(jù)生成模塊
5.3.2 任務(wù)模塊
5.3.3 調(diào)度算法模塊
5.3.4 集群模塊
5.3.5 虛擬機(jī)模塊
5.3.6 數(shù)據(jù)存儲與分析模塊
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
作者簡歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號:3747542
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3747542.html
最近更新
教材專著