基于多Agent強(qiáng)化學(xué)習(xí)的自適應(yīng)服務(wù)組合研究
發(fā)布時(shí)間:2017-08-15 14:37
本文關(guān)鍵詞:基于多Agent強(qiáng)化學(xué)習(xí)的自適應(yīng)服務(wù)組合研究
更多相關(guān)文章: 服務(wù)組合 強(qiáng)化學(xué)習(xí) 多Agent系統(tǒng) 自適應(yīng)性 QoS
【摘要】:在服務(wù)計(jì)算領(lǐng)域,隨著運(yùn)行環(huán)境的變化和服務(wù)自身的演化,Web服務(wù)組合時(shí)刻面臨著動(dòng)態(tài)復(fù)雜環(huán)境所帶來的性能挑戰(zhàn)。因此,Web服務(wù)組合技術(shù)必須具有自適應(yīng)性,要能夠?qū)ν獠凯h(huán)境的變動(dòng)和服務(wù)自身的演化作出及時(shí)的反應(yīng)和調(diào)整,從而維持自身的性能表現(xiàn)。除此以外,服務(wù)組合技術(shù)還應(yīng)兼顧到大規(guī)模服務(wù)場景下的效率要求,確保其具有較高的實(shí)用價(jià)值。本文提出了一個(gè)基于多Agent強(qiáng)化學(xué)習(xí)的、面向動(dòng)態(tài)復(fù)雜場景的自適應(yīng)服務(wù)組合模型。該模型在強(qiáng)化學(xué)習(xí)技術(shù)的基礎(chǔ)上,融入了多Agent系統(tǒng)機(jī)制和博弈論領(lǐng)域里的虛擬行動(dòng)過程。該模型利用強(qiáng)化學(xué)習(xí)技術(shù)實(shí)現(xiàn)動(dòng)態(tài)場景下服務(wù)組合的自適應(yīng)性,利用多Agent機(jī)制提升自身的計(jì)算效率,利用博弈論里的虛擬行動(dòng)過程實(shí)現(xiàn)多Agent間的協(xié)同工作。同時(shí),在該模型的基礎(chǔ)上,本文分別提出了基于離策略強(qiáng)化學(xué)習(xí)和在策略強(qiáng)化學(xué)習(xí)的自適應(yīng)服務(wù)組合算法,并從理論上證明了它們的收斂性。最后,本文通過一系列仿真實(shí)驗(yàn)驗(yàn)證了算法的有效性、可擴(kuò)展性和自適應(yīng)性。
【關(guān)鍵詞】:服務(wù)組合 強(qiáng)化學(xué)習(xí) 多Agent系統(tǒng) 自適應(yīng)性 QoS
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP18;TP393.09
【目錄】:
- 摘要4-5
- Abstract5-8
- 本論文專用術(shù)語的注釋表8-9
- 第一章 緒論9-20
- 1.1 研究背景與動(dòng)機(jī)10-13
- 1.1.1 軟件系統(tǒng)的自適應(yīng)性10-11
- 1.1.2 Web服務(wù)組合的自適應(yīng)性11-12
- 1.1.3 研究動(dòng)機(jī)12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-17
- 1.2.1 自適應(yīng)服務(wù)組合研究13-15
- 1.2.2 基于多Agent技術(shù)的服務(wù)組合研究15-16
- 1.2.3 多Agent強(qiáng)化學(xué)習(xí)研究16-17
- 1.3 研究內(nèi)容17-18
- 1.4 論文結(jié)構(gòu)18-20
- 第二章 Web服務(wù)組合概述20-31
- 2.1 Web服務(wù)20-23
- 2.1.1 Web服務(wù)定義20-21
- 2.1.2 Web服務(wù)模型21-22
- 2.1.3 常用Web服務(wù)標(biāo)準(zhǔn)22-23
- 2.2 Web服務(wù)組合23-26
- 2.2.1 Web服務(wù)組合的概念23-24
- 2.2.2 Web服務(wù)組合的方法24-26
- 2.3 Web服務(wù)組合的服務(wù)質(zhì)量26-28
- 2.3.1 服務(wù)質(zhì)量定義26
- 2.3.2 QoS屬性26-27
- 2.3.3 QoS抽象模型27-28
- 2.4 Web服務(wù)組合的自適應(yīng)性28-30
- 2.4.1 Web服務(wù)組合的自適應(yīng)性定義28-29
- 2.4.2 Web服務(wù)組合的自適應(yīng)性內(nèi)容29-30
- 2.5 本章小結(jié)30-31
- 第三章 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)31-37
- 3.1 強(qiáng)化學(xué)習(xí)原理和結(jié)構(gòu)31-33
- 3.2 馬爾可夫決策過程33-34
- 3.3 強(qiáng)化學(xué)習(xí)常用算法34-36
- 3.3.1 TD算法34
- 3.3.2 Q學(xué)習(xí)算法34-35
- 3.3.3 Sarsa算法35-36
- 3.4 本章小結(jié)36-37
- 第四章 基于多Agent強(qiáng)化學(xué)習(xí)的自適應(yīng)服務(wù)組合模型37-61
- 4.1 場景描述37
- 4.2 模型構(gòu)建37-45
- 4.2.1 基于Markov Decision Process的單Agent服務(wù)組合模型37-40
- 4.2.2 基于Markov Games的多Agent服務(wù)組合模型40-45
- 4.3 最優(yōu)策略定義45-50
- 4.3.1 獎(jiǎng)勵(lì)函數(shù)定義45-48
- 4.3.2 基于Nash均衡的最優(yōu)策略定義48-50
- 4.4 協(xié)同機(jī)制設(shè)計(jì)50-54
- 4.4.1 虛擬行動(dòng)過程50-52
- 4.4.2 協(xié)同方法設(shè)計(jì)52-54
- 4.5 求解方法54-56
- 4.5.1 基于離策略強(qiáng)化學(xué)習(xí)的求解算法54-56
- 4.5.2 基于在策略強(qiáng)化學(xué)習(xí)的求解算法56
- 4.6 方法的收斂性研究56-59
- 4.6.1 基于離策略強(qiáng)化學(xué)習(xí)的求解算法的收斂性研究56-58
- 4.6.2 基于在策略強(qiáng)化學(xué)習(xí)的求解算法的收斂性研究58-59
- 4.7 本章小結(jié)59-61
- 第五章 實(shí)驗(yàn)與分析61-67
- 5.1 實(shí)驗(yàn)設(shè)置61-62
- 5.2 結(jié)果與分析62-66
- 5.2.1 有效性分析62-63
- 5.2.2 可擴(kuò)展性分析63-65
- 5.2.3 自適應(yīng)性分析65-66
- 5.3 本章小結(jié)66-67
- 第六章 總結(jié)與展望67-71
- 6.1 本文總結(jié)67-68
- 6.2 未來工作68-71
- 致謝71-72
- 參考文獻(xiàn)72-78
- 附錄A 攻讀碩士期間發(fā)表的論文78
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張宇晴,佟振聲,胡旦華,武雪芳;Agent技術(shù)在廠級(jí)監(jiān)控信息系統(tǒng)中的應(yīng)用[J];上海電力學(xué)院學(xué)報(bào);2004年01期
2 林菁,孟波;群體決策支持系統(tǒng)中的管理和協(xié)調(diào)Agent及其應(yīng)用研究[J];計(jì)算機(jī)應(yīng)用與軟件;2004年12期
3 羅朝春,涂光瑜,羅毅,盛戈f,
本文編號(hào):678720
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/678720.html
最近更新
教材專著