服務(wù)Agent學(xué)習(xí)算法
發(fā)布時間:2022-12-18 10:55
面向服務(wù)的架構(gòu)如Web服務(wù)技術(shù),以及Agent技術(shù)已經(jīng)被廣泛地應(yīng)用于各個IT領(lǐng)域。基于Web服務(wù)和Agent而提出的服務(wù)Agent技術(shù),是對二者的有效結(jié)合。它既滿足了Web服務(wù)的可重復(fù)性,低耦合性,又包含了Agent的持續(xù)性、自治性、交互性等特性。作為智能Agent的一個重要特性,它必須也能具有學(xué)習(xí)的能力,即通過過去的經(jīng)驗,面對新的任務(wù)能夠自主而快速地找到一個較為優(yōu)化的解。 本文首先提出了一個服務(wù)Agent的模型結(jié)構(gòu)、語義架構(gòu)以及服務(wù)Agent應(yīng)用于Web服務(wù)組合的工作機制,然后給出了一種新的高效的服務(wù)Agent學(xué)習(xí)算法。該算法基于強化學(xué)習(xí)和團(tuán)隊馬爾科夫博弈過程,并做出了相應(yīng)的優(yōu)化,使得在復(fù)雜環(huán)境下,尤其是多Agent環(huán)境下,該學(xué)習(xí)算法能夠利用過去所學(xué)習(xí)到的知識,快速地達(dá)到收斂。該算法利用Q學(xué)習(xí)的理論基礎(chǔ),兼顧了多Agent之間博弈和協(xié)商,同時還能支持對知識模型的動態(tài)存儲和更新,從而實現(xiàn)在多Agent條件下也能快速收斂。
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 研究現(xiàn)狀
1.2.1 Agent 技術(shù)和 Web 服務(wù)
1.2.2 多 Agent 學(xué)習(xí)
1.3 目前存在的問題
1.4 本文研究內(nèi)容
1.5 本文組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)
2.1 智能 AGENT 技術(shù)
2.1.1 Agent 的定義
2.1.2 多 Agent 學(xué)習(xí)
2.2 WEB 服務(wù)組合
2.2.1 Web 服務(wù)
2.2.2 Web 服務(wù)組合
2.3 本體
2.3.1 計算機學(xué)界關(guān)于本體的定義
2.3.2 本體的組成部分
2.3.3 本體語言
2.3.4 本體在本文中的結(jié)構(gòu)形式
2.4 本章小結(jié)
第三章 服務(wù) AGENT 的框架和模型
3.1 引言
3.2 服務(wù) AGENT 框架
3.2.1 服務(wù) Agent 模型結(jié)構(gòu)
3.2.2 服務(wù) Agent 系統(tǒng)的事件語義模型
3.2.3 服務(wù) Agent 系統(tǒng)的目標(biāo)語義模型
3.2.4 服務(wù) Agent 系統(tǒng)的規(guī)劃語義模型
3.2.5 服務(wù) Agent 系統(tǒng)的規(guī)劃語法模型
3.2.6 服務(wù) Agent 的目標(biāo)拆分
3.2.7 服務(wù) Agent 系統(tǒng)的工作機制
3.3 本章小結(jié)
第四章 服務(wù) AGENT 學(xué)習(xí)
4.1 引言
4.2 強化學(xué)習(xí)
4.2.1 馬爾科夫決策過程
4.2.2 Q 學(xué)習(xí)
4.2.3 博弈論和納什平衡
4.2.4 團(tuán)隊馬爾科夫博弈
4.3 服務(wù) AGENT 的學(xué)習(xí)機制
4.4 服務(wù) AGENT 學(xué)習(xí)算法
4.5 實驗結(jié)果及分析
4.5.1 實驗環(huán)境
4.5.2 實驗一:可行性實驗以及與前向搜索算法的比較
4.5.3 具體案例
4.5.4 實驗二:重復(fù)進(jìn)行相同請求
4.5.5 實驗三:重復(fù)進(jìn)行相似的請求
4.5.6 實驗四:處理不太相近的請求
4.5.7 實驗五:在學(xué)習(xí)過程采取通信
4.6 本章小結(jié)
第五章 學(xué)習(xí)模型的存儲
5.1 基本思路
5.2 實驗結(jié)果及分析
5.2.1 實驗一:處理不太相近的請求
5.2.2 實驗二:存儲模型數(shù)量與收斂時間的關(guān)系
第六章 總結(jié)及展望
6.1 論文主要工作
6.2 未來研究展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文及參與的項目
【參考文獻(xiàn)】:
碩士論文
[1]服務(wù)Agent中的學(xué)習(xí)模型[D]. 王磊.上海交通大學(xué) 2009
本文編號:3721925
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 研究現(xiàn)狀
1.2.1 Agent 技術(shù)和 Web 服務(wù)
1.2.2 多 Agent 學(xué)習(xí)
1.3 目前存在的問題
1.4 本文研究內(nèi)容
1.5 本文組織結(jié)構(gòu)
第二章 相關(guān)技術(shù)
2.1 智能 AGENT 技術(shù)
2.1.1 Agent 的定義
2.1.2 多 Agent 學(xué)習(xí)
2.2 WEB 服務(wù)組合
2.2.1 Web 服務(wù)
2.2.2 Web 服務(wù)組合
2.3 本體
2.3.1 計算機學(xué)界關(guān)于本體的定義
2.3.2 本體的組成部分
2.3.3 本體語言
2.3.4 本體在本文中的結(jié)構(gòu)形式
2.4 本章小結(jié)
第三章 服務(wù) AGENT 的框架和模型
3.1 引言
3.2 服務(wù) AGENT 框架
3.2.1 服務(wù) Agent 模型結(jié)構(gòu)
3.2.2 服務(wù) Agent 系統(tǒng)的事件語義模型
3.2.3 服務(wù) Agent 系統(tǒng)的目標(biāo)語義模型
3.2.4 服務(wù) Agent 系統(tǒng)的規(guī)劃語義模型
3.2.5 服務(wù) Agent 系統(tǒng)的規(guī)劃語法模型
3.2.6 服務(wù) Agent 的目標(biāo)拆分
3.2.7 服務(wù) Agent 系統(tǒng)的工作機制
3.3 本章小結(jié)
第四章 服務(wù) AGENT 學(xué)習(xí)
4.1 引言
4.2 強化學(xué)習(xí)
4.2.1 馬爾科夫決策過程
4.2.2 Q 學(xué)習(xí)
4.2.3 博弈論和納什平衡
4.2.4 團(tuán)隊馬爾科夫博弈
4.3 服務(wù) AGENT 的學(xué)習(xí)機制
4.4 服務(wù) AGENT 學(xué)習(xí)算法
4.5 實驗結(jié)果及分析
4.5.1 實驗環(huán)境
4.5.2 實驗一:可行性實驗以及與前向搜索算法的比較
4.5.3 具體案例
4.5.4 實驗二:重復(fù)進(jìn)行相同請求
4.5.5 實驗三:重復(fù)進(jìn)行相似的請求
4.5.6 實驗四:處理不太相近的請求
4.5.7 實驗五:在學(xué)習(xí)過程采取通信
4.6 本章小結(jié)
第五章 學(xué)習(xí)模型的存儲
5.1 基本思路
5.2 實驗結(jié)果及分析
5.2.1 實驗一:處理不太相近的請求
5.2.2 實驗二:存儲模型數(shù)量與收斂時間的關(guān)系
第六章 總結(jié)及展望
6.1 論文主要工作
6.2 未來研究展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文及參與的項目
【參考文獻(xiàn)】:
碩士論文
[1]服務(wù)Agent中的學(xué)習(xí)模型[D]. 王磊.上海交通大學(xué) 2009
本文編號:3721925
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3721925.html
最近更新
教材專著