智能協(xié)同算法研究及應(yīng)用
發(fā)布時(shí)間:2023-05-21 18:51
近年來,隨著智能化時(shí)代的來臨,人工智能算法的應(yīng)用逐漸成為各個(gè)領(lǐng)域中研究的熱點(diǎn)技術(shù)。作為人工智能領(lǐng)域的重要內(nèi)容之一,智能協(xié)同試圖通過研究先進(jìn)的智能算法,使得多智能體具有高效的協(xié)作能力。對(duì)智能協(xié)同算法的研究給人工智能、現(xiàn)代優(yōu)化及機(jī)器學(xué)習(xí)等理論的發(fā)展帶來了新的挑戰(zhàn),與此同時(shí),這些理論和技術(shù)上新的發(fā)展又可以應(yīng)用到智能協(xié)同系統(tǒng)中,這也是對(duì)其應(yīng)用領(lǐng)域的進(jìn)一步擴(kuò)展和完善。智能協(xié)同的核心是多智能體通過有效的協(xié)同控制以達(dá)到整體效能最優(yōu)。本文綜合利用計(jì)算智能相關(guān)理論,對(duì)智能協(xié)同系統(tǒng)中的若干關(guān)鍵技術(shù)問題展開研究,研究智能協(xié)同中的碰撞避免、協(xié)同任務(wù)分配和協(xié)同路徑規(guī)劃等問題,為未來智能協(xié)同控制提供技術(shù)支持。無論從科學(xué)角度還是理論價(jià)值上來說,都具有極強(qiáng)的研究意義和實(shí)用價(jià)值。本文的主要研究?jī)?nèi)容包括以下四部分:(1)動(dòng)態(tài)環(huán)境下碰撞避免。在傳統(tǒng)強(qiáng)化學(xué)習(xí)的基礎(chǔ)上,提出了一種改進(jìn)強(qiáng)化學(xué)習(xí)算法并將其應(yīng)用于動(dòng)態(tài)環(huán)境下機(jī)器人實(shí)時(shí)碰撞避免問題中。并對(duì)其算法原理進(jìn)行了分析。算法中將動(dòng)態(tài)障礙物的運(yùn)動(dòng)方向加入到狀態(tài)空間的定義中來消除Q值更新產(chǎn)生的歧義。為了增加最優(yōu)解的多樣性,在策略選擇中,將?-貪心策略和“近目標(biāo)”策略兩種策略結(jié)合來為機(jī)...
【文章頁數(shù)】:129 頁
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作背景與意義
1.2 國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.3 本文主要貢獻(xiàn)與創(chuàng)新
1.4 論文結(jié)構(gòu)安排
第二章 基于強(qiáng)化學(xué)習(xí)的智能體動(dòng)態(tài)避障
2.1 強(qiáng)化學(xué)習(xí)
2.2 動(dòng)態(tài)避障環(huán)境建模
2.2.1 狀態(tài)空間
2.2.2 動(dòng)作空間
2.3 基于改進(jìn)Q學(xué)習(xí)的機(jī)器人避障
2.3.1 回報(bào)函數(shù)
2.3.1.1 回報(bào)函數(shù)多目標(biāo)問題建模
2.3.1.2 基于NSGA-II算法的回報(bào)函數(shù)優(yōu)化求解
2.3.2 Q值
2.3.3 選擇策略
2.4 仿真實(shí)驗(yàn)與結(jié)果分析
2.4.1 不同場(chǎng)景避障仿真
2.4.2 改進(jìn)強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)對(duì)比
2.4.3 回報(bào)函數(shù)優(yōu)化前后對(duì)比
2.5 本章小結(jié)
第三章 基于深度強(qiáng)化學(xué)習(xí)的多智能體防守對(duì)抗
3.1 深度強(qiáng)化學(xué)習(xí)和多智能體防守對(duì)抗
3.1.1 多智能體防守對(duì)抗問題
3.1.2 深度強(qiáng)化學(xué)習(xí)相關(guān)算法
3.2 多智能體防守對(duì)抗環(huán)境建模
3.2.1 狀態(tài)空間
3.2.2 動(dòng)作空間
3.2.3 回報(bào)函數(shù)
3.2.3.1 攻擊智能體回報(bào)函數(shù)
3.2.3.2 防守智能體回報(bào)函數(shù)
3.3 智能體模型和學(xué)習(xí)方法
3.3.1 基于單智能體的模型和學(xué)習(xí)方法
3.3.1.1 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.1.2 學(xué)習(xí)方法
3.3.2 基于多智能體的模型和學(xué)習(xí)方法
3.3.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.2.2 學(xué)習(xí)方法
3.4 仿真實(shí)驗(yàn)與結(jié)果分析
3.4.1 環(huán)境建模
3.4.2 評(píng)測(cè)標(biāo)準(zhǔn)及模型參數(shù)設(shè)置
3.4.3 基于規(guī)則運(yùn)動(dòng)的攻擊智能體防守對(duì)抗結(jié)果
3.4.4 基于學(xué)習(xí)模型的攻擊智能體防守對(duì)抗結(jié)果
3.5 本章小結(jié)
第四章 基于交叉熵方法的協(xié)同任務(wù)分配
4.1 交叉熵方法
4.2 基于交叉熵方法的多類型無人機(jī)任務(wù)分配
4.2.1 問題描述
4.2.2 任務(wù)分配方法
4.3 仿真實(shí)驗(yàn)與結(jié)果分析
4.3.1 基于CE方法的任務(wù)分配
4.3.2 兩種任務(wù)分配方法對(duì)比
4.4 本章小結(jié)
第五章 基于k-degree平滑的協(xié)同路徑規(guī)劃算法
5.1 基于Voronoi圖的環(huán)境建模方法
5.2 初始路徑規(guī)劃算法
5.2.1 基于改進(jìn)蟻群優(yōu)化算法的初始路徑規(guī)劃
5.2.2 改進(jìn)蟻群優(yōu)化算法流程
5.3 基于k-degree的平滑算法
5.3.1 k-degree的定義
5.3.2 理論分析
5.4 多無人機(jī)協(xié)同策略
5.5 仿真實(shí)驗(yàn)與結(jié)果分析
5.5.1 初始路徑規(guī)劃算法對(duì)比
5.5.2 路徑平滑仿真
5.5.3 多無人機(jī)協(xié)同
5.5.3.1 強(qiáng)協(xié)同
5.5.3.2 弱協(xié)同
5.6 本章小結(jié)
第六章 全文總結(jié)與展望
6.1 全文總結(jié)
6.2 未來工作展望
致謝
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的成果
本文編號(hào):3821257
【文章頁數(shù)】:129 頁
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作背景與意義
1.2 國(guó)內(nèi)外研究歷史與現(xiàn)狀
1.3 本文主要貢獻(xiàn)與創(chuàng)新
1.4 論文結(jié)構(gòu)安排
第二章 基于強(qiáng)化學(xué)習(xí)的智能體動(dòng)態(tài)避障
2.1 強(qiáng)化學(xué)習(xí)
2.2 動(dòng)態(tài)避障環(huán)境建模
2.2.1 狀態(tài)空間
2.2.2 動(dòng)作空間
2.3 基于改進(jìn)Q學(xué)習(xí)的機(jī)器人避障
2.3.1 回報(bào)函數(shù)
2.3.1.1 回報(bào)函數(shù)多目標(biāo)問題建模
2.3.1.2 基于NSGA-II算法的回報(bào)函數(shù)優(yōu)化求解
2.3.2 Q值
2.3.3 選擇策略
2.4 仿真實(shí)驗(yàn)與結(jié)果分析
2.4.1 不同場(chǎng)景避障仿真
2.4.2 改進(jìn)強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)對(duì)比
2.4.3 回報(bào)函數(shù)優(yōu)化前后對(duì)比
2.5 本章小結(jié)
第三章 基于深度強(qiáng)化學(xué)習(xí)的多智能體防守對(duì)抗
3.1 深度強(qiáng)化學(xué)習(xí)和多智能體防守對(duì)抗
3.1.1 多智能體防守對(duì)抗問題
3.1.2 深度強(qiáng)化學(xué)習(xí)相關(guān)算法
3.2 多智能體防守對(duì)抗環(huán)境建模
3.2.1 狀態(tài)空間
3.2.2 動(dòng)作空間
3.2.3 回報(bào)函數(shù)
3.2.3.1 攻擊智能體回報(bào)函數(shù)
3.2.3.2 防守智能體回報(bào)函數(shù)
3.3 智能體模型和學(xué)習(xí)方法
3.3.1 基于單智能體的模型和學(xué)習(xí)方法
3.3.1.1 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.1.2 學(xué)習(xí)方法
3.3.2 基于多智能體的模型和學(xué)習(xí)方法
3.3.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
3.3.2.2 學(xué)習(xí)方法
3.4 仿真實(shí)驗(yàn)與結(jié)果分析
3.4.1 環(huán)境建模
3.4.2 評(píng)測(cè)標(biāo)準(zhǔn)及模型參數(shù)設(shè)置
3.4.3 基于規(guī)則運(yùn)動(dòng)的攻擊智能體防守對(duì)抗結(jié)果
3.4.4 基于學(xué)習(xí)模型的攻擊智能體防守對(duì)抗結(jié)果
3.5 本章小結(jié)
第四章 基于交叉熵方法的協(xié)同任務(wù)分配
4.1 交叉熵方法
4.2 基于交叉熵方法的多類型無人機(jī)任務(wù)分配
4.2.1 問題描述
4.2.2 任務(wù)分配方法
4.3 仿真實(shí)驗(yàn)與結(jié)果分析
4.3.1 基于CE方法的任務(wù)分配
4.3.2 兩種任務(wù)分配方法對(duì)比
4.4 本章小結(jié)
第五章 基于k-degree平滑的協(xié)同路徑規(guī)劃算法
5.1 基于Voronoi圖的環(huán)境建模方法
5.2 初始路徑規(guī)劃算法
5.2.1 基于改進(jìn)蟻群優(yōu)化算法的初始路徑規(guī)劃
5.2.2 改進(jìn)蟻群優(yōu)化算法流程
5.3 基于k-degree的平滑算法
5.3.1 k-degree的定義
5.3.2 理論分析
5.4 多無人機(jī)協(xié)同策略
5.5 仿真實(shí)驗(yàn)與結(jié)果分析
5.5.1 初始路徑規(guī)劃算法對(duì)比
5.5.2 路徑平滑仿真
5.5.3 多無人機(jī)協(xié)同
5.5.3.1 強(qiáng)協(xié)同
5.5.3.2 弱協(xié)同
5.6 本章小結(jié)
第六章 全文總結(jié)與展望
6.1 全文總結(jié)
6.2 未來工作展望
致謝
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的成果
本文編號(hào):3821257
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3821257.html
最近更新
教材專著