天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于多機(jī)器人系統(tǒng)的多目標(biāo)圍捕協(xié)同控制問(wèn)題研究

發(fā)布時(shí)間:2022-10-15 18:34
  多機(jī)器人系統(tǒng)具有可靠性強(qiáng)、結(jié)構(gòu)可擴(kuò)展、執(zhí)行任務(wù)多樣等特點(diǎn),目前正日益廣泛地被應(yīng)用于軍事、工業(yè)生產(chǎn)、倉(cāng)庫(kù)物流、科教娛樂(lè)等方面;诙鄼C(jī)器人系統(tǒng)的多目標(biāo)圍捕控制是一個(gè)綜合性較強(qiáng)的多機(jī)器人協(xié)同控制問(wèn)題,既要求所有機(jī)器人建立起包括頂層決策、任務(wù)分配及編隊(duì)控制等協(xié)同策略,同時(shí)又要保證圍捕過(guò)程中各機(jī)器人之間互相無(wú)沖突。本文針對(duì)多機(jī)器人多目標(biāo)圍捕的任務(wù)分配和編隊(duì)控制兩方面開(kāi)展研究:首先基于混合式體系結(jié)構(gòu)設(shè)計(jì)了多機(jī)器人多目標(biāo)圍捕的任務(wù)分配算法,然后分別用經(jīng)典控制方法和深度強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn)了多機(jī)器人環(huán)航圍捕編隊(duì)控制。各部分的研究?jī)?nèi)容和創(chuàng)新點(diǎn)如下:首先,對(duì)多機(jī)器人多目標(biāo)任務(wù)分配問(wèn)題設(shè)計(jì)了基于混合式體系結(jié)構(gòu)的任務(wù)分配算法(Hybrid Dynamic Task Allocation,HDTA)。實(shí)際情況中,不同機(jī)器人的運(yùn)動(dòng)能力和圍捕能力存在一定差異,而實(shí)際的圍捕目標(biāo)的逃脫能力也不完全相同。因此,本文設(shè)計(jì)了基于混合式體系結(jié)構(gòu)的動(dòng)態(tài)任務(wù)分配(HDTA)算法,能夠?qū)⒊霈F(xiàn)的多個(gè)目標(biāo)高效且無(wú)沖突地分配到各機(jī)器人團(tuán)組,為后續(xù)的多個(gè)機(jī)器人圍捕目標(biāo)提供可能。而后,本文針對(duì)多機(jī)器人圍捕編隊(duì)控制問(wèn)題設(shè)計(jì)了改進(jìn)的環(huán)航編隊(duì)多機(jī)器人... 

【文章頁(yè)數(shù)】:91 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
符號(hào)使用說(shuō)明
第一章 緒論
    1.1 研究背景和意義
    1.2 研究現(xiàn)狀與發(fā)展動(dòng)態(tài)
        1.2.1 多機(jī)器人任務(wù)分配
        1.2.2 多機(jī)器人目標(biāo)圍捕編隊(duì)控制
        1.2.3 基于強(qiáng)化學(xué)習(xí)的多智能體協(xié)同控制
    1.3 論文研究的組織結(jié)構(gòu)和創(chuàng)新點(diǎn)
        1.3.1 論文的組織結(jié)構(gòu)
        1.3.2 主要貢獻(xiàn)和創(chuàng)新點(diǎn)
第二章 基于混合式體系的多機(jī)器人圍捕多目標(biāo)任務(wù)分配
    2.1 多機(jī)器人多目標(biāo)圍捕任務(wù)分配建模
    2.2 基于混合式體系結(jié)構(gòu)的動(dòng)態(tài)任務(wù)分配HDTA算法
    2.3 多機(jī)器人圍捕多目標(biāo)HDTA任務(wù)配實(shí)驗(yàn)驗(yàn)證
    2.4 本章小結(jié)
第三章 具有避障的多機(jī)器人目標(biāo)圍捕環(huán)航編隊(duì)控制
    3.1 問(wèn)題背景
        3.1.1 目標(biāo)圍捕編隊(duì)控制問(wèn)題
        3.1.2 機(jī)器人實(shí)時(shí)避障問(wèn)題
    3.2 結(jié)合實(shí)時(shí)避障的目標(biāo)圍捕控制算法設(shè)計(jì)
    3.3 多機(jī)器人多目標(biāo)圍捕仿真實(shí)驗(yàn)驗(yàn)證
    3.4 本章小結(jié)
第四章 基于MADDPG強(qiáng)化學(xué)習(xí)的多機(jī)器人目標(biāo)圍捕編隊(duì)控制
    4.1 強(qiáng)化學(xué)習(xí)理論背景
        4.1.1 馬爾可夫決策過(guò)程(MDP)
        4.1.2 確定性策略梯度(DPG)算法
        4.1.3 深度Q網(wǎng)絡(luò)(DQN)算法
    4.2 基于MADDPG強(qiáng)化學(xué)習(xí)的多機(jī)器人目標(biāo)圍捕算法
        4.2.1 馬爾可夫博弈
        4.2.2 多智能體深度確定性策略梯度(MADDPG)算法
        4.2.3 多機(jī)器人目標(biāo)圍捕問(wèn)題馬爾可夫博弈建模
    4.3 MADDPG強(qiáng)化學(xué)習(xí)的多機(jī)器人目標(biāo)圍捕實(shí)驗(yàn)驗(yàn)證
        4.3.1 MADDPG多機(jī)器人目標(biāo)圍捕仿真實(shí)現(xiàn)
        4.3.2 實(shí)驗(yàn)一:多機(jī)器人圍捕靜止目標(biāo)
        4.3.3 實(shí)驗(yàn)二:多機(jī)器人圍捕運(yùn)動(dòng)目標(biāo)
        4.3.4 實(shí)驗(yàn)三:多機(jī)器人圍捕逃逸目標(biāo)
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 論文的工作總結(jié)
    5.2 進(jìn)一步研究的展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
附錄A MADDPG訓(xùn)練過(guò)程數(shù)據(jù)
    A.1實(shí)驗(yàn)訓(xùn)練中各機(jī)器人圍捕編隊(duì)的指標(biāo)誤差與累積回報(bào)


【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器人也玩DOTA——RoboMaster機(jī)甲大師賽介紹[J]. 李國(guó)傲.  少年電腦世界. 2017(12)

博士論文
[1]多機(jī)器人系統(tǒng)任務(wù)分配及編隊(duì)控制研究[D]. 柳林.國(guó)防科學(xué)技術(shù)大學(xué) 2006

碩士論文
[1]分布式多機(jī)器人協(xié)同環(huán)航編隊(duì)控制[D]. 姚偉嘉.國(guó)防科技大學(xué) 2017



本文編號(hào):3691821

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3691821.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)00c9b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com