當(dāng)前位置：主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于多機(jī)器人系統(tǒng)的多目標(biāo)圍捕協(xié)同控制問(wèn)題研究

發(fā)布時(shí)間：2022-10-15 18:34

　　多機(jī)器人系統(tǒng)具有可靠性強(qiáng)、結(jié)構(gòu)可擴(kuò)展、執(zhí)行任務(wù)多樣等特點(diǎn),目前正日益廣泛地被應(yīng)用于軍事、工業(yè)生產(chǎn)、倉(cāng)庫(kù)物流、科教娛樂(lè)等方面�；诙鄼C(jī)器人系統(tǒng)的多目標(biāo)圍捕控制是一個(gè)綜合性較強(qiáng)的多機(jī)器人協(xié)同控制問(wèn)題,既要求所有機(jī)器人建立起包括頂層決策、任務(wù)分配及編隊(duì)控制等協(xié)同策略,同時(shí)又要保證圍捕過(guò)程中各機(jī)器人之間互相無(wú)沖突。本文針對(duì)多機(jī)器人多目標(biāo)圍捕的任務(wù)分配和編隊(duì)控制兩方面開(kāi)展研究:首先基于混合式體系結(jié)構(gòu)設(shè)計(jì)了多機(jī)器人多目標(biāo)圍捕的任務(wù)分配算法,然后分別用經(jīng)典控制方法和深度強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn)了多機(jī)器人環(huán)航圍捕編隊(duì)控制。各部分的研究?jī)?nèi)容和創(chuàng)新點(diǎn)如下:首先,對(duì)多機(jī)器人多目標(biāo)任務(wù)分配問(wèn)題設(shè)計(jì)了基于混合式體系結(jié)構(gòu)的任務(wù)分配算法（Hybrid Dynamic Task Allocation,HDTA）。實(shí)際情況中,不同機(jī)器人的運(yùn)動(dòng)能力和圍捕能力存在一定差異,而實(shí)際的圍捕目標(biāo)的逃脫能力也不完全相同。因此,本文設(shè)計(jì)了基于混合式體系結(jié)構(gòu)的動(dòng)態(tài)任務(wù)分配（HDTA）算法,能夠?qū)⒊霈F(xiàn)的多個(gè)目標(biāo)高效且無(wú)沖突地分配到各機(jī)器人團(tuán)組,為后續(xù)的多個(gè)機(jī)器人圍捕目標(biāo)提供可能。而后,本文針對(duì)多機(jī)器人圍捕編隊(duì)控制問(wèn)題設(shè)計(jì)了改進(jìn)的環(huán)航編隊(duì)多機(jī)器人...

【文章頁(yè)數(shù)】：91 頁(yè)

【學(xué)位級(jí)別】：碩士

【文章目錄】：
摘要
ABSTRACT
符號(hào)使用說(shuō)明
第一章緒論
    1.1 研究背景和意義
    1.2 研究現(xiàn)狀與發(fā)展動(dòng)態(tài)
        1.2.1 多機(jī)器人任務(wù)分配
        1.2.2 多機(jī)器人目標(biāo)圍捕編隊(duì)控制
        1.2.3 基于強(qiáng)化學(xué)習(xí)的多智能體協(xié)同控制
    1.3 論文研究的組織結(jié)構(gòu)和創(chuàng)新點(diǎn)
        1.3.1 論文的組織結(jié)構(gòu)
        1.3.2 主要貢獻(xiàn)和創(chuàng)新點(diǎn)
第二章基于混合式體系的多機(jī)器人圍捕多目標(biāo)任務(wù)分配
    2.1 多機(jī)器人多目標(biāo)圍捕任務(wù)分配建模
    2.2 基于混合式體系結(jié)構(gòu)的動(dòng)態(tài)任務(wù)分配HDTA算法
    2.3 多機(jī)器人圍捕多目標(biāo)HDTA任務(wù)配實(shí)驗(yàn)驗(yàn)證
    2.4 本章小結(jié)
第三章具有避障的多機(jī)器人目標(biāo)圍捕環(huán)航編隊(duì)控制
    3.1 問(wèn)題背景
        3.1.1 目標(biāo)圍捕編隊(duì)控制問(wèn)題
        3.1.2 機(jī)器人實(shí)時(shí)避障問(wèn)題
    3.2 結(jié)合實(shí)時(shí)避障的目標(biāo)圍捕控制算法設(shè)計(jì)
    3.3 多機(jī)器人多目標(biāo)圍捕仿真實(shí)驗(yàn)驗(yàn)證
    3.4 本章小結(jié)
第四章基于MADDPG強(qiáng)化學(xué)習(xí)的多機(jī)器人目標(biāo)圍捕編隊(duì)控制
    4.1 強(qiáng)化學(xué)習(xí)理論背景
        4.1.1 馬爾可夫決策過(guò)程(MDP)
        4.1.2 確定性策略梯度(DPG)算法
        4.1.3 深度Q網(wǎng)絡(luò)(DQN)算法
    4.2 基于MADDPG強(qiáng)化學(xué)習(xí)的多機(jī)器人目標(biāo)圍捕算法
        4.2.1 馬爾可夫博弈
        4.2.2 多智能體深度確定性策略梯度(MADDPG)算法
        4.2.3 多機(jī)器人目標(biāo)圍捕問(wèn)題馬爾可夫博弈建模
    4.3 MADDPG強(qiáng)化學(xué)習(xí)的多機(jī)器人目標(biāo)圍捕實(shí)驗(yàn)驗(yàn)證
        4.3.1 MADDPG多機(jī)器人目標(biāo)圍捕仿真實(shí)現(xiàn)
        4.3.2 實(shí)驗(yàn)一:多機(jī)器人圍捕靜止目標(biāo)
        4.3.3 實(shí)驗(yàn)二:多機(jī)器人圍捕運(yùn)動(dòng)目標(biāo)
        4.3.4 實(shí)驗(yàn)三:多機(jī)器人圍捕逃逸目標(biāo)
    4.4 本章小結(jié)
第五章總結(jié)與展望
    5.1 論文的工作總結(jié)
    5.2 進(jìn)一步研究的展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
附錄A MADDPG訓(xùn)練過(guò)程數(shù)據(jù)
    A.1實(shí)驗(yàn)訓(xùn)練中各機(jī)器人圍捕編隊(duì)的指標(biāo)誤差與累積回報(bào)

【參考文獻(xiàn)】：
期刊論文
[1]機(jī)器人也玩DOTA——RoboMaster機(jī)甲大師賽介紹[J]. 李國(guó)傲.  少年電腦世界. 2017(12)

博士論文
[1]多機(jī)器人系統(tǒng)任務(wù)分配及編隊(duì)控制研究[D]. 柳林.國(guó)防科學(xué)技術(shù)大學(xué) 2006

碩士論文
[1]分布式多機(jī)器人協(xié)同環(huán)航編隊(duì)控制[D]. 姚偉嘉.國(guó)防科技大學(xué) 2017

本文編號(hào)：3691821

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3691821.html

上一篇：基于山區(qū)遙感圖像的檢索識(shí)別系統(tǒng)研究
下一篇：基于深度神經(jīng)網(wǎng)絡(luò)的人臉引導(dǎo)填充研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多機(jī)器人系統(tǒng)的多目標(biāo)圍捕協(xié)同控制問(wèn)題研究