天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度強(qiáng)化學(xué)習(xí)的旋翼無(wú)人機(jī)端到端伺服控制研究

發(fā)布時(shí)間:2021-08-01 16:28
  無(wú)人機(jī)集群在軍民領(lǐng)域中具有巨大的應(yīng)用前景,吸引了越來(lái)越多的研究人員對(duì)其關(guān)鍵技術(shù)進(jìn)行攻關(guān)。集群中無(wú)人機(jī)數(shù)量眾多,在諸如無(wú)人機(jī)群自主續(xù)航、自主回收等場(chǎng)合,無(wú)人機(jī)自主降落是集群高效管理的核心技術(shù)之一。本課題針對(duì)無(wú)人機(jī)自主降落問(wèn)題,采用深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)魯棒的無(wú)人機(jī)自主降落,即在深度強(qiáng)化學(xué)習(xí)的框架下,以圖像作為模型的輸入,設(shè)計(jì)端到端的無(wú)人機(jī)自主降落伺服控制方法,以提高無(wú)人機(jī)自主降落的智能化水平。課題的主要研究?jī)?nèi)容如下:(1)在深度強(qiáng)化學(xué)習(xí)框架下,設(shè)計(jì)并實(shí)現(xiàn)用于解決無(wú)人機(jī)自主降落問(wèn)題的值函數(shù)Q-learning學(xué)習(xí)算法。首先將無(wú)人機(jī)的降落問(wèn)題描述為馬爾科夫決策過(guò)程,將無(wú)人機(jī)下視圖像直接作為無(wú)人機(jī)狀態(tài),離散化動(dòng)作作為無(wú)人機(jī)行為,并利用無(wú)人機(jī)位置信息構(gòu)建獎(jiǎng)勵(lì)回報(bào)函數(shù)。借助無(wú)人機(jī)與環(huán)境的交互迭代,完成深度強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,實(shí)現(xiàn)無(wú)人機(jī)自主降落的端到端控制。訓(xùn)練過(guò)程包括原始Q-learning算法,3DQN(Dueling-Double-Deep Q-learning Network)算法等。為提高訓(xùn)練速度,加速模型收斂,算法進(jìn)一步引入外部控制器、使用數(shù)據(jù)庫(kù)預(yù)訓(xùn)練等方式。仿真驗(yàn)證表明,提出的端對(duì)端控制... 

【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:117 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度強(qiáng)化學(xué)習(xí)的旋翼無(wú)人機(jī)端到端伺服控制研究


無(wú)人機(jī)

示意圖,無(wú)人機(jī),平臺(tái)


國(guó)防科技大學(xué)研究生院碩士學(xué)位論文第4頁(yè)圖1.2系留無(wú)人機(jī)平臺(tái)(a)AtlasNEST智能無(wú)人機(jī)場(chǎng)及AtlasPro機(jī)場(chǎng)專(zhuān)用無(wú)人機(jī)(b)Airobotics公司用于續(xù)航的機(jī)場(chǎng)平臺(tái)圖1.3兩種無(wú)人機(jī)續(xù)航管理平臺(tái)產(chǎn)品示意圖無(wú)人機(jī)集群的回收,是無(wú)人機(jī)系統(tǒng)在實(shí)際應(yīng)用過(guò)程中需要考慮的重點(diǎn)問(wèn)題,因?yàn)闊o(wú)人機(jī)的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段,還需要飛手接管、遙控操作,對(duì)于飛機(jī)數(shù)量眾多的無(wú)人機(jī)集群來(lái)說(shuō),勢(shì)必會(huì)占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過(guò)程復(fù)雜,操作控制難度大,容易造成無(wú)人機(jī)損壞。其中垂直降落回收只需要小面積回收?qǐng)龅,不受回收區(qū)地形條件的限制。

示意圖,無(wú)人機(jī)


國(guó)防科技大學(xué)研究生院碩士學(xué)位論文第4頁(yè)圖1.2系留無(wú)人機(jī)平臺(tái)(a)AtlasNEST智能無(wú)人機(jī)場(chǎng)及AtlasPro機(jī)場(chǎng)專(zhuān)用無(wú)人機(jī)(b)Airobotics公司用于續(xù)航的機(jī)場(chǎng)平臺(tái)圖1.3兩種無(wú)人機(jī)續(xù)航管理平臺(tái)產(chǎn)品示意圖無(wú)人機(jī)集群的回收,是無(wú)人機(jī)系統(tǒng)在實(shí)際應(yīng)用過(guò)程中需要考慮的重點(diǎn)問(wèn)題,因?yàn)闊o(wú)人機(jī)的損毀事故80%發(fā)生在起降階段[4]。一般有有遙控降落回收、傘降、空中捕獲、跑道滑跑著陸、攔阻網(wǎng)或“天鉤”回收、垂直著陸等方法。圖1.4是四種經(jīng)典的回收方式。其中遙控降落回收、跑道滑跑著陸的最后階段,還需要飛手接管、遙控操作,對(duì)于飛機(jī)數(shù)量眾多的無(wú)人機(jī)集群來(lái)說(shuō),勢(shì)必會(huì)占用大量人力、物力。傘降、撞網(wǎng)、或者掛索回收過(guò)程復(fù)雜,操作控制難度大,容易造成無(wú)人機(jī)損壞。其中垂直降落回收只需要小面積回收?qǐng)龅,不受回收區(qū)地形條件的限制。

【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)優(yōu)缺點(diǎn)的剖析[J]. 孫暉.  電子制作. 2018(18)
[2]深度強(qiáng)化學(xué)習(xí)研究綜述[J]. 趙星宇,丁世飛.  計(jì)算機(jī)科學(xué). 2018(07)
[3]未來(lái)觸手可及——AlphaZero學(xué)棋記[J]. 陳軼翔.  世界科學(xué). 2018(02)
[4]深度強(qiáng)化學(xué)習(xí)進(jìn)展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒.  控制理論與應(yīng)用. 2017(12)
[5]從監(jiān)督學(xué)習(xí)到強(qiáng)化學(xué)習(xí),四種深度學(xué)習(xí)方式原理知多少[J]. 房曉楠.  機(jī)器人產(chǎn)業(yè). 2017(04)
[6]深度學(xué)習(xí)研究與進(jìn)展[J]. 孫志遠(yuǎn),魯成祥,史忠植,馬剛.  計(jì)算機(jī)科學(xué). 2016(02)
[7]基于Q學(xué)習(xí)的無(wú)人機(jī)三維航跡規(guī)劃算法[J]. 郝釧釧,方舟,李平.  上海交通大學(xué)學(xué)報(bào). 2012(12)
[8]基于Q學(xué)習(xí)的變體無(wú)人機(jī)控制系統(tǒng)設(shè)計(jì)[J]. 徐小野,李?lèi)?ài)軍,張叢叢,姚宗信.  西北工業(yè)大學(xué)學(xué)報(bào). 2012(03)
[9]一種基于強(qiáng)化學(xué)習(xí)的UAV目標(biāo)搜索算法[J]. 張晶晶,周德云,張堃.  計(jì)算機(jī)應(yīng)用研究. 2011(10)
[10]機(jī)器學(xué)習(xí)的主要策略綜述[J]. 閆友彪,陳元琰.  計(jì)算機(jī)應(yīng)用研究. 2004(07)

碩士論文
[1]多旋翼無(wú)人機(jī)視覺(jué)引導(dǎo)降落研究[D]. 樊瓏.哈爾濱工業(yè)大學(xué) 2016
[2]基于視覺(jué)引導(dǎo)的無(wú)人直升機(jī)自主著艦技術(shù)研究[D]. 陳銀軍.南昌航空大學(xué) 2015
[3]基于紅外探測(cè)器的無(wú)人機(jī)地基視覺(jué)引導(dǎo)著陸關(guān)鍵技術(shù)研究[D]. 張宇.國(guó)防科學(xué)技術(shù)大學(xué) 2013



本文編號(hào):3315857

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3315857.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)34b64***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com