當(dāng)前位置：主頁(yè) > 社科論文 > 社會(huì)學(xué)論文 >

結(jié)合先驗(yàn)知識(shí)的深度Q神經(jīng)網(wǎng)絡(luò)算法在室內(nèi)路徑規(guī)劃中的研究與應(yīng)用

發(fā)布時(shí)間：2020-06-30 03:14

【摘要】：機(jī)器人路徑規(guī)劃問(wèn)題是當(dāng)前研究的熱門(mén)方向。其中,室內(nèi)機(jī)器人路徑規(guī)劃任務(wù)存在室內(nèi)環(huán)境不確定性大、安全要求更高等問(wèn)題。然而,傳統(tǒng)的路徑規(guī)劃算法如全局路徑規(guī)劃算法需要根據(jù)環(huán)境建立導(dǎo)航地圖,對(duì)不同環(huán)境的適應(yīng)性較差,不便于處理室內(nèi)路徑規(guī)劃問(wèn)題;局部路徑規(guī)劃算法則容易陷入局部最優(yōu)。針對(duì)這一問(wèn)題,論文提出了一種基于結(jié)合先驗(yàn)知識(shí)的深度Q神經(jīng)網(wǎng)絡(luò)算法的室內(nèi)路徑規(guī)劃模型,該模型能夠通過(guò)自主學(xué)習(xí)完成路徑規(guī)劃任務(wù),可以更好的解決不同室內(nèi)場(chǎng)景差異較大的問(wèn)題,不需要建立導(dǎo)航地圖,僅通過(guò)攝像頭傳感器獲取周?chē)h(huán)境圖像完成導(dǎo)航任務(wù)。論文具體研究?jī)?nèi)容如下:(1)論文總結(jié)了機(jī)器人路徑規(guī)劃問(wèn)題和深度強(qiáng)化學(xué)習(xí)的研究現(xiàn)狀,提出了一種結(jié)合先驗(yàn)知識(shí)的深度Q神經(jīng)網(wǎng)絡(luò)算法(Priori Knowledge-DQN,PK-DQN)研究方法。該方法對(duì)先驗(yàn)知識(shí)進(jìn)行了定義和量化,并將先驗(yàn)知識(shí)引入深度Q神經(jīng)網(wǎng)絡(luò)算法中。該方法將先驗(yàn)知識(shí)定義為一種動(dòng)作選擇規(guī)則,從而干預(yù)算法的訓(xùn)練過(guò)程,通過(guò)減少算法訓(xùn)練中的無(wú)效探索來(lái)提高算法的效率。(2)論文對(duì)基于PK-DQN算法的室內(nèi)機(jī)器人路徑規(guī)劃模型進(jìn)行了研究。結(jié)合室內(nèi)機(jī)器人路徑規(guī)劃任務(wù),為了保證室內(nèi)人和機(jī)器人的安全,設(shè)置了強(qiáng)制避障模塊。將是否出現(xiàn)妨礙機(jī)器人安全的障礙物作為先驗(yàn)知識(shí),設(shè)置了強(qiáng)制避障的閾值,從而構(gòu)建了基于PK-DQN算法的室內(nèi)機(jī)器人路徑規(guī)劃模型。(3)論文搭建了基于ROS機(jī)器人開(kāi)發(fā)平臺(tái)和Gazebo仿真軟件的室內(nèi)三維仿真環(huán)境,并設(shè)計(jì)室內(nèi)移動(dòng)機(jī)器人進(jìn)行路徑規(guī)劃任務(wù)仿真實(shí)驗(yàn),用該實(shí)驗(yàn)來(lái)驗(yàn)證基于PK-DQN算法的室內(nèi)機(jī)器人路徑規(guī)劃模型的有效性。實(shí)驗(yàn)結(jié)果證明,該模型能有效的完成室內(nèi)機(jī)器人路徑規(guī)劃和導(dǎo)航任務(wù)。
【學(xué)位授予單位】：合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2018
【分類(lèi)號(hào)】：C913.4
【圖文】：

出特征信息的方法。該方法的思想來(lái)自于生物學(xué)界對(duì)于貓的視覺(jué)皮層的研究。在經(jīng)層中，視覺(jué)信息會(huì)先通過(guò)簡(jiǎn)單的細(xì)胞進(jìn)行處理，提取出簡(jiǎn)單的細(xì)胞提取出圖像初級(jí)特征，然后跟高階的細(xì)胞會(huì)對(duì)處理結(jié)果進(jìn)行部分池化，經(jīng)過(guò)一系列的處理最得到高層次的特征，然后這些高層次的特征可以用來(lái)進(jìn)行圖像的分類(lèi)和識(shí)別。卷神經(jīng)網(wǎng)絡(luò)通過(guò)對(duì)復(fù)雜的輸入數(shù)據(jù)進(jìn)行卷積（Convolutional）操作，池化（pooling）作，全連接操作，最后輸出分類(lèi)或識(shí)別的結(jié)果，如圖 2.3 所示。

算法,卷積,輸出動(dòng)作,全連接

算法輸入

【參考文獻(xiàn)】

相關(guān)期刊論文前10條

1 宣冬梅;王菊韻;于華;趙佳;;深度學(xué)習(xí)中先驗(yàn)知識(shí)的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年11期

2 張春元;朱清新;;基于對(duì)稱擾動(dòng)采樣的Actor-critic算法[J];控制與決策;2015年12期

3 王國(guó)芳;方舟;李平;;基于批量遞歸最小二乘的自然Actor-Critic算法[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2015年07期

4 郭麗麗;丁世飛;;深度學(xué)習(xí)研究進(jìn)展[J];計(jì)算機(jī)科學(xué);2015年05期

5 王田苗;陶永;;我國(guó)工業(yè)機(jī)器人技術(shù)現(xiàn)狀與產(chǎn)業(yè)化發(fā)展戰(zhàn)略[J];機(jī)械工程學(xué)報(bào);2014年09期

6 孫志軍;薛磊;許陽(yáng)明;王正;;深度學(xué)習(xí)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2012年08期

7 王殿君;;基于改進(jìn)A~*算法的室內(nèi)移動(dòng)機(jī)器人路徑規(guī)劃[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年08期

8 錢(qián)夔;宋愛(ài)國(guó);章華濤;熊鵬文;;基于自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的機(jī)器人路徑規(guī)劃方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期

9 于振中;閆繼宏;趙杰;陳志峰;朱延河;;改進(jìn)人工勢(shì)場(chǎng)法的移動(dòng)機(jī)器人路徑規(guī)劃[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2011年01期

10 朱大奇;顏明重;;移動(dòng)機(jī)器人路徑規(guī)劃技術(shù)綜述[J];控制與決策;2010年07期

相關(guān)博士學(xué)位論文前1條

1 王國(guó)芳;專(zhuān)家知識(shí)輔助的強(qiáng)化學(xué)習(xí)研究及其在無(wú)人機(jī)路徑規(guī)劃中的應(yīng)用[D];浙江大學(xué);2017年

相關(guān)碩士學(xué)位論文前2條

1 許亞;基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃研究[D];山東大學(xué);2013年

2 胡國(guó)梁;智能家庭服務(wù)監(jiān)控機(jī)器人的避障實(shí)現(xiàn)與路徑規(guī)劃研究[D];山東大學(xué);2009年

本文編號(hào)：2734775

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/shekelunwen/shgj/2734775.html

上一篇：我國(guó)城市社區(qū)應(yīng)急管理模式探討
下一篇：社會(huì)工作介入社區(qū)服刑人員偏差行為的優(yōu)勢(shì)及策略研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

結(jié)合先驗(yàn)知識(shí)的深度Q神經(jīng)網(wǎng)絡(luò)算法在室內(nèi)路徑規(guī)劃中的研究與應(yīng)用