天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 航空航天論文 >

基于強化學(xué)習(xí)的四旋翼無人機路徑規(guī)劃方法研究

發(fā)布時間:2021-03-04 07:57
  路徑規(guī)劃是機器人導(dǎo)航控制中非常重要的環(huán)節(jié)之一,是指機器人按照時間,距離等性能指標(biāo),搜索一條從起點到終點的最優(yōu)、近似最優(yōu)或者次優(yōu)的路線。路徑規(guī)劃問題由來已久且具有較為豐富的算法,但目前的算法中大都需要已知環(huán)境,然而在多數(shù)情況下,環(huán)境模型難以描述和獲取。另一方面由于多數(shù)方法中路徑拐點較多且只能夠沿著四個方向運動,極大程度的限制的路徑的平滑程度并且給機器人的導(dǎo)航控制帶來了巨大挑戰(zhàn)。針對以上問題,本文在柵格地圖的基礎(chǔ)之上,將四個方向增加至八個方向,能夠進一步平滑路徑且獲取距離更短的路徑,并進行了一下研究:首先,在諸多強化學(xué)習(xí)方法中,以時間差分方法中的異策略的Q-learning方法為基礎(chǔ),以柵格為狀態(tài)集,八個動作為動作集,不需要環(huán)境模型,依靠自身與環(huán)境交互即可完成路徑規(guī)劃任務(wù)。其次,由于Q-learning產(chǎn)生動作的策略與評估的策略不同,可以利用其它經(jīng)驗幫助自身學(xué)習(xí),因此,引入譜圖理論和流形學(xué)習(xí)的思想,借此獲取能夠清晰反應(yīng)起點到終點距離關(guān)系的先驗知識,與Q-learning方法融合共同指導(dǎo)智能體尋找最優(yōu)路徑。再次,引入Dyna框架,智能體通過與環(huán)境交互獲取實際經(jīng)驗,一方面,這些數(shù)據(jù)會被直接強化... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:73 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于強化學(xué)習(xí)的四旋翼無人機路徑規(guī)劃方法研究


Theta*與A*的對比

示意圖,路徑規(guī)劃,示意圖,路徑規(guī)劃算法


器人完成搜救、測繪和編隊等任務(wù)的前實踐的鴻溝,在實際生產(chǎn)生活應(yīng)用中最搜索方法的設(shè)計,路徑規(guī)劃算法[30]自傳統(tǒng)路徑規(guī)劃算法多是基于圖和歐氏距中動物的行為漸漸發(fā)展出仿生學(xué)方法,和廣泛應(yīng)用,智能路徑規(guī)劃方法亦有長題描述路徑規(guī)劃技術(shù),就是根據(jù)機器人自身條安全可靠的運動路徑,躲避障礙物2-1 。路徑規(guī)劃所要解決的問題,簡而被控對象)能從起點運動到目的地。(2)一定的方法保證機器人能夠躲避障礙物規(guī)劃出簡單優(yōu)化平滑的路徑。

示意圖,方法,示意圖,引力場


圖 2-2 Dijkstra 方法搜索示意圖了由機器人自身體積引發(fā)的節(jié)點限制,與 Dijkstra 算法相同的環(huán)境中,搜索原理圖 2-3 A* 算法搜索示意圖場法源于物理學(xué)中“場”的概念,將機器人抽象的人工的引力場中的運動,目標(biāo)個引力場,而障礙物對機器人會產(chǎn)生“斥的疊加,求解出這兩種力的合力得出機

【參考文獻】:
期刊論文
[1]路徑規(guī)劃算法及其應(yīng)用綜述[J]. 張廣林,胡小梅,柴劍飛,趙磊,俞濤.  現(xiàn)代機械. 2011(05)
[2]蟻群算法研究綜述[J]. 于艷艷.  科技廣場. 2009(01)
[3]基于神經(jīng)網(wǎng)絡(luò)的強化學(xué)習(xí)在避障中的應(yīng)用[J]. 喬俊飛,侯占軍,阮曉鋼.  清華大學(xué)學(xué)報(自然科學(xué)版). 2008(S2)
[4]基于偏向信息學(xué)習(xí)的雙層強化學(xué)習(xí)算法[J]. 林芬,石川,羅杰文,史忠植.  計算機研究與發(fā)展. 2008(09)
[5]基于神經(jīng)網(wǎng)絡(luò)和粒子群算法的移動機器人路徑規(guī)劃[J]. 姜明洋,胡玉蘭.  沈陽理工大學(xué)學(xué)報. 2007(06)
[6]一種在線自學(xué)習(xí)的移動機器人模糊導(dǎo)航方法[J]. 赫東鋒,孫樹棟.  西安工業(yè)大學(xué)學(xué)報. 2007(04)
[7]戰(zhàn)術(shù)飛行路徑規(guī)劃算法[J]. 張永芳,張安,張志禹,張九龍.  交通運輸工程學(xué)報. 2006(04)
[8]基于模糊邏輯的機器人路徑規(guī)劃[J]. 畢盛,朱金輝,閔華清,鐘漢如.  機電產(chǎn)品開發(fā)與創(chuàng)新. 2006(01)
[9]基于柵格法的機器人快速路徑規(guī)劃[J]. 于紅斌,李孝安.  微電子學(xué)與計算機. 2005(06)
[10]飛行器航跡規(guī)劃算法綜述[J]. 杜萍,楊春.  飛行力學(xué). 2005(02)

博士論文
[1]基于譜圖理論的強化學(xué)習(xí)研究[D]. 朱美強.中國礦業(yè)大學(xué) 2012
[2]基于勢場法和遺傳算法的機器人路徑規(guī)劃技術(shù)研究[D]. 劉傳領(lǐng).南京理工大學(xué) 2012
[3]流形學(xué)習(xí)算法及其應(yīng)用研究[D]. 雷迎科.中國科學(xué)技術(shù)大學(xué) 2011
[4]加速強化學(xué)習(xí)方法研究[D]. 金釗.云南大學(xué) 2010
[5]流形學(xué)習(xí)的譜方法相關(guān)問題研究[D]. 曾憲華.北京交通大學(xué) 2009
[6]強化學(xué)習(xí)方法及其應(yīng)用研究[D]. 黃炳強.上海交通大學(xué) 2007
[7]基于強化學(xué)習(xí)的移動機器人自主學(xué)習(xí)及導(dǎo)航控制[D]. 陳春林.中國科學(xué)技術(shù)大學(xué) 2006
[8]增強學(xué)習(xí)及其在移動機器人導(dǎo)航與控制中的應(yīng)用研究[D]. 徐昕.國防科學(xué)技術(shù)大學(xué) 2002

碩士論文
[1]基于強化學(xué)習(xí)的移動機器人路徑規(guī)劃研究[D]. 許亞.山東大學(xué) 2013
[2]有關(guān)強化學(xué)習(xí)的若干問題研究[D]. 趙昀.南京理工大學(xué) 2009
[3]基于量子粒子群算法的移動機器人的路徑規(guī)劃的研究[D]. 王坤.江南大學(xué) 2009
[4]基于蟻群算法的路徑規(guī)劃研究[D]. 董金明.陜西師范大學(xué) 2009
[5]基于蟻群算法的機器人路徑規(guī)劃及其仿真系統(tǒng)研究[D]. 王濤.西安科技大學(xué) 2009
[6]復(fù)雜動態(tài)環(huán)境下移動機器人的全局路徑規(guī)劃算法研究[D]. 徐培培.北京郵電大學(xué) 2009



本文編號:3062852

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/hangkongsky/3062852.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ebbf6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com