基于增強(qiáng)學(xué)習(xí)算法的移動機(jī)器人導(dǎo)航控制及實(shí)現(xiàn)
發(fā)布時(shí)間:2021-01-10 19:15
隨著移動機(jī)器人應(yīng)用領(lǐng)域的拓展,要求移動機(jī)器人能適應(yīng)在未知環(huán)境下工作。移動機(jī)器人自主導(dǎo)航和軌跡跟蹤能力是提高移動機(jī)器人適應(yīng)性關(guān)鍵技術(shù)。本文以差速輪式移動機(jī)器人為研究對象,以增強(qiáng)學(xué)習(xí)為理論基礎(chǔ),研究移動機(jī)器人在未知環(huán)境下自主導(dǎo)航和軌跡跟蹤控制器優(yōu)化方法。應(yīng)用所提出的導(dǎo)航方法,結(jié)合單目視覺技術(shù)實(shí)現(xiàn)自主設(shè)計(jì)的移動機(jī)器人在障礙物環(huán)境中導(dǎo)航。針對移動機(jī)器人導(dǎo)航問題,提出一種基于增強(qiáng)學(xué)習(xí)反應(yīng)式導(dǎo)航策略。首先分析移動機(jī)器人導(dǎo)航環(huán)境特點(diǎn),建立移動機(jī)器人導(dǎo)航Markov模型,優(yōu)化Markov模型中狀態(tài)空間和回報(bào)函數(shù)設(shè)計(jì),用BP神經(jīng)網(wǎng)絡(luò)逼近狀態(tài)值和策略空間來解決連續(xù)狀態(tài)空間“維數(shù)災(zāi)難”問題。由于Q-學(xué)習(xí)算法收斂速度較慢,移動機(jī)器人學(xué)習(xí)訓(xùn)練采用Actor-Critic策略梯度算法,最后設(shè)計(jì)Matlab仿真實(shí)驗(yàn)證明提出的導(dǎo)航方法使得移動機(jī)器人可以根據(jù)外界傳感器獲取的環(huán)境信息實(shí)時(shí)路徑規(guī)劃,自主避障,同傳統(tǒng)方法相比學(xué)習(xí)效率更高,具有更強(qiáng)的泛化能力和環(huán)境適應(yīng)力。針對輪式移動機(jī)器人軌跡跟蹤問題,提出一種基于增強(qiáng)學(xué)習(xí)算法的移動機(jī)器人軌跡跟蹤控制方法。首先建立移動機(jī)器人運(yùn)動學(xué)模型和動力學(xué)模型,分別建立運(yùn)動學(xué)控制器和動力學(xué)控...
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:99 頁
【學(xué)位級別】:碩士
【部分圖文】:
磁導(dǎo)航巡視機(jī)器人3)光學(xué)導(dǎo)航
這種導(dǎo)航在移動機(jī)器人行駛環(huán)境中安裝已體上安裝激光發(fā)射器,通過檢測不同角度反從而實(shí)現(xiàn)移動機(jī)器人導(dǎo)引。該導(dǎo)航方式優(yōu)點(diǎn)移動機(jī)器人行駛路徑,適用于復(fù)雜工作環(huán)境。這種導(dǎo)航方式在移動機(jī)器人上安設(shè)陀螺儀器人通過陀螺儀偏差信號和地面定位塊信號高,路徑規(guī)劃簡易等優(yōu)點(diǎn),是移動機(jī)器人導(dǎo)不成熟,成本較高。。視覺導(dǎo)航工作原理是:移動機(jī)器人通過車信息,通過圖像信息提取移動機(jī)器人位姿,人類導(dǎo)航方式,適用范圍廣、路徑設(shè)置靈活導(dǎo)航方式。缺點(diǎn)是車載視覺系統(tǒng)技術(shù)不成熟人快速準(zhǔn)確環(huán)境識別。由于視覺提供的環(huán)境關(guān)鍵,是移動機(jī)器人自主導(dǎo)航最重要的技術(shù)
圖 1-3Actor-critic 算法結(jié)構(gòu)圖回報(bào)設(shè)計(jì)(Reward Shaping)核心思想是利用各種少動作的獎(jiǎng)勵(lì)邊界,加快學(xué)習(xí)[12]。啟發(fā)式回報(bào)函回報(bào)信號稀疏和信度分配難題。啟發(fā)式函數(shù)將值加上啟發(fā)式的附加回報(bào)值。附加回報(bào)值設(shè)計(jì)要的影響,AndrewNg 等給出 TD 算法中安全使并提出基于回報(bào)勢函數(shù)(Potentialfunction)的引導(dǎo)通過限定附加回報(bào)函數(shù) 為某個(gè)勢函數(shù)的φ( s),將附加回報(bào)函數(shù)設(shè)計(jì)轉(zhuǎn)變到勢函數(shù)設(shè)計(jì),驗(yàn)知識確定為定量模型。立即回報(bào)函數(shù)和引導(dǎo),若模型沒有先驗(yàn)知識,設(shè)計(jì)將會很困難,因e shaping 知識,該方法利用過程經(jīng)驗(yàn)設(shè)計(jì)勢函數(shù)機(jī)器學(xué)習(xí)中其他方法最大優(yōu)點(diǎn)是不需要給定各能體可以通過與環(huán)境的互動中自我學(xué)習(xí),在求解
【參考文獻(xiàn)】:
期刊論文
[1]基于ARM的視覺導(dǎo)航AGV的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張合貴,馬家辰. 信息技術(shù). 2016(07)
[2]基于模糊控制的AGV軌跡跟蹤研究[J]. 楊遠(yuǎn)航,方慶琯. 起重運(yùn)輸機(jī)械. 2011(02)
[3]基于單目視覺的移動機(jī)器人導(dǎo)航算法研究進(jìn)展[J]. 夏庭鍇,楊明,楊汝清. 控制與決策. 2010(01)
[4]強(qiáng)化學(xué)習(xí)方法在移動機(jī)器人導(dǎo)航中的應(yīng)用[J]. 陸軍,徐莉,周小平. 哈爾濱工程大學(xué)學(xué)報(bào). 2004(02)
博士論文
[1]輪式機(jī)器人的移動系統(tǒng)建模及基于模型學(xué)習(xí)的跟蹤控制研究[D]. 宋興國.哈爾濱工業(yè)大學(xué) 2015
[2]視覺導(dǎo)航的輪式移動機(jī)器人運(yùn)動控制技術(shù)研究[D]. 武星.南京航空航天大學(xué) 2010
[3]增強(qiáng)學(xué)習(xí)及其在移動機(jī)器人導(dǎo)航與控制中的應(yīng)用研究[D]. 徐昕.國防科學(xué)技術(shù)大學(xué) 2002
碩士論文
[1]室內(nèi)全向移動機(jī)器人系統(tǒng)設(shè)計(jì)及導(dǎo)航方法研究[D]. 王超.哈爾濱工業(yè)大學(xué) 2017
[2]視覺導(dǎo)航AGV定位與路徑規(guī)劃技術(shù)研究[D]. 鄭少華.華南理工大學(xué) 2016
[3]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究[D]. 高慧.西南交通大學(xué) 2016
[4]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究與實(shí)現(xiàn)[D]. 韋如明.華南理工大學(xué) 2015
[5]基于機(jī)器視覺的AGV結(jié)構(gòu)設(shè)計(jì)與導(dǎo)航算法研究[D]. 凌云志.華南理工大學(xué) 2015
[6]基于STM32的自動引導(dǎo)小車(AGV)導(dǎo)航系統(tǒng)的研究[D]. 孫洪偉.武漢理工大學(xué) 2014
[7]基于智能手機(jī)的機(jī)器人視覺避障系統(tǒng)研究[D]. 向文輝.中國科學(xué)技術(shù)大學(xué) 2014
[8]基于單目視覺的無人車障礙物識別技術(shù)研究[D]. 徐紅賓.大連理工大學(xué) 2014
[9]輪式移動機(jī)器人控制系統(tǒng)設(shè)計(jì)[D]. 王珊珊.南京理工大學(xué) 2013
[10]分層強(qiáng)化學(xué)習(xí)研究及其在機(jī)械臂避障問題中的應(yīng)用[D]. 金旭東.重慶大學(xué) 2012
本文編號:2969260
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:99 頁
【學(xué)位級別】:碩士
【部分圖文】:
磁導(dǎo)航巡視機(jī)器人3)光學(xué)導(dǎo)航
這種導(dǎo)航在移動機(jī)器人行駛環(huán)境中安裝已體上安裝激光發(fā)射器,通過檢測不同角度反從而實(shí)現(xiàn)移動機(jī)器人導(dǎo)引。該導(dǎo)航方式優(yōu)點(diǎn)移動機(jī)器人行駛路徑,適用于復(fù)雜工作環(huán)境。這種導(dǎo)航方式在移動機(jī)器人上安設(shè)陀螺儀器人通過陀螺儀偏差信號和地面定位塊信號高,路徑規(guī)劃簡易等優(yōu)點(diǎn),是移動機(jī)器人導(dǎo)不成熟,成本較高。。視覺導(dǎo)航工作原理是:移動機(jī)器人通過車信息,通過圖像信息提取移動機(jī)器人位姿,人類導(dǎo)航方式,適用范圍廣、路徑設(shè)置靈活導(dǎo)航方式。缺點(diǎn)是車載視覺系統(tǒng)技術(shù)不成熟人快速準(zhǔn)確環(huán)境識別。由于視覺提供的環(huán)境關(guān)鍵,是移動機(jī)器人自主導(dǎo)航最重要的技術(shù)
圖 1-3Actor-critic 算法結(jié)構(gòu)圖回報(bào)設(shè)計(jì)(Reward Shaping)核心思想是利用各種少動作的獎(jiǎng)勵(lì)邊界,加快學(xué)習(xí)[12]。啟發(fā)式回報(bào)函回報(bào)信號稀疏和信度分配難題。啟發(fā)式函數(shù)將值加上啟發(fā)式的附加回報(bào)值。附加回報(bào)值設(shè)計(jì)要的影響,AndrewNg 等給出 TD 算法中安全使并提出基于回報(bào)勢函數(shù)(Potentialfunction)的引導(dǎo)通過限定附加回報(bào)函數(shù) 為某個(gè)勢函數(shù)的φ( s),將附加回報(bào)函數(shù)設(shè)計(jì)轉(zhuǎn)變到勢函數(shù)設(shè)計(jì),驗(yàn)知識確定為定量模型。立即回報(bào)函數(shù)和引導(dǎo),若模型沒有先驗(yàn)知識,設(shè)計(jì)將會很困難,因e shaping 知識,該方法利用過程經(jīng)驗(yàn)設(shè)計(jì)勢函數(shù)機(jī)器學(xué)習(xí)中其他方法最大優(yōu)點(diǎn)是不需要給定各能體可以通過與環(huán)境的互動中自我學(xué)習(xí),在求解
【參考文獻(xiàn)】:
期刊論文
[1]基于ARM的視覺導(dǎo)航AGV的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張合貴,馬家辰. 信息技術(shù). 2016(07)
[2]基于模糊控制的AGV軌跡跟蹤研究[J]. 楊遠(yuǎn)航,方慶琯. 起重運(yùn)輸機(jī)械. 2011(02)
[3]基于單目視覺的移動機(jī)器人導(dǎo)航算法研究進(jìn)展[J]. 夏庭鍇,楊明,楊汝清. 控制與決策. 2010(01)
[4]強(qiáng)化學(xué)習(xí)方法在移動機(jī)器人導(dǎo)航中的應(yīng)用[J]. 陸軍,徐莉,周小平. 哈爾濱工程大學(xué)學(xué)報(bào). 2004(02)
博士論文
[1]輪式機(jī)器人的移動系統(tǒng)建模及基于模型學(xué)習(xí)的跟蹤控制研究[D]. 宋興國.哈爾濱工業(yè)大學(xué) 2015
[2]視覺導(dǎo)航的輪式移動機(jī)器人運(yùn)動控制技術(shù)研究[D]. 武星.南京航空航天大學(xué) 2010
[3]增強(qiáng)學(xué)習(xí)及其在移動機(jī)器人導(dǎo)航與控制中的應(yīng)用研究[D]. 徐昕.國防科學(xué)技術(shù)大學(xué) 2002
碩士論文
[1]室內(nèi)全向移動機(jī)器人系統(tǒng)設(shè)計(jì)及導(dǎo)航方法研究[D]. 王超.哈爾濱工業(yè)大學(xué) 2017
[2]視覺導(dǎo)航AGV定位與路徑規(guī)劃技術(shù)研究[D]. 鄭少華.華南理工大學(xué) 2016
[3]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究[D]. 高慧.西南交通大學(xué) 2016
[4]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究與實(shí)現(xiàn)[D]. 韋如明.華南理工大學(xué) 2015
[5]基于機(jī)器視覺的AGV結(jié)構(gòu)設(shè)計(jì)與導(dǎo)航算法研究[D]. 凌云志.華南理工大學(xué) 2015
[6]基于STM32的自動引導(dǎo)小車(AGV)導(dǎo)航系統(tǒng)的研究[D]. 孫洪偉.武漢理工大學(xué) 2014
[7]基于智能手機(jī)的機(jī)器人視覺避障系統(tǒng)研究[D]. 向文輝.中國科學(xué)技術(shù)大學(xué) 2014
[8]基于單目視覺的無人車障礙物識別技術(shù)研究[D]. 徐紅賓.大連理工大學(xué) 2014
[9]輪式移動機(jī)器人控制系統(tǒng)設(shè)計(jì)[D]. 王珊珊.南京理工大學(xué) 2013
[10]分層強(qiáng)化學(xué)習(xí)研究及其在機(jī)械臂避障問題中的應(yīng)用[D]. 金旭東.重慶大學(xué) 2012
本文編號:2969260
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2969260.html
最近更新
教材專著