基于深度強(qiáng)化學(xué)習(xí)的未知環(huán)境下機(jī)器人路徑規(guī)劃的研究
發(fā)布時(shí)間:2021-11-26 12:32
服務(wù)機(jī)器人在完成各種任務(wù)時(shí)經(jīng)常需要進(jìn)出房間,這就需要機(jī)器人能夠在室內(nèi)環(huán)境下,自主獲取環(huán)境信息,然后進(jìn)行路徑規(guī)劃和導(dǎo)航,導(dǎo)航對(duì)于自主移動(dòng)機(jī)器人來(lái)說(shuō)非常重要。在動(dòng)態(tài)未知環(huán)境中,由于移動(dòng)機(jī)器人處于局部環(huán)境中,有時(shí)并不能準(zhǔn)確得到目標(biāo)位罝,因此移動(dòng)機(jī)器人只能根據(jù)反饋得到的局部信息來(lái)規(guī)劃自己的路徑。如何有效的利用已知信息就成了動(dòng)態(tài)未知環(huán)境中路徑規(guī)劃的關(guān)鍵問(wèn)題。傳統(tǒng)的動(dòng)態(tài)環(huán)境下的路徑規(guī)劃方法都需要依賴地圖信息,在已知地圖信息的前提下進(jìn)行路徑規(guī)劃,無(wú)法在未知的環(huán)境中通過(guò)視覺(jué)伺服進(jìn)行路徑規(guī)劃。本文通過(guò)深度強(qiáng)化學(xué)習(xí)的方式,在機(jī)器人無(wú)地圖信息的情況下進(jìn)行路徑規(guī)劃。首先,建立差速的移動(dòng)機(jī)器人系統(tǒng),為了驗(yàn)證模型的準(zhǔn)確性與可靠性,在MATLAB中進(jìn)行了多種運(yùn)動(dòng)學(xué)的仿真,包括點(diǎn)鎮(zhèn)定、跟蹤雙曲線、跟蹤圓周曲線等的測(cè)試,證明了運(yùn)動(dòng)學(xué)模型的可靠性;赗OS建立了移動(dòng)機(jī)器人的外形與運(yùn)動(dòng)學(xué)模型,在其上添加了Kinect視覺(jué)傳感器與碰撞、速度里程計(jì)等傳感器,并將各個(gè)傳感器采集到的數(shù)據(jù)以消息的方式發(fā)布到了相應(yīng)的主題上,通過(guò)訂閱這些主題可以方便的獲取機(jī)器人實(shí)時(shí)采集的環(huán)境信息,為之后進(jìn)行路徑規(guī)劃奠定基礎(chǔ)。然后,建立了深度強(qiáng)化學(xué)習(xí)的...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題來(lái)源
1.2 研究背景意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 經(jīng)典路徑規(guī)劃算法
1.3.2 進(jìn)化算法和算法融合
1.3.3 深度強(qiáng)化學(xué)習(xí)與路徑規(guī)劃
1.4 研究?jī)?nèi)容
第2章 建立移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模型
2.1 引言
2.2 MATLAB下運(yùn)動(dòng)學(xué)建模并驗(yàn)證
2.2.1 機(jī)器人運(yùn)動(dòng)學(xué)模型建立
2.2.2 運(yùn)動(dòng)學(xué)模型合理性的驗(yàn)證
2.3 基于ROS建立實(shí)驗(yàn)?zāi)P?br> 2.3.1 ROS總述
2.3.2 以URDF建立機(jī)器人模型
2.3.3 環(huán)境交互插件的編寫
2.4 仿真環(huán)境下驗(yàn)證運(yùn)動(dòng)學(xué)模型
2.5 本章小結(jié)
第3章 基于Actor-Critic算法的路徑規(guī)劃
3.1 引言
3.2 強(qiáng)化學(xué)習(xí)方法
3.2.1 基于值函數(shù)的強(qiáng)化學(xué)習(xí)方法
3.2.2 基于策略的強(qiáng)化學(xué)習(xí)方法
3.2.3 結(jié)合了基于值函數(shù)的策略梯度算法
3.3 基于深度學(xué)習(xí)的強(qiáng)化學(xué)習(xí)
3.4 本章小結(jié)
第4章 基于最小景深信息的深度強(qiáng)化學(xué)習(xí)訓(xùn)練
4.1 引言
4.2 優(yōu)化狀態(tài)空間的構(gòu)建
4.3 基于最小景深信息的訓(xùn)練
4.4 算法實(shí)現(xiàn)與仿真驗(yàn)證
4.5 本章小結(jié)
第5章 仿真實(shí)驗(yàn)搭建與實(shí)驗(yàn)研究
5.1 引言
5.2 系統(tǒng)的搭建
5.3 仿真環(huán)境下訓(xùn)練并進(jìn)行驗(yàn)證
5.4 在真實(shí)環(huán)境下進(jìn)行實(shí)驗(yàn)
5.4.1 深度圖像預(yù)處理
5.4.2 機(jī)器人定位與坐標(biāo)轉(zhuǎn)換
5.4.3 室內(nèi)環(huán)境下實(shí)驗(yàn)
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表過(guò)的學(xué)術(shù)論文及其他成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)人工勢(shì)場(chǎng)法的移動(dòng)機(jī)器人路徑規(guī)劃[J]. 宋建輝,代濤,劉硯菊. 計(jì)算機(jī)工程與科學(xué). 2017(07)
[2]CA模型下的改進(jìn)D*路徑規(guī)劃算法[J]. 史久根,劉春霞,席海強(qiáng). 電子測(cè)量與儀器學(xué)報(bào). 2016(01)
博士論文
[1]加速?gòu)?qiáng)化學(xué)習(xí)方法研究[D]. 金釗.云南大學(xué) 2010
本文編號(hào):3520151
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題來(lái)源
1.2 研究背景意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 經(jīng)典路徑規(guī)劃算法
1.3.2 進(jìn)化算法和算法融合
1.3.3 深度強(qiáng)化學(xué)習(xí)與路徑規(guī)劃
1.4 研究?jī)?nèi)容
第2章 建立移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模型
2.1 引言
2.2 MATLAB下運(yùn)動(dòng)學(xué)建模并驗(yàn)證
2.2.1 機(jī)器人運(yùn)動(dòng)學(xué)模型建立
2.2.2 運(yùn)動(dòng)學(xué)模型合理性的驗(yàn)證
2.3 基于ROS建立實(shí)驗(yàn)?zāi)P?br> 2.3.1 ROS總述
2.3.2 以URDF建立機(jī)器人模型
2.3.3 環(huán)境交互插件的編寫
2.4 仿真環(huán)境下驗(yàn)證運(yùn)動(dòng)學(xué)模型
2.5 本章小結(jié)
第3章 基于Actor-Critic算法的路徑規(guī)劃
3.1 引言
3.2 強(qiáng)化學(xué)習(xí)方法
3.2.1 基于值函數(shù)的強(qiáng)化學(xué)習(xí)方法
3.2.2 基于策略的強(qiáng)化學(xué)習(xí)方法
3.2.3 結(jié)合了基于值函數(shù)的策略梯度算法
3.3 基于深度學(xué)習(xí)的強(qiáng)化學(xué)習(xí)
3.4 本章小結(jié)
第4章 基于最小景深信息的深度強(qiáng)化學(xué)習(xí)訓(xùn)練
4.1 引言
4.2 優(yōu)化狀態(tài)空間的構(gòu)建
4.3 基于最小景深信息的訓(xùn)練
4.4 算法實(shí)現(xiàn)與仿真驗(yàn)證
4.5 本章小結(jié)
第5章 仿真實(shí)驗(yàn)搭建與實(shí)驗(yàn)研究
5.1 引言
5.2 系統(tǒng)的搭建
5.3 仿真環(huán)境下訓(xùn)練并進(jìn)行驗(yàn)證
5.4 在真實(shí)環(huán)境下進(jìn)行實(shí)驗(yàn)
5.4.1 深度圖像預(yù)處理
5.4.2 機(jī)器人定位與坐標(biāo)轉(zhuǎn)換
5.4.3 室內(nèi)環(huán)境下實(shí)驗(yàn)
5.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表過(guò)的學(xué)術(shù)論文及其他成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)人工勢(shì)場(chǎng)法的移動(dòng)機(jī)器人路徑規(guī)劃[J]. 宋建輝,代濤,劉硯菊. 計(jì)算機(jī)工程與科學(xué). 2017(07)
[2]CA模型下的改進(jìn)D*路徑規(guī)劃算法[J]. 史久根,劉春霞,席海強(qiáng). 電子測(cè)量與儀器學(xué)報(bào). 2016(01)
博士論文
[1]加速?gòu)?qiáng)化學(xué)習(xí)方法研究[D]. 金釗.云南大學(xué) 2010
本文編號(hào):3520151
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3520151.html
最近更新
教材專著