基于Q（λ）-learning的移動機器人路徑規(guī)劃改進探索方法

發(fā)布時間：2021-01-24 03:55

　　強化學習算法廣泛的應用于路徑規(guī)劃,使移動機器人能夠與環(huán)境交互并實現(xiàn)自主避障、獲取最優(yōu)路徑。傳統(tǒng)Q（λ）-learning算法所采用的探索策略存在探索利用平衡問題,由于收斂過早,往往得不到最優(yōu)解。本文提出一種動態(tài)調(diào)整探索因子的探索方法,以探索成功率判斷機器人對環(huán)境的熟悉程度,指導探索過程,從而找到最優(yōu)路徑;采用柵格法建立地圖。通過仿真和對比試驗證明了該方法可以得到全局最優(yōu)策略。

【文章來源】：自動化與儀表. 2019,34(11)

【文章頁數(shù)】：4 頁

【文章目錄】：
1 基于Q（λ）-learning的改進探索方法
2 仿真試驗與結(jié)果分析
3 結(jié)語

【參考文獻】：
期刊論文
[1]結(jié)合神經(jīng)網(wǎng)絡和Q（λ）-learning的路徑規(guī)劃方法[J]. 王健,張平陸,趙忠英,程曉鵬.  自動化與儀表. 2019(09)
[2]基于神經(jīng)網(wǎng)絡的強化學習在避障中的應用[J]. 喬俊飛,侯占軍,阮曉鋼.  清華大學學報(自然科學版). 2008(S2)
[3]基于模糊邏輯的機器人路徑規(guī)劃[J]. 畢盛,朱金輝,閔華清,鐘漢如.  機電產(chǎn)品開發(fā)與創(chuàng)新. 2006(01)

碩士論文
[1]Qlearning強化學習算法的改進及應用研究[D]. 馬朋委.安徽理工大學 2016
[2]基于增強學習的移動機器人動態(tài)路徑規(guī)劃算法研究[D]. 李斯定.國防科學技術(shù)大學 2015

本文編號：2996524

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2996524.html

上一篇：多類型觀測任務的多星協(xié)同規(guī)劃問題研究
下一篇：基于分解的多目標組合優(yōu)化算法的研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Q（λ）-learning的移動機器人路徑規(guī)劃改進探索方法