基于深度強(qiáng)化學(xué)習(xí)的虛擬機(jī)器人采摘路徑避障規(guī)劃
發(fā)布時間:2022-12-08 03:17
針對采摘機(jī)器人在野外作業(yè)環(huán)境中,面臨采摘任務(wù)數(shù)量多,目標(biāo)與障礙物位置具有隨機(jī)性和不確定性等問題,提出一種基于深度強(qiáng)化學(xué)習(xí)的虛擬機(jī)器人采摘路徑避障規(guī)劃方法,實(shí)現(xiàn)機(jī)器人在大量且不確定任務(wù)情況下的快速軌跡規(guī)劃。根據(jù)機(jī)器人本體物理結(jié)構(gòu)設(shè)定虛擬機(jī)器人隨機(jī)運(yùn)動策略,通過對比分析不同網(wǎng)絡(luò)輸入觀測值的優(yōu)劣,結(jié)合實(shí)際采摘行為設(shè)置環(huán)境觀測集合,作為網(wǎng)絡(luò)的輸入;引入人工勢場法目標(biāo)吸引和障礙排斥的思想建立獎懲函數(shù),對虛擬機(jī)器人行為進(jìn)行評價,提高避障成功率;針對人工勢場法范圍斥力影響最短路徑規(guī)劃的問題,提出了一種方向懲罰避障函數(shù)設(shè)置方法,將障礙物范圍懲罰轉(zhuǎn)換為單一方向懲罰,通過建立虛擬機(jī)器人運(yùn)動碰撞模型,分析碰撞結(jié)果選擇性給予方向懲罰,進(jìn)一步優(yōu)化了規(guī)劃路徑長度,提高采摘效率;在Unity內(nèi)搭建仿真環(huán)境,使用ML-Agents組件建立分布式近端策略優(yōu)化算法及其與仿真環(huán)境的交互通信,對虛擬機(jī)器人進(jìn)行采摘訓(xùn)練。仿真實(shí)驗(yàn)結(jié)果顯示,不同位置障礙物設(shè)置情況下虛擬機(jī)器人完成采摘任務(wù)成功率達(dá)96.7%以上。在200次隨機(jī)采摘實(shí)驗(yàn)中,方向懲罰避障函數(shù)方法采摘成功率為97.5%,比普通獎勵函數(shù)方法提高了11個百分點(diǎn),采摘軌跡規(guī)劃平...
【文章頁數(shù)】:10 頁
【部分圖文】:
機(jī)器人整體結(jié)構(gòu)示意圖
0 不同獎勵函數(shù)下成功采摘個數(shù)變化曲線
1 路徑規(guī)劃結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)YOLO v3網(wǎng)絡(luò)的夜間環(huán)境柑橘識別方法[J]. 熊俊濤,鄭鎮(zhèn)輝,梁嘉恩,鐘灼,劉柏林,孫寶霞. 農(nóng)業(yè)機(jī)械學(xué)報(bào). 2020(04)
[2]基于強(qiáng)化學(xué)習(xí)的DASH自適應(yīng)碼率決策算法研究[J]. 馮蘇柳,姜秀華. 中國傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(02)
[3]基于改進(jìn)人工勢場法的雙機(jī)械臂避障路徑規(guī)劃[J]. 薛陽,俞志程,吳海東,張寧,孫越. 機(jī)械傳動. 2020(03)
[4]基于深度強(qiáng)化學(xué)習(xí)的固體放射性廢物抓取方法研究[J]. 周祺杰,劉滿祿,李新茂,張華. 計(jì)算機(jī)應(yīng)用研究. 2020(11)
[5]果園采摘機(jī)械手研究現(xiàn)狀綜述[J]. 王甲甲,程志強(qiáng),張伏,王俊. 農(nóng)機(jī)化研究. 2020(05)
[6]六自由度采摘機(jī)械臂采摘姿態(tài)規(guī)劃研究[J]. 王毅,滕舉元,張哲,許洪斌. 機(jī)械設(shè)計(jì)與制造. 2019(08)
[7]基于構(gòu)型空間先驗(yàn)知識引導(dǎo)點(diǎn)的柑橘采摘機(jī)械臂運(yùn)動規(guī)劃[J]. 馬冀桐,王毅,何宇,王愷,張藝譚. 農(nóng)業(yè)工程學(xué)報(bào). 2019(08)
[8]基于深度卷積神經(jīng)網(wǎng)絡(luò)的柑橘目標(biāo)識別方法[J]. 畢松,高峰,陳俊文,張潞. 農(nóng)業(yè)機(jī)械學(xué)報(bào). 2019(05)
[9]面向軌跡規(guī)劃的深度強(qiáng)化學(xué)習(xí)獎勵函數(shù)設(shè)計(jì)[J]. 李躍,邵振洲,趙振東,施智平,關(guān)永. 計(jì)算機(jī)工程與應(yīng)用. 2020(02)
[10]基于碰撞錐改進(jìn)人工勢場的無人機(jī)避障路徑規(guī)劃[J]. 熊超,解武杰,董文瀚. 計(jì)算機(jī)工程. 2018(09)
本文編號:3713438
【文章頁數(shù)】:10 頁
【部分圖文】:
機(jī)器人整體結(jié)構(gòu)示意圖
0 不同獎勵函數(shù)下成功采摘個數(shù)變化曲線
1 路徑規(guī)劃結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)YOLO v3網(wǎng)絡(luò)的夜間環(huán)境柑橘識別方法[J]. 熊俊濤,鄭鎮(zhèn)輝,梁嘉恩,鐘灼,劉柏林,孫寶霞. 農(nóng)業(yè)機(jī)械學(xué)報(bào). 2020(04)
[2]基于強(qiáng)化學(xué)習(xí)的DASH自適應(yīng)碼率決策算法研究[J]. 馮蘇柳,姜秀華. 中國傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020(02)
[3]基于改進(jìn)人工勢場法的雙機(jī)械臂避障路徑規(guī)劃[J]. 薛陽,俞志程,吳海東,張寧,孫越. 機(jī)械傳動. 2020(03)
[4]基于深度強(qiáng)化學(xué)習(xí)的固體放射性廢物抓取方法研究[J]. 周祺杰,劉滿祿,李新茂,張華. 計(jì)算機(jī)應(yīng)用研究. 2020(11)
[5]果園采摘機(jī)械手研究現(xiàn)狀綜述[J]. 王甲甲,程志強(qiáng),張伏,王俊. 農(nóng)機(jī)化研究. 2020(05)
[6]六自由度采摘機(jī)械臂采摘姿態(tài)規(guī)劃研究[J]. 王毅,滕舉元,張哲,許洪斌. 機(jī)械設(shè)計(jì)與制造. 2019(08)
[7]基于構(gòu)型空間先驗(yàn)知識引導(dǎo)點(diǎn)的柑橘采摘機(jī)械臂運(yùn)動規(guī)劃[J]. 馬冀桐,王毅,何宇,王愷,張藝譚. 農(nóng)業(yè)工程學(xué)報(bào). 2019(08)
[8]基于深度卷積神經(jīng)網(wǎng)絡(luò)的柑橘目標(biāo)識別方法[J]. 畢松,高峰,陳俊文,張潞. 農(nóng)業(yè)機(jī)械學(xué)報(bào). 2019(05)
[9]面向軌跡規(guī)劃的深度強(qiáng)化學(xué)習(xí)獎勵函數(shù)設(shè)計(jì)[J]. 李躍,邵振洲,趙振東,施智平,關(guān)永. 計(jì)算機(jī)工程與應(yīng)用. 2020(02)
[10]基于碰撞錐改進(jìn)人工勢場的無人機(jī)避障路徑規(guī)劃[J]. 熊超,解武杰,董文瀚. 計(jì)算機(jī)工程. 2018(09)
本文編號:3713438
本文鏈接:http://sikaile.net/nykjlw/nygclw/3713438.html
最近更新
教材專著