天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度強(qiáng)化學(xué)習(xí)的機(jī)械臂抓取操作決策研究

發(fā)布時(shí)間:2024-03-19 21:35
  機(jī)械臂在工業(yè)生產(chǎn)中有著廣泛應(yīng)用。絕大部分抓取算法都依賴于手眼標(biāo)定結(jié)果,物體模型特征等先驗(yàn)知識(shí),且只能針對(duì)特定種類物體的抓取,當(dāng)任務(wù)場景,操作目標(biāo)發(fā)生變化時(shí),其無法進(jìn)行有效的遷移。本文主要研究在機(jī)械臂仿真環(huán)境下的通用物體抓取決策過程。本文定義的通用物體抓取過程主要滿足以下四點(diǎn)約束:·可在指定任務(wù)場景下完成對(duì)單個(gè)任意的通用物體的抓取,包含新物體的抓取。·抓取決策過程的輸入信息僅包含傳感器觀測(cè)輸入(如相機(jī)的圖像),機(jī)械臂的姿態(tài),夾持器的反饋信息等!げ皇褂媚繕(biāo)物體真實(shí)坐標(biāo)等實(shí)物平臺(tái)上難以直接獲得的額外信息,強(qiáng)化學(xué)習(xí)訓(xùn)練過程采用稀疏獎(jiǎng)勵(lì)的反饋,只有抓取成功時(shí)才能獲得正面的反饋。·采用笛卡爾坐標(biāo)系下機(jī)械臂末端的連續(xù)動(dòng)作空間作為決策的輸出。本文主要使用深度強(qiáng)化學(xué)習(xí)的方法來研究通用物體抓取的端對(duì)端決策過程。在上述約束下,強(qiáng)化學(xué)習(xí)的方法主要會(huì)遇到交互時(shí)間長,采樣效率低,樣本利用率不足,探索性受限四個(gè)問題。本文的研究主要針對(duì)這四個(gè)問題展開,具體研究成果如下:1.本文在基礎(chǔ)的DQN和DDPG兩類算法上分別引入控制器引導(dǎo)策略探索與分布式訓(xùn)練兩點(diǎn)改進(jìn),以克服交互時(shí)間長、采樣效率低的問題。由于高維狀態(tài)、稀疏獎(jiǎng)勵(lì)...

【文章頁數(shù)】:84 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖1.4各類型候選抓取姿態(tài)

圖1.4各類型候選抓取姿態(tài)

浙江大學(xué)碩士學(xué)位論文?1緒論??圖1.3分割網(wǎng)絡(luò)用于抓取位姿估計(jì)流程圖示例??絡(luò)回歸出最優(yōu)的抓取位姿,或者用基于采樣的方法選出候選抓取位姿,利用CNN網(wǎng)絡(luò)評(píng)??估出最優(yōu)的抓取姿態(tài)。這類方法解決的問題是在一個(gè)或者一堆物體中成功地完成抓取這??個(gè)動(dòng)作,換言之,在每次的抓取操作中,機(jī)械....


圖1.3分割網(wǎng)絡(luò)用于抓取位姿估計(jì)流程圖示例??

圖1.3分割網(wǎng)絡(luò)用于抓取位姿估計(jì)流程圖示例??

浙江大學(xué)碩士學(xué)位論文?1緒論??圖1.3分割網(wǎng)絡(luò)用于抓取位姿估計(jì)流程圖示例??絡(luò)回歸出最優(yōu)的抓取位姿,或者用基于采樣的方法選出候選抓取位姿,利用CNN網(wǎng)絡(luò)評(píng)??估出最優(yōu)的抓取姿態(tài)。這類方法解決的問題是在一個(gè)或者一堆物體中成功地完成抓取這??個(gè)動(dòng)作,換言之,在每次的抓取操作中,機(jī)械....


圖1.6卷積神經(jīng)網(wǎng)絡(luò)通過對(duì)特定物體示教數(shù)據(jù)的學(xué)習(xí)后,可回歸機(jī)械臂末端執(zhí)行的動(dòng)作??

圖1.6卷積神經(jīng)網(wǎng)絡(luò)通過對(duì)特定物體示教數(shù)據(jù)的學(xué)習(xí)后,可回歸機(jī)械臂末端執(zhí)行的動(dòng)作??

1緒論?浙江大學(xué)碩士學(xué)位論文??物中采集大規(guī)模抓取數(shù)據(jù)集的代價(jià)是非常昂貴的,Jeffrey在仿真環(huán)境中生成了?670w組點(diǎn)??云圖來訓(xùn)練網(wǎng)絡(luò)估計(jì)候選抓取位姿的魯棒性[18]。表1.1對(duì)比了已有的一些大規(guī)模機(jī)械臂的??抓取數(shù)據(jù)集。??表1.1幾種自動(dòng)采集的機(jī)械臂抓取數(shù)據(jù)集數(shù)據(jù)規(guī)模對(duì)....


圖1.5左圖為谷歌機(jī)械臂抓取數(shù)據(jù)采集“農(nóng)場”,右圖為采集的物體集合??

圖1.5左圖為谷歌機(jī)械臂抓取數(shù)據(jù)采集“農(nóng)場”,右圖為采集的物體集合??

1緒論?浙江大學(xué)碩士學(xué)位論文??物中采集大規(guī)模抓取數(shù)據(jù)集的代價(jià)是非常昂貴的,Jeffrey在仿真環(huán)境中生成了?670w組點(diǎn)??云圖來訓(xùn)練網(wǎng)絡(luò)估計(jì)候選抓取位姿的魯棒性[18]。表1.1對(duì)比了已有的一些大規(guī)模機(jī)械臂的??抓取數(shù)據(jù)集。??表1.1幾種自動(dòng)采集的機(jī)械臂抓取數(shù)據(jù)集數(shù)據(jù)規(guī)模對(duì)....



本文編號(hào):3932615

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3932615.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ca1fb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com