天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于強(qiáng)化學(xué)習(xí)的物體抓取方法研究

發(fā)布時(shí)間:2022-09-30 12:35
  當(dāng)前是智能化的時(shí)代,無論是對(duì)于傳統(tǒng)的工業(yè)機(jī)器人,還是對(duì)于目前技術(shù)并不太成熟的服務(wù)機(jī)器人,都提出了新的挑戰(zhàn)。而作為機(jī)器人的一項(xiàng)非常重要的能力,機(jī)械臂抓取物體一直是國內(nèi)外研究的熱點(diǎn)。隨著深度學(xué)習(xí)的不斷發(fā)展,基于計(jì)算機(jī)視覺的方法雖然已經(jīng)有很高的抓取成功率,但其效率和魯棒性較差。強(qiáng)化學(xué)習(xí)的抓取方法能夠在物品種類繁多且位姿任意擺放的環(huán)境下,通過自監(jiān)督學(xué)習(xí)的方式有效的完成抓取任務(wù)。首先,闡述了基于計(jì)算機(jī)視覺的傳統(tǒng)抓取方法和強(qiáng)化學(xué)習(xí)的基本原理,并且根據(jù)目標(biāo)策略和行為策略的異同,分為在策略和離策略。在策略只利用目前已知的最優(yōu)選擇,容易收斂到局部最優(yōu)。相反,離策略通過保持探索,得到多樣化的數(shù)據(jù),來到達(dá)局部最優(yōu);陔x策略的TD3算法在Mujoco環(huán)境中有較好的效果,但是卻并不適用于機(jī)械臂抓取任務(wù)。利用無導(dǎo)數(shù)優(yōu)化方法CEM代替TD3中的確定性策略(CEM-TD3),解決了TD3算法中環(huán)境獎(jiǎng)勵(lì)稀疏的問題,使其更適用于物體抓取工作。其次,針對(duì)CEM-TD3算法中的Q函數(shù)進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)。抓取模型以卷積神經(jīng)網(wǎng)絡(luò)為主要結(jié)構(gòu),輸入層分為狀態(tài)和動(dòng)作,狀態(tài)需要經(jīng)過卷積層提取特征,動(dòng)作則經(jīng)過全連接層后與其相加,輸出為Q值... 

【文章頁數(shù)】:66 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基于計(jì)算機(jī)視覺的抓取物體方法
        1.2.2 基于深度強(qiáng)化學(xué)習(xí)的抓取物體方法
    1.3 本文主要研究內(nèi)容和結(jié)構(gòu)安排
        1.3.1 主要研究內(nèi)容
        1.3.2 論文結(jié)構(gòu)
第2章 機(jī)械臂運(yùn)動(dòng)規(guī)劃方法
    2.1 引言
    2.2 基于計(jì)算機(jī)視覺的物體抓取方法
        2.2.1 康奈爾數(shù)據(jù)集
        2.2.2 基于計(jì)算機(jī)視覺的算法模型
        2.2.3 基于計(jì)算機(jī)視覺的算法評(píng)估標(biāo)準(zhǔn)
    2.3 基于深度強(qiáng)化學(xué)習(xí)的物體抓取方法
        2.3.1 深度強(qiáng)化學(xué)習(xí)基本原理
        2.3.2 基于在策略的PPO算法
    2.4 本章小結(jié)
第3章 基于CEM-TD3物體抓取算法
    3.1 動(dòng)機(jī)
    3.2 基于離策略的TD3算法
        3.2.1 DDPG算法
        3.2.2 TD3算法
    3.3 CEM算法
    3.4 基于CEM算法的TD3改進(jìn)
    3.5 算法架構(gòu)
    3.6 本章小結(jié)
第4章 物體抓取CEM-TD3算法的網(wǎng)絡(luò)設(shè)計(jì)與實(shí)現(xiàn)
    4.1 引言
    4.2 CEM-TD3算法網(wǎng)絡(luò)設(shè)計(jì)
        4.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
        4.2.2 卷積層
        4.2.3 池化層
        4.2.4 殘差網(wǎng)絡(luò)
        4.2.5 損失函數(shù)
        4.2.6 激活函數(shù)
    4.3 CEM-TD3算法網(wǎng)絡(luò)訓(xùn)練
        4.3.1 優(yōu)化方法
        4.3.2 防止過擬合
    4.4 仿真實(shí)驗(yàn)結(jié)果分析
        4.4.1 仿真實(shí)驗(yàn)環(huán)境搭建
        4.4.2 仿真實(shí)驗(yàn)設(shè)置
        4.4.3 實(shí)驗(yàn)結(jié)果與分析
    4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于三級(jí)卷積神經(jīng)網(wǎng)絡(luò)的物體抓取檢測(cè)[J]. 喻群超,尚偉偉,張馳.  機(jī)器人. 2018(05)
[2]基于深度學(xué)習(xí)的機(jī)器人抓取位置檢測(cè)方法[J]. 閆哲,杜學(xué)丹,曹淼,蔡瑩皓,魯濤,王碩.  高技術(shù)通訊. 2018(01)

碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的機(jī)器人抓取方法研究[D]. 董貫濤.哈爾濱工業(yè)大學(xué) 2019
[2]基于深度圖像和深度學(xué)習(xí)的機(jī)器人抓取檢測(cè)算法研究[D]. 王斌.浙江大學(xué) 2019



本文編號(hào):3683564

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3683564.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bdcae***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com