天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

面向機(jī)器人運(yùn)動(dòng)控制的增量式模仿學(xué)習(xí)技術(shù)研究

發(fā)布時(shí)間:2020-11-09 09:41
   模仿學(xué)習(xí)是機(jī)器人操作控制中一種常用的學(xué)習(xí)方式,傳統(tǒng)的機(jī)器人模仿學(xué)習(xí)過程針對特定的任務(wù)逐一構(gòu)造運(yùn)動(dòng)控制模型進(jìn)行操作任務(wù)模仿,導(dǎo)致模仿學(xué)習(xí)模型的魯棒性較差,可移植性較弱。本文提出的機(jī)器人增量式模仿學(xué)習(xí)框架與人類根據(jù)自身經(jīng)驗(yàn)進(jìn)行累積學(xué)習(xí)的過程相近,其具備在線遷移已經(jīng)學(xué)習(xí)到的知識的能力,而這一能力是機(jī)器人通過小樣本學(xué)習(xí)進(jìn)行大規(guī)模的任務(wù)操作的重要基礎(chǔ),也是機(jī)器人模仿學(xué)習(xí)的一個(gè)重要發(fā)展方向。本文主要研究增量式模仿學(xué)習(xí)問題,它是機(jī)器人面向多操作任務(wù)進(jìn)行運(yùn)動(dòng)控制與行為決策的基礎(chǔ),本文所提出的模仿學(xué)習(xí)方法主要分為基于行為克隆的模仿學(xué)習(xí)和基于逆強(qiáng)化學(xué)習(xí)的模仿學(xué)習(xí)。盡管一些現(xiàn)有的方法體現(xiàn)出了模仿學(xué)習(xí)易于進(jìn)行機(jī)器人動(dòng)作控制策略學(xué)習(xí)的優(yōu)勢,但都難以實(shí)現(xiàn)在任務(wù)數(shù)目多、差異大、工作場景動(dòng)態(tài)變化等復(fù)雜情況下的機(jī)器人模仿學(xué)習(xí)。因此,本文提出了機(jī)器人增量式多任務(wù)模仿學(xué)習(xí)問題,并基于增量式學(xué)習(xí)框架對該問題進(jìn)行了深入研究,建立了面向機(jī)器人運(yùn)動(dòng)控制的增量式模仿學(xué)習(xí)體系,提出了基于行為克隆DMP的增量式多任務(wù)模仿學(xué)習(xí)和基于逆強(qiáng)化學(xué)習(xí)IRL的增量式多任務(wù)模仿學(xué)習(xí)算法,并將其分別應(yīng)用在了末端軌跡模仿和行為動(dòng)作模仿等機(jī)器人模仿學(xué)習(xí)領(lǐng)域的關(guān)鍵問題中。本文的主要內(nèi)容如下:首先,提出了面向機(jī)器人運(yùn)動(dòng)控制的增量式模仿學(xué)習(xí)問題,從增量式模仿學(xué)習(xí)的必要性和合理性等方面進(jìn)行了詳細(xì)的論述。建立了增量式模仿學(xué)習(xí)框架,使得機(jī)器人可以從之前學(xué)習(xí)到的運(yùn)動(dòng)控制策略中獲取到相關(guān)的經(jīng)驗(yàn)知識,并不斷的擴(kuò)充和更新已學(xué)習(xí)到的知識庫,以便實(shí)現(xiàn)在線的多任務(wù)模仿學(xué)習(xí)。其次,分別以基于行為克隆的模仿學(xué)習(xí)方法DMP和基于逆強(qiáng)化學(xué)習(xí)的模仿學(xué)習(xí)方法IRL為例,研究了增量式學(xué)習(xí)框架在機(jī)器人多任務(wù)增量式模仿學(xué)習(xí)問題中的應(yīng)用。針對基于行為克隆的機(jī)器人模仿學(xué)習(xí),提出了融合稀疏編碼和DMP的增量式軌跡模仿學(xué)習(xí)框架;針對基于逆強(qiáng)化學(xué)習(xí)的機(jī)器人模仿學(xué)習(xí),提出了融合稀疏編碼和多意圖強(qiáng)化學(xué)習(xí)的增量式動(dòng)作策略模仿學(xué)習(xí)框架。最后,為驗(yàn)證本文所提出的方法的效果,分別在三種仿真平臺和實(shí)體UR5機(jī)械臂實(shí)驗(yàn)平臺下進(jìn)行了機(jī)器人多操作控制任務(wù)模仿學(xué)習(xí)實(shí)驗(yàn),驗(yàn)證了機(jī)器人自主進(jìn)行在線的新任務(wù)模仿學(xué)習(xí)以及優(yōu)化和構(gòu)建模仿學(xué)習(xí)經(jīng)驗(yàn)知識庫的能力,實(shí)現(xiàn)了面向機(jī)器人操作控制的增量式多任務(wù)模仿學(xué)習(xí)。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP242;TP181
【部分圖文】:

示意圖,模仿學(xué)習(xí),機(jī)器人,關(guān)鍵幀


圖 1-1 機(jī)器人模仿學(xué)習(xí)系統(tǒng)示意圖Fig.1-1 Control diagram of the robot imitation learning研究成果中,機(jī)器人一般通過人為操控示教器的方式進(jìn)行遙教過程中,機(jī)器人的位姿信息、環(huán)境狀態(tài)及目標(biāo)位置等信息數(shù)據(jù)中可以分割提取出運(yùn)動(dòng)軌跡中的多個(gè)關(guān)鍵幀,從而使描述一連串關(guān)鍵幀狀態(tài)的映射策略和在關(guān)鍵幀中間進(jìn)行轉(zhuǎn)

內(nèi)容,組織結(jié)構(gòu)


本文的主要研究內(nèi)容Fig.1-2Themainresearchcontentofthispaper

模仿學(xué)習(xí),分層控制,機(jī)器人,行為


圖 2-1 機(jī)器人分層控制模仿學(xué)習(xí)Fig.2-1 Hierarchical control diagram of the robot imitation learning.3 基于行為克隆的模仿學(xué)習(xí)在本節(jié)中,我們將介紹行為克隆模仿學(xué)習(xí)(Behavior Clone)方法。行為
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 姚榮光;;淺談模仿學(xué)習(xí)與創(chuàng)新學(xué)習(xí)的關(guān)系[J];現(xiàn)代語文(教學(xué)研究版);2010年03期

2 艾詩根;;從復(fù)制到創(chuàng)新:學(xué)生模仿學(xué)習(xí)能力提升的策略邏輯[J];教育理論與實(shí)踐;2018年29期

3 張瑞敏;;中國企業(yè)如何從模仿學(xué)習(xí)到引領(lǐng)創(chuàng)新?[J];企業(yè)管理;2017年06期

4 羅藝;;模仿學(xué)習(xí)與高校誠信教育文獻(xiàn)綜述[J];青年與社會(huì);2019年17期

5 ;作文選登[J];瘋狂英語(小學(xué)版);2017年03期

6 周曉麗;;藝術(shù)在身邊,創(chuàng)意在身邊[J];家教世界;2017年15期

7 陳靜奮;;觀察-模仿學(xué)習(xí)促我成長[J];幼兒教育;2013年07期

8 李帥龍;張會(huì)文;周維佳;;模仿學(xué)習(xí)方法綜述及其在機(jī)器人領(lǐng)域的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2019年04期

9 吳春輝;;碓井誠:中國便利店制造+IT是未來趨勢[J];公關(guān)世界;2018年11期

10 生潤;;淺談小學(xué)英語課堂教學(xué)中的模仿學(xué)習(xí)[J];吉林教育;2010年14期


相關(guān)博士學(xué)位論文 前2條

1 馬樂;基于非接觸觀測信息的機(jī)器人行為模仿學(xué)習(xí)[D];沈陽工業(yè)大學(xué);2014年

2 張海峰;復(fù)雜網(wǎng)絡(luò)上個(gè)體的不同行為導(dǎo)致多樣的整體行為[D];中國科學(xué)技術(shù)大學(xué);2011年


相關(guān)碩士學(xué)位論文 前10條

1 李躍騰;基于生成對抗網(wǎng)絡(luò)的模仿學(xué)習(xí)研究[D];哈爾濱工業(yè)大學(xué);2019年

2 黃悅;面向機(jī)器人運(yùn)動(dòng)控制的增量式模仿學(xué)習(xí)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2019年

3 許貞;演示方式對兒童模仿學(xué)習(xí)的影響研究[D];西北師范大學(xué);2017年

4 陳靜奮;實(shí)踐、反思/團(tuán)隊(duì)支持[D];南京師范大學(xué);2012年

5 呂而立(Erli Lyu);基于模仿學(xué)習(xí)和隱馬爾可夫模型的人機(jī)交互研究[D];哈爾濱工業(yè)大學(xué);2016年

6 孔鑫;基于行為模仿的機(jī)器人學(xué)習(xí)方法的研究[D];河北工業(yè)大學(xué);2006年

7 門玉森;基于軌跡匹配的模仿學(xué)習(xí)在類人機(jī)器人運(yùn)動(dòng)行為中的研究[D];北京工業(yè)大學(xué);2016年

8 徐驄馳;具有模仿學(xué)習(xí)機(jī)制的機(jī)械臂系統(tǒng)的研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2016年

9 匡榮;不同拓?fù)浣Y(jié)構(gòu)下的復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測研究[D];重慶郵電大學(xué);2017年

10 鄭逸加;基于高斯混合模型的模仿學(xué)習(xí)算法的優(yōu)化與評價(jià)[D];北京工業(yè)大學(xué);2017年



本文編號:2876230

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2876230.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb844***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com