面向機器人運動控制的增量式模仿學習技術研究

發(fā)布時間：2020-11-09 09:41

　　模仿學習是機器人操作控制中一種常用的學習方式,傳統(tǒng)的機器人模仿學習過程針對特定的任務逐一構造運動控制模型進行操作任務模仿,導致模仿學習模型的魯棒性較差,可移植性較弱。本文提出的機器人增量式模仿學習框架與人類根據(jù)自身經(jīng)驗進行累積學習的過程相近,其具備在線遷移已經(jīng)學習到的知識的能力,而這一能力是機器人通過小樣本學習進行大規(guī)模的任務操作的重要基礎,也是機器人模仿學習的一個重要發(fā)展方向。本文主要研究增量式模仿學習問題,它是機器人面向多操作任務進行運動控制與行為決策的基礎,本文所提出的模仿學習方法主要分為基于行為克隆的模仿學習和基于逆強化學習的模仿學習。盡管一些現(xiàn)有的方法體現(xiàn)出了模仿學習易于進行機器人動作控制策略學習的優(yōu)勢,但都難以實現(xiàn)在任務數(shù)目多、差異大、工作場景動態(tài)變化等復雜情況下的機器人模仿學習。因此,本文提出了機器人增量式多任務模仿學習問題,并基于增量式學習框架對該問題進行了深入研究,建立了面向機器人運動控制的增量式模仿學習體系,提出了基于行為克隆DMP的增量式多任務模仿學習和基于逆強化學習IRL的增量式多任務模仿學習算法,并將其分別應用在了末端軌跡模仿和行為動作模仿等機器人模仿學習領域的關鍵問題中。本文的主要內(nèi)容如下:首先,提出了面向機器人運動控制的增量式模仿學習問題,從增量式模仿學習的必要性和合理性等方面進行了詳細的論述。建立了增量式模仿學習框架,使得機器人可以從之前學習到的運動控制策略中獲取到相關的經(jīng)驗知識,并不斷的擴充和更新已學習到的知識庫,以便實現(xiàn)在線的多任務模仿學習。其次,分別以基于行為克隆的模仿學習方法DMP和基于逆強化學習的模仿學習方法IRL為例,研究了增量式學習框架在機器人多任務增量式模仿學習問題中的應用。針對基于行為克隆的機器人模仿學習,提出了融合稀疏編碼和DMP的增量式軌跡模仿學習框架;針對基于逆強化學習的機器人模仿學習,提出了融合稀疏編碼和多意圖強化學習的增量式動作策略模仿學習框架。最后,為驗證本文所提出的方法的效果,分別在三種仿真平臺和實體UR5機械臂實驗平臺下進行了機器人多操作控制任務模仿學習實驗,驗證了機器人自主進行在線的新任務模仿學習以及優(yōu)化和構建模仿學習經(jīng)驗知識庫的能力,實現(xiàn)了面向機器人操作控制的增量式多任務模仿學習。
【學位單位】：哈爾濱工業(yè)大學
【學位級別】：碩士
【學位年份】：2019
【中圖分類】：TP242;TP181
【部分圖文】：

示意圖,模仿學習,機器人,關鍵幀

圖 1-1 機器人模仿學習系統(tǒng)示意圖Fig.1-1 Control diagram of the robot imitation learning研究成果中，機器人一般通過人為操控示教器的方式進行遙教過程中，機器人的位姿信息、環(huán)境狀態(tài)及目標位置等信息數(shù)據(jù)中可以分割提取出運動軌跡中的多個關鍵幀，從而使描述一連串關鍵幀狀態(tài)的映射策略和在關鍵幀中間進行轉(zhuǎn)

內(nèi)容,組織結構

本文的主要研究內(nèi)容Fig.1-2Themainresearchcontentofthispaper

模仿學習,分層控制,機器人,行為

圖 2-1 機器人分層控制模仿學習Fig.2-1 Hierarchical control diagram of the robot imitation learning.3 基于行為克隆的模仿學習在本節(jié)中，我們將介紹行為克隆模仿學習（Behavior Clone）方法。行為
【相似文獻】

相關期刊論文前10條

1 姚榮光;;淺談模仿學習與創(chuàng)新學習的關系[J];現(xiàn)代語文(教學研究版);2010年03期

2 艾詩根;;從復制到創(chuàng)新:學生模仿學習能力提升的策略邏輯[J];教育理論與實踐;2018年29期

3 張瑞敏;;中國企業(yè)如何從模仿學習到引領創(chuàng)新?[J];企業(yè)管理;2017年06期

4 羅藝;;模仿學習與高校誠信教育文獻綜述[J];青年與社會;2019年17期

5 ;作文選登[J];瘋狂英語(小學版);2017年03期

6 周曉麗;;藝術在身邊,創(chuàng)意在身邊[J];家教世界;2017年15期

7 陳靜奮;;觀察-模仿學習促我成長[J];幼兒教育;2013年07期

8 李帥龍;張會文;周維佳;;模仿學習方法綜述及其在機器人領域的應用[J];計算機工程與應用;2019年04期

9 吳春輝;;碓井誠:中國便利店制造+IT是未來趨勢[J];公關世界;2018年11期

10 生潤;;淺談小學英語課堂教學中的模仿學習[J];吉林教育;2010年14期

相關博士學位論文前2條

1 馬樂;基于非接觸觀測信息的機器人行為模仿學習[D];沈陽工業(yè)大學;2014年

2 張海峰;復雜網(wǎng)絡上個體的不同行為導致多樣的整體行為[D];中國科學技術大學;2011年

相關碩士學位論文前10條

1 李躍騰;基于生成對抗網(wǎng)絡的模仿學習研究[D];哈爾濱工業(yè)大學;2019年

2 黃悅;面向機器人運動控制的增量式模仿學習技術研究[D];哈爾濱工業(yè)大學;2019年

3 許貞;演示方式對兒童模仿學習的影響研究[D];西北師范大學;2017年

4 陳靜奮;實踐、反思/團隊支持[D];南京師范大學;2012年

5 呂而立（Erli Lyu）;基于模仿學習和隱馬爾可夫模型的人機交互研究[D];哈爾濱工業(yè)大學;2016年

6 孔鑫;基于行為模仿的機器人學習方法的研究[D];河北工業(yè)大學;2006年

7 門玉森;基于軌跡匹配的模仿學習在類人機器人運動行為中的研究[D];北京工業(yè)大學;2016年

8 徐驄馳;具有模仿學習機制的機械臂系統(tǒng)的研究與實現(xiàn)[D];北京工業(yè)大學;2016年

9 匡榮;不同拓撲結構下的復雜網(wǎng)絡鏈路預測研究[D];重慶郵電大學;2017年

10 鄭逸加;基于高斯混合模型的模仿學習算法的優(yōu)化與評價[D];北京工業(yè)大學;2017年

本文編號：2876230

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2876230.html

上一篇：基于滑�？刂频氖称匪淼罓t溫控系統(tǒng)的研究與應用
下一篇：基于PCA-PNN的冷熱沖擊箱制冷系統(tǒng)故障診斷研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向機器人運動控制的增量式模仿學習技術研究