天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

學習人類策略在機械臂的應用研究

發(fā)布時間:2017-11-20 20:32

  本文關鍵詞:學習人類策略在機械臂的應用研究


  更多相關文章: 運動學 人類學系策略 極限學習機 自治動態(tài)系統(tǒng) 穩(wěn)定性


【摘要】:本課題面向日益增長的服務機器人研發(fā)需求,尤其是服務機器人中的所需的機械臂,利用學習人類控制策略進行智能控制技術(shù)的研究。本文首先介紹機械臂的基礎運動學控制,并提出一種機器人模仿系統(tǒng)。通過正向運動學,機械臂能夠從關節(jié)角計算出末端位置,通過反向運動學,又能夠計算出合適的關節(jié)角以期到達設定的末端位置。通過捕捉系統(tǒng),如Kinect,在得到人體運動信息的基礎上,模仿系統(tǒng)將人運動映射到機器人的關節(jié)角,從而使得機器人能夠?qū)崟r模仿人運動。機器人模仿系統(tǒng)只是盡量精確地復制人的運動,學習人類控制策略引入學習的方法提取運動策略。其一般劃分為三階段:示例階段,學習階段和復制階段。在示例階段,人類導師主動地控制機器人完成一些運動,并將運動中機器人的狀態(tài)變量存儲起來。學習階段通過機器學習的方法,從示例中學習一個控制模型,該模型需要具有泛化能力。當機器人遇到不同的場景時,復制階段利用學習到的模型得到一個具有相似特征的軌跡。同時我們還需要考慮魯棒性問題,即學習到的軌跡具有穩(wěn)定性,總是能夠到達特定的目標點。本文的算法是基于極限學習機,通過將機械臂點到點的運動建模為自治動態(tài)系統(tǒng),即不顯含時間變量的動態(tài)方程,并利用該方法進行學習。在給定初始點和目標點的基礎上,算法利用數(shù)值積分完成復制階段的軌跡生成。我們通過李雅普諾夫控制理論推導出能夠使該系統(tǒng)具有全局和局部漸進穩(wěn)定的約束條件,并將這些條件加入到基于優(yōu)化的學習中去。該系統(tǒng)結(jié)構(gòu)簡單,易于實現(xiàn),且能取得很好的泛化性和魯棒性。我們實現(xiàn)該系統(tǒng),并在數(shù)據(jù)集上進行模擬和在Nao機器人上進行實驗。模擬和實驗結(jié)果能充分驗證學習到的系統(tǒng)的穩(wěn)定性,而且對于時間擾動和空間擾動,該系統(tǒng)都能有很好的魯棒性。
【學位授予單位】:中國科學院深圳先進技術(shù)研究院
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP241

【參考文獻】

中國博士學位論文全文數(shù)據(jù)庫 前1條

1 金卓軍;逆向增強學習和示教學習算法研究及其在智能機器人中的應用[D];浙江大學;2011年

,

本文編號:1208451

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1208451.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aa0cc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com