學(xué)習(xí)人類策略在機(jī)械臂的應(yīng)用研究
發(fā)布時(shí)間:2017-11-20 20:32
本文關(guān)鍵詞:學(xué)習(xí)人類策略在機(jī)械臂的應(yīng)用研究
更多相關(guān)文章: 運(yùn)動(dòng)學(xué) 人類學(xué)系策略 極限學(xué)習(xí)機(jī) 自治動(dòng)態(tài)系統(tǒng) 穩(wěn)定性
【摘要】:本課題面向日益增長(zhǎng)的服務(wù)機(jī)器人研發(fā)需求,尤其是服務(wù)機(jī)器人中的所需的機(jī)械臂,利用學(xué)習(xí)人類控制策略進(jìn)行智能控制技術(shù)的研究。本文首先介紹機(jī)械臂的基礎(chǔ)運(yùn)動(dòng)學(xué)控制,并提出一種機(jī)器人模仿系統(tǒng)。通過正向運(yùn)動(dòng)學(xué),機(jī)械臂能夠從關(guān)節(jié)角計(jì)算出末端位置,通過反向運(yùn)動(dòng)學(xué),又能夠計(jì)算出合適的關(guān)節(jié)角以期到達(dá)設(shè)定的末端位置。通過捕捉系統(tǒng),如Kinect,在得到人體運(yùn)動(dòng)信息的基礎(chǔ)上,模仿系統(tǒng)將人運(yùn)動(dòng)映射到機(jī)器人的關(guān)節(jié)角,從而使得機(jī)器人能夠?qū)崟r(shí)模仿人運(yùn)動(dòng)。機(jī)器人模仿系統(tǒng)只是盡量精確地復(fù)制人的運(yùn)動(dòng),學(xué)習(xí)人類控制策略引入學(xué)習(xí)的方法提取運(yùn)動(dòng)策略。其一般劃分為三階段:示例階段,學(xué)習(xí)階段和復(fù)制階段。在示例階段,人類導(dǎo)師主動(dòng)地控制機(jī)器人完成一些運(yùn)動(dòng),并將運(yùn)動(dòng)中機(jī)器人的狀態(tài)變量存儲(chǔ)起來。學(xué)習(xí)階段通過機(jī)器學(xué)習(xí)的方法,從示例中學(xué)習(xí)一個(gè)控制模型,該模型需要具有泛化能力。當(dāng)機(jī)器人遇到不同的場(chǎng)景時(shí),復(fù)制階段利用學(xué)習(xí)到的模型得到一個(gè)具有相似特征的軌跡。同時(shí)我們還需要考慮魯棒性問題,即學(xué)習(xí)到的軌跡具有穩(wěn)定性,總是能夠到達(dá)特定的目標(biāo)點(diǎn)。本文的算法是基于極限學(xué)習(xí)機(jī),通過將機(jī)械臂點(diǎn)到點(diǎn)的運(yùn)動(dòng)建模為自治動(dòng)態(tài)系統(tǒng),即不顯含時(shí)間變量的動(dòng)態(tài)方程,并利用該方法進(jìn)行學(xué)習(xí)。在給定初始點(diǎn)和目標(biāo)點(diǎn)的基礎(chǔ)上,算法利用數(shù)值積分完成復(fù)制階段的軌跡生成。我們通過李雅普諾夫控制理論推導(dǎo)出能夠使該系統(tǒng)具有全局和局部漸進(jìn)穩(wěn)定的約束條件,并將這些條件加入到基于優(yōu)化的學(xué)習(xí)中去。該系統(tǒng)結(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn),且能取得很好的泛化性和魯棒性。我們實(shí)現(xiàn)該系統(tǒng),并在數(shù)據(jù)集上進(jìn)行模擬和在Nao機(jī)器人上進(jìn)行實(shí)驗(yàn)。模擬和實(shí)驗(yàn)結(jié)果能充分驗(yàn)證學(xué)習(xí)到的系統(tǒng)的穩(wěn)定性,而且對(duì)于時(shí)間擾動(dòng)和空間擾動(dòng),該系統(tǒng)都能有很好的魯棒性。
【學(xué)位授予單位】:中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP241
【參考文獻(xiàn)】
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 金卓軍;逆向增強(qiáng)學(xué)習(xí)和示教學(xué)習(xí)算法研究及其在智能機(jī)器人中的應(yīng)用[D];浙江大學(xué);2011年
,本文編號(hào):1208451
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1208451.html
最近更新
教材專著