基于增強(qiáng)學(xué)習(xí)的2D雙足機(jī)器人步行控制系統(tǒng)研究
發(fā)布時間:2021-08-09 01:22
2D雙足機(jī)器人步行控制是機(jī)器人研究領(lǐng)域關(guān)鍵性的基礎(chǔ)研究問題之一。對于實際的雙足機(jī)器人由于其結(jié)構(gòu)復(fù)雜一般難以為其建立精確的動力學(xué)模型,所以傳統(tǒng)的基于模型的分析法很難取得較好的控制效果。隨著近些年來智能算法的興起,研究者們逐漸在雙足機(jī)器人步行控制中引入增強(qiáng)學(xué)習(xí)算法,但現(xiàn)行的基于增強(qiáng)學(xué)習(xí)的步行控制系統(tǒng)或要加入?yún)⒖疾綉B(tài)而不能完全脫離機(jī)器人的動力學(xué)模型,或僅能處理離散狀態(tài)空間和動作空間的情形無法實現(xiàn)精確的控制。因此,本文提出了一個基于均值-異步的優(yōu)勢動作-評論(Mean-Asynchronous Advantage Actor-Critic,M-A3C)算法的2D雙足動態(tài)步行學(xué)習(xí)方法,該方法無需引入?yún)⒖疾綉B(tài)并且能直接處理連續(xù)空間問題。在分析了2D雙足機(jī)器人動態(tài)步行過程的基礎(chǔ)上,本文對原始的最簡行走模型進(jìn)行了改進(jìn)提出了基于脈沖推力和髖部驅(qū)動的帶伸縮膝關(guān)節(jié)的最簡行走模型,并獲得該模型的一個一周期步態(tài)。依據(jù)該抽象的行走模型,本文設(shè)計制作了一個帶伸縮膝關(guān)節(jié)的2D雙足機(jī)器人及其在物理仿真平臺中的虛擬版本以用于測試本文提出的動態(tài)步行學(xué)習(xí)方法。本文提出的動態(tài)步行學(xué)習(xí)方法的核心是M-A3C算法,該算法是本文基于...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
機(jī)器人MABEL
生學(xué)原理應(yīng)用于雙足機(jī)器人步行控制中[8],采用中樞模式發(fā)生器(Centralerator , CPG)通過神經(jīng)網(wǎng)絡(luò)模型的離線訓(xùn)練和在線修正來控制機(jī)器人的步于仿生學(xué)的控制方法需要采集人類步行的數(shù)據(jù),而由于人類自身生理結(jié)器人存在差異,采集的數(shù)據(jù)往往不能與機(jī)器人很好地匹配。4. 混合零動態(tài)控制方法J.W.Grizzle 等人提出利用混合零動態(tài)和虛擬限制條件控制二維欠驅(qū)動雙走[2,9],隨后 Chevallereau 等人將此類方法推廣到三維欠驅(qū)動機(jī)器人的步0]。采用該步行控制方法的機(jī)器人以美國密歇根大學(xué)的 MABEL 和最新的人最為著名,分別如圖 1.2 和圖 1.3 所示。該控制方法需要對雙足機(jī)器人非線性模型,而對于結(jié)構(gòu)繁雜的雙足機(jī)器人一般很難建立準(zhǔn)確的數(shù)學(xué)模果機(jī)器人結(jié)構(gòu)發(fā)生變化整個機(jī)器人的數(shù)學(xué)模型需要再一次重新推導(dǎo),這制器設(shè)計過程變得極為繁瑣,不利于雙足機(jī)器人的廣泛應(yīng)用。
cGeer 在 Mochon 和 McMah行器[3],該步行器實現(xiàn)了在斜了膝關(guān)節(jié)[4],同樣也實現(xiàn)了在的誕生,被動動態(tài)行走理論特性實現(xiàn)周期步態(tài)步行,以具備爬坡、轉(zhuǎn)彎和暫停的能些原因,Collins 等人在被動平面上的穩(wěn)定行走[5],并提動動態(tài)行走理論設(shè)計實現(xiàn)了行走了 54 個小時、總里程達(dá)了驅(qū)動器,但此類步行器還
本文編號:3331074
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
機(jī)器人MABEL
生學(xué)原理應(yīng)用于雙足機(jī)器人步行控制中[8],采用中樞模式發(fā)生器(Centralerator , CPG)通過神經(jīng)網(wǎng)絡(luò)模型的離線訓(xùn)練和在線修正來控制機(jī)器人的步于仿生學(xué)的控制方法需要采集人類步行的數(shù)據(jù),而由于人類自身生理結(jié)器人存在差異,采集的數(shù)據(jù)往往不能與機(jī)器人很好地匹配。4. 混合零動態(tài)控制方法J.W.Grizzle 等人提出利用混合零動態(tài)和虛擬限制條件控制二維欠驅(qū)動雙走[2,9],隨后 Chevallereau 等人將此類方法推廣到三維欠驅(qū)動機(jī)器人的步0]。采用該步行控制方法的機(jī)器人以美國密歇根大學(xué)的 MABEL 和最新的人最為著名,分別如圖 1.2 和圖 1.3 所示。該控制方法需要對雙足機(jī)器人非線性模型,而對于結(jié)構(gòu)繁雜的雙足機(jī)器人一般很難建立準(zhǔn)確的數(shù)學(xué)模果機(jī)器人結(jié)構(gòu)發(fā)生變化整個機(jī)器人的數(shù)學(xué)模型需要再一次重新推導(dǎo),這制器設(shè)計過程變得極為繁瑣,不利于雙足機(jī)器人的廣泛應(yīng)用。
cGeer 在 Mochon 和 McMah行器[3],該步行器實現(xiàn)了在斜了膝關(guān)節(jié)[4],同樣也實現(xiàn)了在的誕生,被動動態(tài)行走理論特性實現(xiàn)周期步態(tài)步行,以具備爬坡、轉(zhuǎn)彎和暫停的能些原因,Collins 等人在被動平面上的穩(wěn)定行走[5],并提動動態(tài)行走理論設(shè)計實現(xiàn)了行走了 54 個小時、總里程達(dá)了驅(qū)動器,但此類步行器還
本文編號:3331074
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3331074.html
最近更新
教材專著