基于強(qiáng)化學(xué)習(xí)的雙足周期步行控制研究
發(fā)布時間:2022-07-27 13:31
雙足機(jī)器人形態(tài)擬人,可在非結(jié)構(gòu)化的復(fù)雜環(huán)境中行走,且無需為其改造人類工作和生活的環(huán)境,得到了研究者的廣泛重視。周期步行是雙足運(yùn)動的基本形態(tài),反映了生物的節(jié)律運(yùn)動。目前提高雙足機(jī)器人周期步行對環(huán)境適應(yīng)能力的步行控制算法,多基于機(jī)器人數(shù)學(xué)模型;將地面視為剛性地面而忽略地面材質(zhì)對步行的影響;缺乏動態(tài)學(xué)習(xí)能力,這些不足限制了雙足機(jī)器人的實際應(yīng)用與發(fā)展。強(qiáng)化學(xué)習(xí)可描述智能體通過與環(huán)境不斷交互而進(jìn)行學(xué)習(xí)的過程,可實現(xiàn)無模型的控制器設(shè)計,適用于不同的工作環(huán)境,體現(xiàn)了生物動態(tài)學(xué)習(xí)的特點。本文針對雙足機(jī)器人周期步行問題,提出了基于強(qiáng)化學(xué)習(xí)的步行控制方法,可實現(xiàn)仿人、穩(wěn)定和具有適應(yīng)性的雙足周期步態(tài)。主要研究內(nèi)容為:首先,提出提高被動步行環(huán)境適應(yīng)性的平面周期步行控制器。在剛性地面假設(shè)下,建立雙足步行的混雜動力學(xué)方程,作為模擬機(jī)器人行走的訓(xùn)練環(huán)境;基于胞映射法進(jìn)行被動步行初始值求解,得到了被動步行的周期步態(tài),并進(jìn)行了步態(tài)的穩(wěn)定性分析;基于深度Q網(wǎng)絡(luò)設(shè)計平面周期步行控制器。研究結(jié)果表明:在強(qiáng)化學(xué)習(xí)試錯的過程中,將穩(wěn)定的被動步行步態(tài)作為訓(xùn)練的參考軌跡,既保持被動步行步態(tài)自然的優(yōu)點,又可有效降低訓(xùn)練次數(shù),訓(xùn)練僅需5...
【文章頁數(shù)】:131 頁
【學(xué)位級別】:博士
【文章目錄】:
論文創(chuàng)新點
摘要
ABSTRACT
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究綜述
1.3 本文研究內(nèi)容
2 雙足周期步行的預(yù)備知識
2.1 雙足步行的基本概念
2.2 被動節(jié)律運(yùn)動
2.3 主動節(jié)律運(yùn)動
2.4 強(qiáng)化學(xué)習(xí)
2.5 本章小結(jié)
3 剛性地面假設(shè)下的平面周期步行控制
3.1 引言
3.2 步行控制器總體框架
3.3 剛性地面假設(shè)下的雙足機(jī)器人行走環(huán)境
3.4 被動步行求解及特性分析
3.5 基于強(qiáng)化學(xué)習(xí)的步行控制器實現(xiàn)
3.6 本章小結(jié)
4 柔性地面假設(shè)下的平面周期步行控制
4.1 引言
4.2 步行控制器總體框架
4.3 柔性地面假設(shè)下的雙足機(jī)器人行走環(huán)境
4.4 地面接觸參數(shù)對被動步行影響分析
4.5 基于強(qiáng)化學(xué)習(xí)的步行控制器實現(xiàn)
4.6 本章小結(jié)
5 多關(guān)節(jié)雙足機(jī)器人的三維周期步行控制
5.1 引言
5.2 步行控制器總體框架
5.3 基于CPG的步態(tài)規(guī)劃
5.4 基于強(qiáng)化學(xué)習(xí)的步行控制
5.5 物理樣機(jī)試驗
5.6 本章小結(jié)
6 總結(jié)與展望
6.1 全文總結(jié)
6.2 研究展望
附錄A 剛性地面假設(shè)下的雙足機(jī)器人動力學(xué)
附錄B 柔性地面假設(shè)下的機(jī)器人-地面耦合動力學(xué)
附錄C 對比控制器:能量成型控制器
參考文獻(xiàn)
攻讀博士期間發(fā)表的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]仿人服務(wù)機(jī)器人發(fā)展與研究現(xiàn)狀[J]. 顏云輝,徐靖,陸志國,宋克臣,柳博航. 機(jī)器人. 2017(04)
[2]BHR-3型仿人機(jī)器人設(shè)計[J]. 葉軍,段星光,陳學(xué)超. 機(jī)器人技術(shù)與應(yīng)用. 2011(02)
[3]強(qiáng)化學(xué)習(xí)研究綜述[J]. 陳學(xué)松,楊宜民. 計算機(jī)應(yīng)用研究. 2010(08)
[4]小型仿人機(jī)器人THBIP-Ⅱ的研制與開發(fā)[J]. 伊強(qiáng),陳懇,劉莉,付成龍. 機(jī)器人. 2009(06)
[5]Passive walker that can walk down steps:simulations and experiments[J]. Ning Liu Junfeng Li Tianshu Wang School of Aerospace,Tsinghua University,Beijing 100084,China. Acta Mechanica Sinica. 2008(05)
[6]動態(tài)步行雙足機(jī)器人THR-I的設(shè)計與實現(xiàn)[J]. 付成龍,陳懇,王健美,黃元林. 機(jī)器人. 2008(02)
[7]兩足機(jī)器人步態(tài)的參數(shù)化設(shè)計及優(yōu)化[J]. 竇瑞軍,馬培蓀,謝玲. 機(jī)械工程學(xué)報. 2002(04)
[8]無側(cè)擺關(guān)節(jié)型兩足步行機(jī)器人轉(zhuǎn)彎步態(tài)規(guī)劃方法的研究[J]. 譚冠政,朱劍英. 中南礦冶學(xué)院學(xué)報. 1994(01)
博士論文
[1]液壓驅(qū)動雙足機(jī)器人及其動態(tài)平衡運(yùn)動控制研究[D]. 劉國才.哈爾濱工業(yè)大學(xué) 2017
[2]柔性地面上欠驅(qū)動雙足步行穩(wěn)定性控制[D]. 王楊.武漢大學(xué) 2016
[3]基于欠驅(qū)動性的雙足機(jī)器人高能效行走控制研究[D]. 王紫東.浙江大學(xué) 2016
[4]欠驅(qū)動雙足機(jī)器人動態(tài)步行規(guī)劃與抗擾動控制[D]. 李超.浙江大學(xué) 2015
[5]仿人機(jī)器人乒乓球擊打運(yùn)動規(guī)劃與穩(wěn)定控制[D]. 李敬.北京理工大學(xué) 2015
[6]兼顧穩(wěn)定與靈活的欠驅(qū)動雙足機(jī)器人奔跑運(yùn)動控制研究[D]. 易陽.浙江大學(xué) 2015
[7]仿人機(jī)器人的步態(tài)規(guī)劃和步行控制研究[D]. 付根平.廣東工業(yè)大學(xué) 2013
[8]雙足被動步行機(jī)器人性能分析及一種動力輸入方法研究[D]. 倪修華.哈爾濱工業(yè)大學(xué) 2010
[9]欠驅(qū)動雙足機(jī)器人行走步態(tài)建模與動態(tài)行走控制策略研究[D]. 張佩杰.吉林大學(xué) 2010
[10]半被動雙足機(jī)器人的設(shè)計與再勵學(xué)習(xí)控制[D]. 毛勇.清華大學(xué) 2007
碩士論文
[1]雙足機(jī)器人快速在線步態(tài)切換及其實驗[D]. 張志宏.浙江大學(xué) 2017
[2]胞映射方法在電力電子非線性系統(tǒng)混沌檢測中的應(yīng)用[D]. 李斌華.廣州大學(xué) 2016
[3]高速步行機(jī)器人機(jī)構(gòu)及測控系統(tǒng)設(shè)計[D]. 戴玉東.東南大學(xué) 2016
[4]窄足3D半被動行走器步態(tài)穩(wěn)定性與研究[D]. 李永.重慶郵電大學(xué) 2016
[5]強(qiáng)化學(xué)習(xí)在仿人機(jī)器人行走穩(wěn)定控制上的研究及實現(xiàn)[D]. 陳奇石.華南理工大學(xué) 2016
[6]基于中樞模式發(fā)生器的仿人機(jī)器人運(yùn)動規(guī)劃研究[D]. 張雪.哈爾濱工業(yè)大學(xué) 2016
[7]基于關(guān)節(jié)耦合與分層反射的雙足機(jī)器人CPG控制方法研究[D]. 吳靜遠(yuǎn).哈爾濱工業(yè)大學(xué) 2015
[8]數(shù)據(jù)驅(qū)動的NAO機(jī)器人關(guān)節(jié)運(yùn)動控制[D]. 孫漫漫.武漢理工大學(xué) 2014
[9]有膝雙足被動步行機(jī)器人的運(yùn)動特性和穩(wěn)定性研究[D]. 崔偉.哈爾濱工業(yè)大學(xué) 2013
[10]六足機(jī)器人控制系統(tǒng)研究與設(shè)計[D]. 劉鵬飛.哈爾濱理工大學(xué) 2012
本文編號:3665543
【文章頁數(shù)】:131 頁
【學(xué)位級別】:博士
【文章目錄】:
論文創(chuàng)新點
摘要
ABSTRACT
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究綜述
1.3 本文研究內(nèi)容
2 雙足周期步行的預(yù)備知識
2.1 雙足步行的基本概念
2.2 被動節(jié)律運(yùn)動
2.3 主動節(jié)律運(yùn)動
2.4 強(qiáng)化學(xué)習(xí)
2.5 本章小結(jié)
3 剛性地面假設(shè)下的平面周期步行控制
3.1 引言
3.2 步行控制器總體框架
3.3 剛性地面假設(shè)下的雙足機(jī)器人行走環(huán)境
3.4 被動步行求解及特性分析
3.5 基于強(qiáng)化學(xué)習(xí)的步行控制器實現(xiàn)
3.6 本章小結(jié)
4 柔性地面假設(shè)下的平面周期步行控制
4.1 引言
4.2 步行控制器總體框架
4.3 柔性地面假設(shè)下的雙足機(jī)器人行走環(huán)境
4.4 地面接觸參數(shù)對被動步行影響分析
4.5 基于強(qiáng)化學(xué)習(xí)的步行控制器實現(xiàn)
4.6 本章小結(jié)
5 多關(guān)節(jié)雙足機(jī)器人的三維周期步行控制
5.1 引言
5.2 步行控制器總體框架
5.3 基于CPG的步態(tài)規(guī)劃
5.4 基于強(qiáng)化學(xué)習(xí)的步行控制
5.5 物理樣機(jī)試驗
5.6 本章小結(jié)
6 總結(jié)與展望
6.1 全文總結(jié)
6.2 研究展望
附錄A 剛性地面假設(shè)下的雙足機(jī)器人動力學(xué)
附錄B 柔性地面假設(shè)下的機(jī)器人-地面耦合動力學(xué)
附錄C 對比控制器:能量成型控制器
參考文獻(xiàn)
攻讀博士期間發(fā)表的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]仿人服務(wù)機(jī)器人發(fā)展與研究現(xiàn)狀[J]. 顏云輝,徐靖,陸志國,宋克臣,柳博航. 機(jī)器人. 2017(04)
[2]BHR-3型仿人機(jī)器人設(shè)計[J]. 葉軍,段星光,陳學(xué)超. 機(jī)器人技術(shù)與應(yīng)用. 2011(02)
[3]強(qiáng)化學(xué)習(xí)研究綜述[J]. 陳學(xué)松,楊宜民. 計算機(jī)應(yīng)用研究. 2010(08)
[4]小型仿人機(jī)器人THBIP-Ⅱ的研制與開發(fā)[J]. 伊強(qiáng),陳懇,劉莉,付成龍. 機(jī)器人. 2009(06)
[5]Passive walker that can walk down steps:simulations and experiments[J]. Ning Liu Junfeng Li Tianshu Wang School of Aerospace,Tsinghua University,Beijing 100084,China. Acta Mechanica Sinica. 2008(05)
[6]動態(tài)步行雙足機(jī)器人THR-I的設(shè)計與實現(xiàn)[J]. 付成龍,陳懇,王健美,黃元林. 機(jī)器人. 2008(02)
[7]兩足機(jī)器人步態(tài)的參數(shù)化設(shè)計及優(yōu)化[J]. 竇瑞軍,馬培蓀,謝玲. 機(jī)械工程學(xué)報. 2002(04)
[8]無側(cè)擺關(guān)節(jié)型兩足步行機(jī)器人轉(zhuǎn)彎步態(tài)規(guī)劃方法的研究[J]. 譚冠政,朱劍英. 中南礦冶學(xué)院學(xué)報. 1994(01)
博士論文
[1]液壓驅(qū)動雙足機(jī)器人及其動態(tài)平衡運(yùn)動控制研究[D]. 劉國才.哈爾濱工業(yè)大學(xué) 2017
[2]柔性地面上欠驅(qū)動雙足步行穩(wěn)定性控制[D]. 王楊.武漢大學(xué) 2016
[3]基于欠驅(qū)動性的雙足機(jī)器人高能效行走控制研究[D]. 王紫東.浙江大學(xué) 2016
[4]欠驅(qū)動雙足機(jī)器人動態(tài)步行規(guī)劃與抗擾動控制[D]. 李超.浙江大學(xué) 2015
[5]仿人機(jī)器人乒乓球擊打運(yùn)動規(guī)劃與穩(wěn)定控制[D]. 李敬.北京理工大學(xué) 2015
[6]兼顧穩(wěn)定與靈活的欠驅(qū)動雙足機(jī)器人奔跑運(yùn)動控制研究[D]. 易陽.浙江大學(xué) 2015
[7]仿人機(jī)器人的步態(tài)規(guī)劃和步行控制研究[D]. 付根平.廣東工業(yè)大學(xué) 2013
[8]雙足被動步行機(jī)器人性能分析及一種動力輸入方法研究[D]. 倪修華.哈爾濱工業(yè)大學(xué) 2010
[9]欠驅(qū)動雙足機(jī)器人行走步態(tài)建模與動態(tài)行走控制策略研究[D]. 張佩杰.吉林大學(xué) 2010
[10]半被動雙足機(jī)器人的設(shè)計與再勵學(xué)習(xí)控制[D]. 毛勇.清華大學(xué) 2007
碩士論文
[1]雙足機(jī)器人快速在線步態(tài)切換及其實驗[D]. 張志宏.浙江大學(xué) 2017
[2]胞映射方法在電力電子非線性系統(tǒng)混沌檢測中的應(yīng)用[D]. 李斌華.廣州大學(xué) 2016
[3]高速步行機(jī)器人機(jī)構(gòu)及測控系統(tǒng)設(shè)計[D]. 戴玉東.東南大學(xué) 2016
[4]窄足3D半被動行走器步態(tài)穩(wěn)定性與研究[D]. 李永.重慶郵電大學(xué) 2016
[5]強(qiáng)化學(xué)習(xí)在仿人機(jī)器人行走穩(wěn)定控制上的研究及實現(xiàn)[D]. 陳奇石.華南理工大學(xué) 2016
[6]基于中樞模式發(fā)生器的仿人機(jī)器人運(yùn)動規(guī)劃研究[D]. 張雪.哈爾濱工業(yè)大學(xué) 2016
[7]基于關(guān)節(jié)耦合與分層反射的雙足機(jī)器人CPG控制方法研究[D]. 吳靜遠(yuǎn).哈爾濱工業(yè)大學(xué) 2015
[8]數(shù)據(jù)驅(qū)動的NAO機(jī)器人關(guān)節(jié)運(yùn)動控制[D]. 孫漫漫.武漢理工大學(xué) 2014
[9]有膝雙足被動步行機(jī)器人的運(yùn)動特性和穩(wěn)定性研究[D]. 崔偉.哈爾濱工業(yè)大學(xué) 2013
[10]六足機(jī)器人控制系統(tǒng)研究與設(shè)計[D]. 劉鵬飛.哈爾濱理工大學(xué) 2012
本文編號:3665543
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3665543.html
最近更新
教材專著