上肢康復(fù)機(jī)器人的增強(qiáng)學(xué)習(xí)控制方法研究
本文關(guān)鍵詞:上肢康復(fù)機(jī)器人的增強(qiáng)學(xué)習(xí)控制方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:上肢康復(fù)機(jī)器人是近年來康復(fù)機(jī)器人研究領(lǐng)域的熱點(diǎn)之一。上肢康復(fù)機(jī)器人因其復(fù)雜的動(dòng)力特性和多變的工作環(huán)境,使得它的運(yùn)動(dòng)控制設(shè)計(jì)極具挑戰(zhàn)性。為解決這一問題,本文基于自適應(yīng)評(píng)價(jià)增強(qiáng)學(xué)習(xí)算法,提出了幾種運(yùn)動(dòng)控制算法以解決康復(fù)機(jī)器人的運(yùn)動(dòng)控制問題。主要工作概括如下:(1)針對(duì)存在模型參數(shù)不確定及外界干擾的上肢康復(fù)機(jī)器人運(yùn)動(dòng)控制問題,基于自適應(yīng)評(píng)價(jià)算法設(shè)計(jì)了上肢康復(fù)機(jī)器人自適應(yīng)模糊執(zhí)行-神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)監(jiān)督增強(qiáng)學(xué)習(xí)控制方案。該方案在系統(tǒng)模型參數(shù)不確定的情況下,利用方案中的模糊執(zhí)行器及神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)器逼近康復(fù)機(jī)器人系統(tǒng)的模型,并結(jié)合監(jiān)督控制器通過序貫決策機(jī)制給出一個(gè)適宜的控制策略,進(jìn)而使上肢康復(fù)機(jī)器人完成期望的運(yùn)動(dòng)控制任務(wù)且對(duì)外界干擾具有很好的魯棒性。理論分析表明,所構(gòu)建的運(yùn)動(dòng)控制方案是模型參數(shù)獨(dú)立的且不必預(yù)知外界干擾的上界。仿真結(jié)果證明了所提控制方案的可行性和有效性。(2)針對(duì)存在動(dòng)態(tài)不確定性因素(如患肢病情變化、負(fù)載擾動(dòng)等)的上肢康復(fù)機(jī)器人的魯棒跟蹤控制問題,基于自適應(yīng)評(píng)價(jià)算法,設(shè)計(jì)了上肢康復(fù)機(jī)器人魯棒模糊自適應(yīng)評(píng)價(jià)控制方案。該方案利用模糊自適應(yīng)評(píng)價(jià)控制算法去逼近康復(fù)機(jī)器人與患肢的接觸動(dòng)力特性并給出一個(gè)適宜控制策略,同時(shí)該方案還利用魯棒積分誤差反饋控制策略來提高閉環(huán)系統(tǒng)的抗干擾能力,從而使系統(tǒng)獲得了在治療目標(biāo)附近一個(gè)較大范圍的魯棒跟蹤。理論分析證明了該方案的穩(wěn)定性與可行性。仿真結(jié)果表明了所設(shè)計(jì)的控制方案能夠較好地適應(yīng)患者患肢病情變化且對(duì)負(fù)載擾動(dòng)具有很好的魯棒性。(3)針對(duì)如何實(shí)現(xiàn)用最佳的輔助力協(xié)同患肢完成期望的訓(xùn)練問題,提出了一種上肢康復(fù)機(jī)器人自適應(yīng)評(píng)價(jià)逆最優(yōu)混合控制。該方案基于含有患者主動(dòng)運(yùn)動(dòng)意圖的康復(fù)機(jī)器人系統(tǒng)模型,運(yùn)用自適應(yīng)評(píng)價(jià)算法的優(yōu)化與決策能力并結(jié)合PD逆最優(yōu)控制技術(shù)通過尋求一個(gè)可以使末態(tài)約束目標(biāo)泛函達(dá)到最小的控制策略,進(jìn)而實(shí)現(xiàn)康復(fù)機(jī)器人的最佳輔助控制。Lyapunov穩(wěn)定理論證明了該方案的穩(wěn)定性,最小意義化優(yōu)化分析了該方案的最優(yōu)性,仿真及實(shí)際實(shí)驗(yàn)結(jié)果表明了所提方案的可行性與有效性。(4)針對(duì)存在參數(shù)不確定性、外界干擾及僅有位置可測(cè)的上肢康復(fù)機(jī)器人的運(yùn)動(dòng)控制問題,提出了一種基于動(dòng)態(tài)觀測(cè)器的上肢康復(fù)機(jī)器人魯棒最優(yōu)控制方案。該方案由魯棒動(dòng)態(tài)觀測(cè)器、魯棒自適應(yīng)逆最優(yōu)控制器構(gòu)成。其中魯棒動(dòng)態(tài)觀測(cè)器估計(jì)康復(fù)機(jī)器人系統(tǒng)的狀態(tài),魯棒自適應(yīng)逆最優(yōu)控制器則基于系統(tǒng)的觀測(cè)狀態(tài)通過搜索最佳的訓(xùn)練控制策略以迫使康復(fù)機(jī)器人完成期望的魯棒最優(yōu)跟蹤。理論分析表明了該方案的穩(wěn)定性及優(yōu)化性。仿真實(shí)例表明,即使在模型參數(shù)不確定性、外界干擾存在及僅有位置可測(cè)的情況下,所提方案也能夠保證康復(fù)機(jī)器人用最佳的輔助力協(xié)助患者完成功能性訓(xùn)練控制任務(wù)。(5)針對(duì)存在模型不確定、外界干擾且?guī)в休斎敕蔷性(如執(zhí)行器飽和特性)的強(qiáng)不確定性上肢康復(fù)機(jī)器人系統(tǒng)的穩(wěn)定性和運(yùn)動(dòng)的平滑性問題,提出了一種基于控制器切換的魯棒最優(yōu)跟蹤控制方案。該方案根據(jù)系統(tǒng)狀態(tài)或者訓(xùn)練任務(wù)的變化選擇相應(yīng)的飽和控制器輸出以獲得滿意的控制效果。對(duì)于重復(fù)性訓(xùn)練任務(wù),該方案直接從記憶庫中選擇控制律,從而消除了系統(tǒng)在重復(fù)的運(yùn)動(dòng)訓(xùn)練任務(wù)發(fā)生變化時(shí)出現(xiàn)的瞬態(tài)誤差;對(duì)于非重復(fù)的新情況(訓(xùn)練任務(wù))該方案則借助于自身的優(yōu)化與決策能力,通過適當(dāng)?shù)剡x擇切換規(guī)則,完成任意一個(gè)訓(xùn)練任務(wù)模式下的魯棒最優(yōu)控制。理論分析證明了該方案的穩(wěn)定性與可行性。另外以本實(shí)驗(yàn)室構(gòu)建的上肢康復(fù)機(jī)器人系統(tǒng)為實(shí)驗(yàn)平臺(tái),開展了上肢康復(fù)機(jī)器人增強(qiáng)學(xué)習(xí)控制方法的實(shí)驗(yàn)研究,實(shí)驗(yàn)結(jié)果表明盡管存在強(qiáng)不確定性及輸入非線性,但所提方案不僅可以保證完成期望訓(xùn)練控制任務(wù)和運(yùn)動(dòng)的平滑性,還可以有效抑制外界干擾,且對(duì)模型參數(shù)不確定性具有很強(qiáng)的魯棒性。上述工作和研究成果在上肢康復(fù)機(jī)器人的運(yùn)動(dòng)控制問題及自適應(yīng)評(píng)價(jià)控制方法的實(shí)際應(yīng)用方面做了一些有益的探索,為在自適應(yīng)評(píng)價(jià)算法框架下最終實(shí)現(xiàn)上肢康復(fù)機(jī)器人的自主運(yùn)動(dòng)控制奠定了基礎(chǔ)。
【關(guān)鍵詞】:上肢康復(fù)機(jī)器人 運(yùn)動(dòng)控制 自適應(yīng)評(píng)價(jià)算法 逆最優(yōu)控制 Lyapunov方法
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP242.6
【目錄】:
- 摘要5-7
- Abstract7-13
- 第1章 緒論13-29
- 1.1 本論文研究的目的和意義13-14
- 1.2 上肢康復(fù)機(jī)器人國(guó)內(nèi)外研究現(xiàn)狀14-17
- 1.2.1 國(guó)外研究現(xiàn)狀15-16
- 1.2.2 國(guó)內(nèi)研究現(xiàn)狀16-17
- 1.3 國(guó)內(nèi)外上肢康復(fù)機(jī)器人運(yùn)動(dòng)控制研究現(xiàn)狀17-25
- 1.3.1 研究中存在的問題17-19
- 1.3.2 經(jīng)典控制方法19-20
- 1.3.3 智能控制方法20-22
- 1.3.4 增強(qiáng)學(xué)習(xí)方法22-24
- 1.3.5 其他控制方法應(yīng)用24-25
- 1.4 論文主要研究?jī)?nèi)容25-28
- 1.5 本章小結(jié)28-29
- 第2章 上肢康復(fù)機(jī)器人的運(yùn)動(dòng)控制問題及改進(jìn)的自適應(yīng)評(píng)價(jià)增強(qiáng)學(xué)習(xí)算法29-49
- 2.1 引言29-31
- 2.2 系統(tǒng)模型及性質(zhì)31-32
- 2.3 上肢康復(fù)機(jī)器人的運(yùn)動(dòng)控制問題32-33
- 2.4 康復(fù)機(jī)器人運(yùn)動(dòng)控制技術(shù)難點(diǎn)33-37
- 2.4.1 運(yùn)動(dòng)控制技術(shù)難點(diǎn)33-34
- 2.4.2 自適應(yīng)評(píng)價(jià)增強(qiáng)學(xué)習(xí)算法在運(yùn)動(dòng)控制中的應(yīng)用難點(diǎn)34-37
- 2.5 模糊執(zhí)行-神經(jīng)評(píng)價(jià)監(jiān)督增強(qiáng)學(xué)習(xí)控制37-41
- 2.5.1 監(jiān)督控制器37-38
- 2.5.2 模糊邏輯執(zhí)行器38-39
- 2.5.3 神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)器39-41
- 2.6 穩(wěn)定性分析41-42
- 2.7 仿真實(shí)例42-48
- 2.8 本章小結(jié)48-49
- 第3章 具有不確定性因素的上肢康復(fù)機(jī)器人魯棒跟蹤控制49-67
- 3.1 引言49-50
- 3.2 系統(tǒng)模型及性質(zhì)50-52
- 3.3 控制目標(biāo)52
- 3.4 控制器設(shè)計(jì)52-58
- 3.4.1 模糊邏輯執(zhí)行器53-56
- 3.4.2 模糊邏輯評(píng)價(jià)器56-58
- 3.5 穩(wěn)定性分析58-60
- 3.6 仿真實(shí)例60-66
- 3.6.1 被動(dòng)運(yùn)動(dòng)模式下的軌跡跟蹤60-63
- 3.6.2 主動(dòng)抗阻訓(xùn)練模式下的軌跡跟蹤63-66
- 3.7 本章小結(jié)66-67
- 第4章 上肢康復(fù)機(jī)器人自適應(yīng)評(píng)價(jià)逆最優(yōu)混合控制67-91
- 4.1 引言67-69
- 4.2 問題描述69-71
- 4.3 控制目標(biāo)71-72
- 4.4 控制器設(shè)計(jì)72-76
- 4.4.1 神經(jīng)網(wǎng)絡(luò)執(zhí)行器72-75
- 4.4.2 神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)器75-76
- 4.5 穩(wěn)定性分析76-79
- 4.6 優(yōu)化分析79-81
- 4.7 實(shí)驗(yàn)與仿真81-89
- 4.7.1 仿真81-86
- 4.7.2 應(yīng)用實(shí)例86-89
- 4.8 本章小結(jié)89-91
- 第5章 基于動(dòng)態(tài)觀測(cè)器的上肢康復(fù)機(jī)器人魯棒最優(yōu)跟蹤控制91-113
- 5.1 引言91-92
- 5.2 系統(tǒng)模型92-93
- 5.3 控制目標(biāo)及問題描述93-94
- 5.4 控制器設(shè)計(jì)94-101
- 5.4.1 魯棒神經(jīng)-模糊執(zhí)行器95-97
- 5.4.2 魯棒神經(jīng)-模糊評(píng)價(jià)器97-98
- 5.4.3 魯棒動(dòng)態(tài)神經(jīng)-模糊觀測(cè)器98-101
- 5.5 穩(wěn)定性分析101-104
- 5.6 優(yōu)化分析104-106
- 5.7 仿真實(shí)驗(yàn)106-111
- 5.7.1 存在常干擾時(shí)的軌跡跟蹤107-108
- 5.7.2 存在時(shí)變干擾時(shí)的軌跡跟蹤108-111
- 5.8 本章小結(jié)111-113
- 第6章 基于控制器切換的上肢康復(fù)機(jī)器人魯棒最優(yōu)跟蹤控制及實(shí)驗(yàn)研究113-147
- 6.1 引言113-114
- 6.2 混雜系統(tǒng)模型及問題描述114-117
- 6.3 控制目標(biāo)117-118
- 6.4 控制器設(shè)計(jì)118-122
- 6.4.1 多神經(jīng)網(wǎng)絡(luò)執(zhí)行器118-121
- 6.4.2 多神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)器121-122
- 6.5 穩(wěn)定性分析122-126
- 6.6 優(yōu)化分析126-128
- 6.7 仿真實(shí)例128-137
- 6.8 實(shí)際實(shí)驗(yàn)驗(yàn)證137-146
- 6.8.1 實(shí)驗(yàn)系統(tǒng)138-140
- 6.8.2 實(shí)驗(yàn)控制系統(tǒng)140
- 6.8.3 實(shí)驗(yàn)內(nèi)容140-141
- 6.8.4 實(shí)驗(yàn)過程141-142
- 6.8.5 實(shí)驗(yàn)結(jié)果與討論142-146
- 6.9 本章小結(jié)146-147
- 結(jié)論與展望147-151
- 參考文獻(xiàn)151-171
- 攻讀學(xué)位期間發(fā)表論文與研究成果清單171-173
- 致謝173-175
- 作者簡(jiǎn)介175
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 張雷;周宛松;盧磊;樊成;;拋光力實(shí)時(shí)控制策略研究[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年06期
2 張付祥,付宜利,王樹國(guó);康復(fù)機(jī)器人研究進(jìn)展[J];河北工業(yè)科技;2005年02期
3 付宜利;甘增康;張福海;張勤超;;基于患者表現(xiàn)逐步輔助的康復(fù)機(jī)械手控制系統(tǒng)設(shè)計(jì)[J];機(jī)械與電子;2011年08期
4 劉德榮;李宏亮;王鼎;;基于數(shù)據(jù)的自學(xué)習(xí)優(yōu)化控制:研究進(jìn)展與展望[J];自動(dòng)化學(xué)報(bào);2013年11期
5 崔黎黎;劉杰;張勇;;基于單網(wǎng)絡(luò)ADP的一類未知非線性系統(tǒng)的近似最優(yōu)控制[J];控制與決策;2013年09期
6 Xiao-hua WANG;Juan-juan YU;Yao HUANG;Hua WANG;Zhong-hua MIAO;;Adaptive dynamic programming for linear impulse systems[J];Journal of Zhejiang University-Science C(Computers and Electronics);2014年01期
7 陳學(xué)松;劉富春;;一類非線性動(dòng)態(tài)系統(tǒng)基于強(qiáng)化學(xué)習(xí)的最優(yōu)控制[J];控制與決策;2013年12期
8 譚拂曉;劉德榮;關(guān)新平;羅斌;;基于微分對(duì)策理論的非線性控制回顧與展望[J];自動(dòng)化學(xué)報(bào);2014年01期
9 SONG RuiZhuo;XIAO WenDong;SUN ChangYin;;A new self-learning optimal control laws for a class of discrete-time nonlinear systems based on ESN architecture[J];Science China(Information Sciences);2014年06期
10 金玉凈;朱文文;伏玉琛;劉全;;基于Tile Coding編碼和模型學(xué)習(xí)的Actor-Critic算法[J];計(jì)算機(jī)科學(xué);2014年06期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 邊輝;生物融合式康復(fù)機(jī)構(gòu)理論與應(yīng)用研究[D];燕山大學(xué);2011年
2 張付祥;創(chuàng)傷手指康復(fù)機(jī)械手系統(tǒng)研究[D];哈爾濱工業(yè)大學(xué);2007年
3 王鵬;手指創(chuàng)傷功能康復(fù)機(jī)械手系統(tǒng)研究[D];哈爾濱工業(yè)大學(xué);2009年
4 杜義浩;并聯(lián)機(jī)器人軌跡規(guī)劃中的運(yùn)動(dòng)誤差補(bǔ)償方法研究[D];燕山大學(xué);2012年
5 葉錦華;不確定非完整輪式移動(dòng)機(jī)器人的運(yùn)動(dòng)控制研究[D];華南理工大學(xué);2013年
6 洪昭斌;漂浮基剛、柔混合空間機(jī)器人系統(tǒng)智能控制研究[D];福州大學(xué);2011年
7 陳啟麗;遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)方法及應(yīng)用研究[D];北京工業(yè)大學(xué);2014年
8 方嘯;GrHDP算法的研究及其在虛擬交互中的應(yīng)用[D];燕山大學(xué);2014年
9 李醒;五自由度上肢康復(fù)機(jī)器人訓(xùn)練系統(tǒng)的研究[D];東北大學(xué);2012年
10 崔黎黎;基于神經(jīng)網(wǎng)絡(luò)的近似動(dòng)態(tài)規(guī)劃理論及其應(yīng)用研究[D];東北大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉倩倩;多功能護(hù)理床的結(jié)構(gòu)設(shè)計(jì)與力學(xué)分析[D];中國(guó)地質(zhì)大學(xué)(北京);2011年
2 吳希瑤;下肢康復(fù)機(jī)器人機(jī)構(gòu)分析與設(shè)計(jì)[D];北京工業(yè)大學(xué);2011年
3 孔祥戰(zhàn);仿生外骨骼式下肢康復(fù)機(jī)器人研究[D];河北工業(yè)大學(xué);2011年
4 甄紅衛(wèi);腳踏車式下肢康復(fù)訓(xùn)練器設(shè)計(jì)及研究[D];燕山大學(xué);2012年
5 黃旭;全方位移動(dòng)下肢康復(fù)機(jī)器人無線監(jiān)控系統(tǒng)研究[D];沈陽工業(yè)大學(xué);2012年
6 于海波;并聯(lián)式踝關(guān)節(jié)康復(fù)機(jī)器人系統(tǒng)設(shè)計(jì)[D];燕山大學(xué);2006年
7 王海濱;四自由度機(jī)器人機(jī)械系統(tǒng)的研究[D];哈爾濱工業(yè)大學(xué);2006年
8 薄少軍;中型噴漿機(jī)器人動(dòng)力學(xué)研究[D];山東科技大學(xué);2006年
9 李丹;踝關(guān)節(jié)融合康復(fù)機(jī)器人系統(tǒng)的軌跡規(guī)劃和運(yùn)動(dòng)控制[D];燕山大學(xué);2008年
10 羅延軍;基于上肢康復(fù)機(jī)器人的仿生機(jī)構(gòu)模型研究[D];沈陽工業(yè)大學(xué);2009年
本文關(guān)鍵詞:上肢康復(fù)機(jī)器人的增強(qiáng)學(xué)習(xí)控制方法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):342277
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/342277.html