基于策略迭代的線性奇異攝動(dòng)系統(tǒng)自學(xué)習(xí)最優(yōu)控制
發(fā)布時(shí)間:2021-05-14 14:31
奇異攝動(dòng)系統(tǒng)是一類(lèi)快、慢動(dòng)態(tài)耦合的雙時(shí)間尺度系統(tǒng),廣泛存在于電力系統(tǒng)、化工過(guò)程、機(jī)器人等領(lǐng)域�,F(xiàn)有奇異攝動(dòng)系統(tǒng)最優(yōu)控制方法主要局限于模型參數(shù)已知的情況。自適應(yīng)動(dòng)態(tài)規(guī)劃是一種可以在模型完全未知下設(shè)計(jì)最優(yōu)控制器的自學(xué)習(xí)技術(shù),已經(jīng)廣泛用于解決弱耦合、雙線性、交聯(lián)等復(fù)雜系統(tǒng)相關(guān)最優(yōu)控制問(wèn)題。由于共存的快、慢現(xiàn)象,現(xiàn)有自學(xué)習(xí)最優(yōu)控制方法直接應(yīng)用到模型未知的奇異攝動(dòng)系統(tǒng)上會(huì)導(dǎo)致“病態(tài)數(shù)值問(wèn)題”。因此,本論文面向模型未知的線性奇異攝動(dòng)系統(tǒng),把自適應(yīng)動(dòng)態(tài)規(guī)劃方法和系統(tǒng)的雙時(shí)間尺度結(jié)構(gòu)特點(diǎn)相結(jié)合,研究基于策略迭代的自學(xué)習(xí)最優(yōu)控制方法,目標(biāo)是克服常規(guī)自學(xué)習(xí)控制方法的“病態(tài)數(shù)值問(wèn)題”,提出良性的在線學(xué)習(xí)算法。主要工作概括如下:1.針對(duì)模型未知的線性奇異攝動(dòng)系統(tǒng)最優(yōu)狀態(tài)調(diào)節(jié)控制問(wèn)題,設(shè)計(jì)一種基于策略迭代的在線學(xué)習(xí)算法。首先,基于代價(jià)函數(shù)參數(shù)矩陣解的結(jié)構(gòu)特點(diǎn),重構(gòu)傳統(tǒng)Kleinman算法涉及的Lyapunov方程,提出一種改進(jìn)的Kleinman算法;其次,根據(jù)積分貝爾曼方程和系統(tǒng)雙時(shí)間尺度特性,設(shè)計(jì)一種基于數(shù)據(jù)的良性在線策略迭代算法;然后,在分析兩種算法等價(jià)性的基礎(chǔ)上證明所提在線算法的收斂性與閉環(huán)系統(tǒng)的穩(wěn)定性;...
【文章來(lái)源】:中國(guó)礦業(yè)大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
abstract
符號(hào)注釋表
1 緒論
1.1 研究背景與意義
1.2 自適應(yīng)動(dòng)態(tài)規(guī)劃概述
1.3 奇異攝動(dòng)系統(tǒng)概述
1.4 研究?jī)?nèi)容與創(chuàng)新點(diǎn)
2 基于策略迭代的線性奇異攝動(dòng)系統(tǒng)最優(yōu)狀態(tài)調(diào)節(jié)控制
2.1 問(wèn)題描述和預(yù)備知識(shí)
2.2 最優(yōu)狀態(tài)調(diào)節(jié)控制器設(shè)計(jì)
2.3 性能分析
2.4 仿真結(jié)果
2.5 本章小結(jié)
3 基于策略迭代的線性奇異攝動(dòng)系統(tǒng)混合H2/H∞控制
3.1 問(wèn)題描述和預(yù)備知識(shí)
3.2 混合H_2/H_∞控制器設(shè)計(jì)
3.3 性能分析
3.4 仿真結(jié)果
3.5 本章小結(jié)
4 基于策略迭代的線性奇異攝動(dòng)系統(tǒng)最優(yōu)輸出跟蹤控制
4.1 問(wèn)題描述和預(yù)備知識(shí)
4.2 最優(yōu)輸出跟蹤控制器設(shè)計(jì)
4.3 性能分析
4.4 仿真結(jié)果
4.5 本章小結(jié)
5 結(jié)論與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)歷
學(xué)位論文數(shù)據(jù)集
【參考文獻(xiàn)】:
期刊論文
[1]一種基于強(qiáng)化學(xué)習(xí)的自主導(dǎo)航控制算法研究[J]. 王濤,王立強(qiáng),李宇飛. 計(jì)算機(jī)仿真. 2018(11)
[2]自動(dòng)化科學(xué)與技術(shù)發(fā)展方向[J]. 柴天佑. 自動(dòng)化學(xué)報(bào). 2018(11)
[3]Buck型變換器輸出跟蹤的自適應(yīng)動(dòng)態(tài)規(guī)劃算法[J]. 李健,沈艷軍,劉允剛. 控制理論與應(yīng)用. 2017(03)
[4]基于自適應(yīng)動(dòng)態(tài)規(guī)劃的導(dǎo)彈制導(dǎo)律研究綜述[J]. 孫景亮,劉春生. 自動(dòng)化學(xué)報(bào). 2017(07)
[5]工業(yè)過(guò)程控制系統(tǒng)研究現(xiàn)狀與發(fā)展方向[J]. 柴天佑. 中國(guó)科學(xué):信息科學(xué). 2016(08)
[6]基于自適應(yīng)動(dòng)態(tài)規(guī)劃的儲(chǔ)能系統(tǒng)優(yōu)化控制方法[J]. 李相俊,張晶瓊,何宇婷,惠東. 電網(wǎng)技術(shù). 2016(05)
[7]具有未知?jiǎng)討B(tài)的線性系統(tǒng)二人零和博弈問(wèn)題在線學(xué)習(xí)方案[J]. 富月,柴天佑. 控制理論與應(yīng)用. 2015(02)
[8]基于數(shù)據(jù)的自學(xué)習(xí)優(yōu)化控制:研究進(jìn)展與展望[J]. 劉德榮,李宏亮,王鼎. 自動(dòng)化學(xué)報(bào). 2013(11)
[9]線性Markov切換系統(tǒng)的隨機(jī)Nash微分博弈及混合H2/H∞控制[J]. 朱懷念,張成科,王明亮. 控制與決策. 2013(08)
[10]自適應(yīng)動(dòng)態(tài)規(guī)劃綜述[J]. 張化光,張欣,羅艷紅,楊珺. 自動(dòng)化學(xué)報(bào). 2013(04)
博士論文
[1]幾類(lèi)非線性奇異攝動(dòng)系統(tǒng)的穩(wěn)定性分析與控制[D]. 張艷.南京理工大學(xué) 2015
[2]基于近似動(dòng)態(tài)規(guī)劃的優(yōu)化控制研究及在電力系統(tǒng)中的應(yīng)用[D]. 秦春斌.東北大學(xué) 2014
碩士論文
[1]數(shù)據(jù)與模型混合驅(qū)動(dòng)的雙時(shí)間尺度系統(tǒng)次優(yōu)控制[D]. 鐘珊珊.中國(guó)礦業(yè)大學(xué) 2019
[2]工業(yè)過(guò)程多速率分層運(yùn)行優(yōu)化控制[D]. 陸文捷.中國(guó)礦業(yè)大學(xué) 2019
[3]自適應(yīng)最優(yōu)跟蹤控制及在SCARA機(jī)器人系統(tǒng)應(yīng)用[D]. 侯大為.昆明理工大學(xué) 2018
[4]自適應(yīng)動(dòng)態(tài)規(guī)劃在電力系統(tǒng)中的應(yīng)用研究[D]. 程亮.華中科技大學(xué) 2014
本文編號(hào):3185810
【文章來(lái)源】:中國(guó)礦業(yè)大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
abstract
符號(hào)注釋表
1 緒論
1.1 研究背景與意義
1.2 自適應(yīng)動(dòng)態(tài)規(guī)劃概述
1.3 奇異攝動(dòng)系統(tǒng)概述
1.4 研究?jī)?nèi)容與創(chuàng)新點(diǎn)
2 基于策略迭代的線性奇異攝動(dòng)系統(tǒng)最優(yōu)狀態(tài)調(diào)節(jié)控制
2.1 問(wèn)題描述和預(yù)備知識(shí)
2.2 最優(yōu)狀態(tài)調(diào)節(jié)控制器設(shè)計(jì)
2.3 性能分析
2.4 仿真結(jié)果
2.5 本章小結(jié)
3 基于策略迭代的線性奇異攝動(dòng)系統(tǒng)混合H2/H∞控制
3.1 問(wèn)題描述和預(yù)備知識(shí)
3.2 混合H_2/H_∞控制器設(shè)計(jì)
3.3 性能分析
3.4 仿真結(jié)果
3.5 本章小結(jié)
4 基于策略迭代的線性奇異攝動(dòng)系統(tǒng)最優(yōu)輸出跟蹤控制
4.1 問(wèn)題描述和預(yù)備知識(shí)
4.2 最優(yōu)輸出跟蹤控制器設(shè)計(jì)
4.3 性能分析
4.4 仿真結(jié)果
4.5 本章小結(jié)
5 結(jié)論與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)歷
學(xué)位論文數(shù)據(jù)集
【參考文獻(xiàn)】:
期刊論文
[1]一種基于強(qiáng)化學(xué)習(xí)的自主導(dǎo)航控制算法研究[J]. 王濤,王立強(qiáng),李宇飛. 計(jì)算機(jī)仿真. 2018(11)
[2]自動(dòng)化科學(xué)與技術(shù)發(fā)展方向[J]. 柴天佑. 自動(dòng)化學(xué)報(bào). 2018(11)
[3]Buck型變換器輸出跟蹤的自適應(yīng)動(dòng)態(tài)規(guī)劃算法[J]. 李健,沈艷軍,劉允剛. 控制理論與應(yīng)用. 2017(03)
[4]基于自適應(yīng)動(dòng)態(tài)規(guī)劃的導(dǎo)彈制導(dǎo)律研究綜述[J]. 孫景亮,劉春生. 自動(dòng)化學(xué)報(bào). 2017(07)
[5]工業(yè)過(guò)程控制系統(tǒng)研究現(xiàn)狀與發(fā)展方向[J]. 柴天佑. 中國(guó)科學(xué):信息科學(xué). 2016(08)
[6]基于自適應(yīng)動(dòng)態(tài)規(guī)劃的儲(chǔ)能系統(tǒng)優(yōu)化控制方法[J]. 李相俊,張晶瓊,何宇婷,惠東. 電網(wǎng)技術(shù). 2016(05)
[7]具有未知?jiǎng)討B(tài)的線性系統(tǒng)二人零和博弈問(wèn)題在線學(xué)習(xí)方案[J]. 富月,柴天佑. 控制理論與應(yīng)用. 2015(02)
[8]基于數(shù)據(jù)的自學(xué)習(xí)優(yōu)化控制:研究進(jìn)展與展望[J]. 劉德榮,李宏亮,王鼎. 自動(dòng)化學(xué)報(bào). 2013(11)
[9]線性Markov切換系統(tǒng)的隨機(jī)Nash微分博弈及混合H2/H∞控制[J]. 朱懷念,張成科,王明亮. 控制與決策. 2013(08)
[10]自適應(yīng)動(dòng)態(tài)規(guī)劃綜述[J]. 張化光,張欣,羅艷紅,楊珺. 自動(dòng)化學(xué)報(bào). 2013(04)
博士論文
[1]幾類(lèi)非線性奇異攝動(dòng)系統(tǒng)的穩(wěn)定性分析與控制[D]. 張艷.南京理工大學(xué) 2015
[2]基于近似動(dòng)態(tài)規(guī)劃的優(yōu)化控制研究及在電力系統(tǒng)中的應(yīng)用[D]. 秦春斌.東北大學(xué) 2014
碩士論文
[1]數(shù)據(jù)與模型混合驅(qū)動(dòng)的雙時(shí)間尺度系統(tǒng)次優(yōu)控制[D]. 鐘珊珊.中國(guó)礦業(yè)大學(xué) 2019
[2]工業(yè)過(guò)程多速率分層運(yùn)行優(yōu)化控制[D]. 陸文捷.中國(guó)礦業(yè)大學(xué) 2019
[3]自適應(yīng)最優(yōu)跟蹤控制及在SCARA機(jī)器人系統(tǒng)應(yīng)用[D]. 侯大為.昆明理工大學(xué) 2018
[4]自適應(yīng)動(dòng)態(tài)規(guī)劃在電力系統(tǒng)中的應(yīng)用研究[D]. 程亮.華中科技大學(xué) 2014
本文編號(hào):3185810
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3185810.html
最近更新
教材專(zhuān)著