非線性系統(tǒng)事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃理論與方法研究
發(fā)布時間:2023-10-18 18:17
最優(yōu)控制問題廣泛存在于實(shí)際生產(chǎn)生活中的各個方面。因?qū)嶋H中的控制系統(tǒng)大多是非線性系統(tǒng),所以,使用經(jīng)典控制理論來解決這類問題存在局限性。自適應(yīng)動態(tài)規(guī)劃方法(Adaptive Dynamic Programming,ADP)融合了動態(tài)規(guī)劃、強(qiáng)化學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)的思想,為解決非線性系統(tǒng)的最優(yōu)控制問題提供了新途徑。在自適應(yīng)動態(tài)規(guī)劃方法的基礎(chǔ)上,結(jié)合事件觸發(fā)控制方法,本文對事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃方法(Event-Triggered Adaptive Dynami c Programming,ETADP)進(jìn)行了研究。本文的主要工作如下:(1)針對模型未知非線性系統(tǒng)的最優(yōu)控制問題,本文提出了一種新的事件觸發(fā)啟發(fā)式動態(tài)規(guī)劃算法,提出了事件觸發(fā)條件組,并證明了系統(tǒng)的穩(wěn)定性。該算法減少了現(xiàn)有算法對假設(shè)條件的依賴。(2)針對仿射非線性系統(tǒng)的最優(yōu)跟蹤控制問題,根據(jù)事件觸發(fā)機(jī)制所作用的控制器的不同,本文提出了兩種事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃最優(yōu)跟蹤控制算法,設(shè)計了兩種事件觸發(fā)機(jī)制,并證明了控制系統(tǒng)能夠準(zhǔn)確跟蹤期望軌跡。(3)針對涉及多控制器的非零和博弈問題,本文提出了多事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃算法,并為每個控制器單獨(dú)設(shè)...
【文章頁數(shù)】:117 頁
【學(xué)位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 引言
1.1 自適應(yīng)動態(tài)規(guī)劃方法概述
1.2 事件觸發(fā)控制方法概述
1.3 國內(nèi)外發(fā)展現(xiàn)狀與趨勢
1.3.1 自適應(yīng)動態(tài)規(guī)劃的發(fā)展現(xiàn)狀與趨勢
1.3.2 事件觸發(fā)控制方法的發(fā)展現(xiàn)狀與趨勢
1.4 本文主要工作
2 事件觸發(fā)啟發(fā)式動態(tài)規(guī)劃算法
2.1 引言
2.2 離散時間非線性系統(tǒng)的最優(yōu)控制問題
2.3 事件觸發(fā)機(jī)制
2.4 事件觸發(fā)啟發(fā)式動態(tài)規(guī)劃算法的實(shí)現(xiàn)
2.4.1 模型網(wǎng)絡(luò)
2.4.2 評價網(wǎng)絡(luò)
2.4.3 執(zhí)行網(wǎng)絡(luò)
2.5 事件觸發(fā)條件設(shè)計及系統(tǒng)穩(wěn)定性分析
2.6 仿真實(shí)驗(yàn)
2.6.1 仿真實(shí)驗(yàn)一
2.6.2 仿真實(shí)驗(yàn)二
2.7 本章小結(jié)
3 事件觸發(fā)最優(yōu)跟蹤控制算法
3.1 引言
3.2 離散時間非線性系統(tǒng)的最優(yōu)跟蹤控制問題
3.3 兩種事件觸發(fā)機(jī)制
3.3.1 原系統(tǒng)引入事件觸發(fā)機(jī)制
3.3.2 重構(gòu)系統(tǒng)引入事件觸發(fā)機(jī)制
3.4 穩(wěn)定性分析
3.4.1 原系統(tǒng)引入事件觸發(fā)機(jī)制時的穩(wěn)定性分析
3.4.2 重構(gòu)系統(tǒng)引入事件觸發(fā)機(jī)制時的穩(wěn)定性分析
3.5 算法實(shí)現(xiàn)
3.5.1 評價網(wǎng)絡(luò)
3.5.2 執(zhí)行網(wǎng)絡(luò)
3.6 仿真實(shí)驗(yàn)
3.6.1 仿真實(shí)驗(yàn)一
3.6.2 仿真實(shí)驗(yàn)二
3.7 本章小結(jié)
4 基于多事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃算法的非零和博弈問題
4.1 引言
4.2 多控制器非零和博弈問題
4.3 多事件觸發(fā)機(jī)制
4.4 算法實(shí)現(xiàn)及穩(wěn)定性分析
4.5 仿真實(shí)驗(yàn)
4.5.1 仿真實(shí)驗(yàn)一
4.5.2 仿真實(shí)驗(yàn)二
4.6 本章小結(jié)
5 基于多事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃算法的零和博弈問題
5.1 引言
5.2 零和博弈問題
5.3 多事件觸發(fā)機(jī)制
5.4 算法實(shí)現(xiàn)及穩(wěn)定性分析
5.5 仿真實(shí)驗(yàn)
5.6 本章小結(jié)
6 結(jié)論與展望
6.1 論文工作與創(chuàng)新點(diǎn)
6.2 未來研究工作展望
參考文獻(xiàn)
作者簡歷及在學(xué)研究成果
學(xué)位論文數(shù)據(jù)集
本文編號:3854942
【文章頁數(shù)】:117 頁
【學(xué)位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 引言
1.1 自適應(yīng)動態(tài)規(guī)劃方法概述
1.2 事件觸發(fā)控制方法概述
1.3 國內(nèi)外發(fā)展現(xiàn)狀與趨勢
1.3.1 自適應(yīng)動態(tài)規(guī)劃的發(fā)展現(xiàn)狀與趨勢
1.3.2 事件觸發(fā)控制方法的發(fā)展現(xiàn)狀與趨勢
1.4 本文主要工作
2 事件觸發(fā)啟發(fā)式動態(tài)規(guī)劃算法
2.1 引言
2.2 離散時間非線性系統(tǒng)的最優(yōu)控制問題
2.3 事件觸發(fā)機(jī)制
2.4 事件觸發(fā)啟發(fā)式動態(tài)規(guī)劃算法的實(shí)現(xiàn)
2.4.1 模型網(wǎng)絡(luò)
2.4.2 評價網(wǎng)絡(luò)
2.4.3 執(zhí)行網(wǎng)絡(luò)
2.5 事件觸發(fā)條件設(shè)計及系統(tǒng)穩(wěn)定性分析
2.6 仿真實(shí)驗(yàn)
2.6.1 仿真實(shí)驗(yàn)一
2.6.2 仿真實(shí)驗(yàn)二
2.7 本章小結(jié)
3 事件觸發(fā)最優(yōu)跟蹤控制算法
3.1 引言
3.2 離散時間非線性系統(tǒng)的最優(yōu)跟蹤控制問題
3.3 兩種事件觸發(fā)機(jī)制
3.3.1 原系統(tǒng)引入事件觸發(fā)機(jī)制
3.3.2 重構(gòu)系統(tǒng)引入事件觸發(fā)機(jī)制
3.4 穩(wěn)定性分析
3.4.1 原系統(tǒng)引入事件觸發(fā)機(jī)制時的穩(wěn)定性分析
3.4.2 重構(gòu)系統(tǒng)引入事件觸發(fā)機(jī)制時的穩(wěn)定性分析
3.5 算法實(shí)現(xiàn)
3.5.1 評價網(wǎng)絡(luò)
3.5.2 執(zhí)行網(wǎng)絡(luò)
3.6 仿真實(shí)驗(yàn)
3.6.1 仿真實(shí)驗(yàn)一
3.6.2 仿真實(shí)驗(yàn)二
3.7 本章小結(jié)
4 基于多事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃算法的非零和博弈問題
4.1 引言
4.2 多控制器非零和博弈問題
4.3 多事件觸發(fā)機(jī)制
4.4 算法實(shí)現(xiàn)及穩(wěn)定性分析
4.5 仿真實(shí)驗(yàn)
4.5.1 仿真實(shí)驗(yàn)一
4.5.2 仿真實(shí)驗(yàn)二
4.6 本章小結(jié)
5 基于多事件觸發(fā)自適應(yīng)動態(tài)規(guī)劃算法的零和博弈問題
5.1 引言
5.2 零和博弈問題
5.3 多事件觸發(fā)機(jī)制
5.4 算法實(shí)現(xiàn)及穩(wěn)定性分析
5.5 仿真實(shí)驗(yàn)
5.6 本章小結(jié)
6 結(jié)論與展望
6.1 論文工作與創(chuàng)新點(diǎn)
6.2 未來研究工作展望
參考文獻(xiàn)
作者簡歷及在學(xué)研究成果
學(xué)位論文數(shù)據(jù)集
本文編號:3854942
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3854942.html
最近更新
教材專著