天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于自適應(yīng)動(dòng)態(tài)規(guī)劃的分布式控制研究及應(yīng)用

發(fā)布時(shí)間:2023-04-22 06:16
  近幾年來,鑒于社會(huì)對(duì)復(fù)雜系統(tǒng)經(jīng)濟(jì)調(diào)度、資源分配、網(wǎng)絡(luò)布局等優(yōu)化問題的迫切需求,分布式最優(yōu)控制已經(jīng)成為控制科學(xué)領(lǐng)域中的一個(gè)研究熱點(diǎn)。分布式最優(yōu)控制問題需要對(duì)Hamilton-Jacobi-Bellman(HJB)方程進(jìn)行求解,由此帶來“維數(shù)災(zāi)難”問題。自適應(yīng)動(dòng)態(tài)規(guī)劃(Adaptive Dynamic Programming,ADP)融合了動(dòng)態(tài)規(guī)劃、增強(qiáng)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、自適應(yīng)控制、最優(yōu)控制等理論和方法,是解決“維數(shù)災(zāi)難”問題的有效方法之一。因此,本文利用ADP方法研究多智能體系統(tǒng)的跟蹤控制問題、包含控制問題、反同步控制問題以及下肢助行外骨骼機(jī)器人的人機(jī)協(xié)同控制問題。針對(duì)這些控制問題,我們提出了模型未知情況下的分布式控制器設(shè)計(jì)方法,并且對(duì)傳統(tǒng)的ADP算法和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了有效改進(jìn),提高了多智能體系統(tǒng)的分布式控制性能。本文的主要研究結(jié)果如下:1.研究了離散時(shí)間多智能體系統(tǒng)的最優(yōu)跟蹤控制問題。提出了一種新的ADP算法,即兩階段策略迭代算法來計(jì)算迭代控制律和迭代性能指標(biāo)函數(shù)。與經(jīng)典的策略迭代ADP算法相比,該算法包含一個(gè)子迭代過程來計(jì)算策略評(píng)估過程的迭代性能指標(biāo)函數(shù)。其次,給出了迭代性能指標(biāo)函數(shù)...

【文章頁數(shù)】:133 頁

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究工作的背景與意義
    1.2 國內(nèi)外研究發(fā)展與現(xiàn)狀
        1.2.1 自適應(yīng)動(dòng)態(tài)規(guī)劃
            1.2.1.1 傳統(tǒng)的自適應(yīng)動(dòng)態(tài)規(guī)劃
            1.2.1.2 無模型的增強(qiáng)學(xué)習(xí)
        1.2.2 基于ADP的多智能體系統(tǒng)控制
    1.3 本文的主要研究內(nèi)容及組織結(jié)構(gòu)
第二章 自適應(yīng)動(dòng)態(tài)規(guī)劃的理論基礎(chǔ)
    2.1 動(dòng)態(tài)規(guī)劃的基本原理
        2.1.1 離散時(shí)間系統(tǒng)的動(dòng)態(tài)規(guī)劃
        2.1.2 連續(xù)時(shí)間系統(tǒng)的動(dòng)態(tài)規(guī)劃
    2.2 自適應(yīng)動(dòng)態(tài)規(guī)劃的基本框架
    2.3 近似迭代算法原理
        2.3.1 值迭代算法
        2.3.2 策略迭代算法
    2.4 本章小結(jié)
第三章 基于數(shù)據(jù)驅(qū)動(dòng)的多智能體系統(tǒng)最優(yōu)跟蹤控制
    3.1 引言
    3.2 最優(yōu)跟蹤控制問題建模
    3.3 分布式最優(yōu)控制設(shè)計(jì)
        3.3.1 離散Hamilton-Jacobi-Bellman方程
        3.3.2 兩階段策略迭代算法
        3.3.3 算法性能及控制系統(tǒng)穩(wěn)定性分析
    3.4 基于神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí)實(shí)現(xiàn)方法
        3.4.1 Critic網(wǎng)絡(luò)設(shè)計(jì)
        3.4.2 Actor網(wǎng)絡(luò)設(shè)計(jì)
    3.5 數(shù)值仿真分析
    3.6 本章小結(jié)
第四章 基于自適應(yīng)動(dòng)態(tài)規(guī)劃的多智能體系統(tǒng)包含控制
    4.1 引言
    4.2 離散時(shí)間系統(tǒng)的包含控制問題
        4.2.1 最優(yōu)包含控制問題建模
        4.2.2 分布式最優(yōu)控制設(shè)計(jì)與分析
        4.2.3 執(zhí)行-評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)的控制實(shí)現(xiàn)
        4.2.4 數(shù)值仿真分析
    4.3 帶有擾動(dòng)的連續(xù)時(shí)間系統(tǒng)的包含控制問題
        4.3.1 分布式最優(yōu)包含控制設(shè)計(jì)
        4.3.2 穩(wěn)定性分析
        4.3.3 最優(yōu)控制的在線學(xué)習(xí)
        4.3.4 數(shù)值仿真分析
    4.4 本章小結(jié)
第五章 合作-競爭網(wǎng)絡(luò)下多智能體系統(tǒng)的最優(yōu)輸出反同步控制
    5.1 引言
    5.2 最優(yōu)輸出反同步控制問題建模
    5.3 基于輸入-輸出數(shù)據(jù)的多智能體系統(tǒng)模型重構(gòu)
    5.4 基于可測數(shù)據(jù)的分布式最優(yōu)控制設(shè)計(jì)
        5.4.1 基于可測數(shù)據(jù)的值迭代算法
        5.4.2 系統(tǒng)穩(wěn)定性分析
        5.4.3 算法收斂性分析
    5.5 增量式執(zhí)行-評(píng)價(jià)網(wǎng)絡(luò)在線求解方法
        5.5.1 增量式Critic網(wǎng)絡(luò)設(shè)計(jì)
        5.5.2 增量式Actor網(wǎng)絡(luò)設(shè)計(jì)
        5.5.3 在線學(xué)習(xí)控制算法
    5.6 數(shù)值仿真分析
    5.7 本章小結(jié)
第六章 基于自適應(yīng)動(dòng)態(tài)規(guī)劃的下肢外骨骼機(jī)器人助行控制
    6.1 引言
    6.2 外骨骼系統(tǒng)人機(jī)協(xié)同控制問題建模
        6.2.1 穿戴者-外骨骼交互機(jī)制
        6.2.2 系統(tǒng)動(dòng)力學(xué)建模與問題描述
    6.3 基于自適應(yīng)動(dòng)態(tài)規(guī)劃的分布式控制策略
        6.3.1 分布式助行控制算法設(shè)計(jì)
        6.3.2 基于神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí)機(jī)制
    6.4 仿真實(shí)驗(yàn)分析
        6.4.1 數(shù)值仿真分析
        6.4.2 下肢助行外骨骼實(shí)驗(yàn)驗(yàn)證
    6.5 本章小結(jié)
第七章 總結(jié)與展望
    7.1 全文總結(jié)
    7.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的成果



本文編號(hào):3797082

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3797082.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dbb13***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com