天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于數(shù)據(jù)驅(qū)動的離散系統(tǒng)迭代學(xué)習(xí)控制與強化學(xué)習(xí)控制的研究

發(fā)布時間:2017-08-20 09:36

  本文關(guān)鍵詞:基于數(shù)據(jù)驅(qū)動的離散系統(tǒng)迭代學(xué)習(xí)控制與強化學(xué)習(xí)控制的研究


  更多相關(guān)文章: 數(shù)據(jù)驅(qū)動 不適定問題 Tikhonov正則化 迭代學(xué)習(xí)控制 強化學(xué)習(xí)控制


【摘要】:計算機技術(shù)的發(fā)展,使得數(shù)據(jù)易于存儲和處理,這使運用基于數(shù)據(jù)驅(qū)動的控制方法成為可能。這種方法不需要分析系統(tǒng)內(nèi)部的詳細知識,也不需要知道系統(tǒng)運行的基本規(guī)律,僅僅涉及控制理論過程中的輸入輸出數(shù)據(jù),因此適用于帶非線性和不確定性的復(fù)雜控制模型。由于計算機所存儲的數(shù)據(jù)是從實際系統(tǒng)中測量得到的,從而導(dǎo)致了這些數(shù)據(jù)不可避免地會受到外界噪聲的擾動。這導(dǎo)致基于數(shù)據(jù)驅(qū)動的控制方法,在某些情況下會變得不適定。本文主要對基于數(shù)據(jù)驅(qū)動的離散系統(tǒng)迭代學(xué)控制與強化學(xué)習(xí)控制中出現(xiàn)的不適定性進行研究。所做工作主要有以下兩點:1.針對于離散系統(tǒng)的迭代學(xué)習(xí)控制問題,提出了一個改進的算法。在使用迭代學(xué)習(xí)控制過程中,由于系統(tǒng)初始值發(fā)生偏移,導(dǎo)致控制輸入序列的誤差增大。針對這個問題,提出在迭代學(xué)習(xí)控制過程中對系統(tǒng)的脈沖響應(yīng)序列進行修正的策略,同時采用正則化理論的方法,得到了一個改進的迭代學(xué)習(xí)控制算法。這個算法可以在一定程度上克服由系統(tǒng)初態(tài)的隨機性而引起的擾動,提高迭代學(xué)習(xí)控制算法的穩(wěn)定性。仿真算例說明了該算法的有效性。2.研究了基于數(shù)據(jù)驅(qū)動的離散系統(tǒng)強化學(xué)習(xí)控制中的正則化問題為了使性能指標(biāo)達到最優(yōu),在求解最優(yōu)控制序列的過程中,針對強化學(xué)習(xí)控制中出現(xiàn)的不適定性,采用Tikhonov正則化的方法,在線性二次型調(diào)節(jié)器的Bellman方程中加入正則化參數(shù),從而得到改進的離散系統(tǒng)強化學(xué)習(xí)算法。所給出算法具有更好的穩(wěn)定性。仿真實例表明該方法具有可行性和有效性。
【關(guān)鍵詞】:數(shù)據(jù)驅(qū)動 不適定問題 Tikhonov正則化 迭代學(xué)習(xí)控制 強化學(xué)習(xí)控制
【學(xué)位授予單位】:遼寧科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP13
【目錄】:
  • 中文摘要5-6
  • ABSTRACT6-9
  • 1. 緒論9-12
  • 1.1 研究背景及意義9
  • 1.2 國內(nèi)外研究現(xiàn)狀9-11
  • 1.2.1 控制理論及控制工程的研究現(xiàn)狀及發(fā)展9-10
  • 1.2.2 數(shù)據(jù)驅(qū)動控制的研究現(xiàn)狀及發(fā)展10-11
  • 1.3 論文研究內(nèi)容及組織結(jié)構(gòu)11-12
  • 2. 基本理論知識12-19
  • 2.1 最優(yōu)控制的基本理論12-15
  • 2.1.1 最優(yōu)控制12-13
  • 2.1.2 動態(tài)規(guī)劃13-15
  • 2.2 不適定問題和Tikhonov正則化15-19
  • 2.2.1 不適定問題16-17
  • 2.2.2 Tikhonov正則化17-19
  • 3. 基于數(shù)據(jù)驅(qū)動的迭代學(xué)習(xí)控制19-32
  • 3.1 迭代學(xué)習(xí)控制19-20
  • 3.2 基于數(shù)據(jù)的迭代學(xué)習(xí)控制的不適定性20-24
  • 3.2.1 模型知識20-22
  • 3.2.2 基于正則化理論的迭代學(xué)習(xí)控制修正公式22
  • 3.2.3 關(guān)于初值的進一步討論22-24
  • 3.2.4 基于正則化理論的迭代學(xué)習(xí)算法24
  • 3.3 算例仿真24-31
  • 3.4 本章小結(jié)31-32
  • 4. 基于數(shù)據(jù)驅(qū)動的強化學(xué)習(xí)控制32-48
  • 4.1 引言32
  • 4.2 模型描述32-36
  • 4.2.1 線性二次型調(diào)節(jié)器問題的不適定性32-34
  • 4.2.2 差分,PI算法和VI算法34-36
  • 4.3 基于輸出反饋(OPFB)的PI算法和VI算法36-41
  • 4.3.1 關(guān)于可測數(shù)據(jù)的價值函數(shù)[59]37-39
  • 4.3.2 關(guān)于可測數(shù)據(jù)的差分誤差和策略修正39-40
  • 4.3.3 基于OPFB的PI算法40-41
  • 4.3.4 基于OPFB的VI算法41
  • 4.4 算例仿真41-47
  • 4.4.1 OPFB VI算法的實例仿真41-45
  • 4.4.2 OPFB PI算法的實例仿真45-47
  • 4.5 本章小結(jié)47-48
  • 5. 結(jié)論與展望48-49
  • 5.1 結(jié)論48
  • 5.2 展望48-49
  • 參考文獻49-53
  • 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況53-54
  • 致謝54-55
  • 作者簡介55

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 石成英 ,林輝;迭代學(xué)習(xí)控制的研究與應(yīng)用進展[J];測控技術(shù);2004年02期

2 李仁俊,韓正之;迭代學(xué)習(xí)控制綜述[J];控制與決策;2005年09期

3 張興國;林輝;;迭代學(xué)習(xí)控制理論進展與展望[J];測控技術(shù);2006年11期

4 陳若珠;宋軍偉;李戰(zhàn)明;;迭代學(xué)習(xí)控制在大慣性系統(tǒng)中的應(yīng)用[J];微計算機信息;2007年19期

5 孔祥波;郝曉弘;;迭代學(xué)習(xí)控制的研究與應(yīng)用[J];甘肅科技;2008年07期

6 馬航;楊俊友;袁琳;;迭代學(xué)習(xí)控制研究現(xiàn)狀與趨勢[J];控制工程;2009年03期

7 郝曉弘;胡振邦;朱潔;秦睿;;迭代學(xué)習(xí)控制的研究現(xiàn)狀[J];微型機與應(yīng)用;2010年11期

8 趙麗莉;孫明軒;金奎;;一類非線性不確定系統(tǒng)的迭代學(xué)習(xí)控制[J];浙江工業(yè)大學(xué)學(xué)報;2011年02期

9 苗靜;;迭代學(xué)習(xí)控制理論[J];西安工業(yè)大學(xué)學(xué)報;2011年05期

10 阮小娥;樸光賢;卞增男;;迭代學(xué)習(xí)控制技術(shù)回顧與長期學(xué)習(xí)控制展望(英文)[J];控制理論與應(yīng)用;2012年08期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 畢勝;王福根;鄢達來;吳懷宇;章剛?cè)A;熊沈蜀;周兆英;;功能性電刺激P型迭代學(xué)習(xí)控制方法的研究[A];中國康復(fù)醫(yī)學(xué)會第四屆會員代表大會暨第三屆中國康復(fù)醫(yī)學(xué)學(xué)術(shù)大會論文匯編[C];2001年

2 高巍;孫明軒;俞立;;有界輸入下的迭代學(xué)習(xí)控制[A];第二十四屆中國控制會議論文集(上冊)[C];2005年

3 孫小強;王銀河;;一類組合大系統(tǒng)簡單迭代學(xué)習(xí)控制的收斂性[A];2005全國自動化新技術(shù)學(xué)術(shù)交流會論文集(三)[C];2005年

4 劉山;林堅;;基于二自由度控制的魯棒迭代學(xué)習(xí)控制設(shè)計[A];第二十六屆中國控制會議論文集[C];2007年

5 沈棟;陳翰馥;;Hammerstein-Wiener系統(tǒng)的迭代學(xué)習(xí)控制[A];第二十九屆中國控制會議論文集[C];2010年

6 蘭永紅;;基于二維模型的魯棒D型迭代學(xué)習(xí)控制[A];中國自動化學(xué)會控制理論專業(yè)委員會C卷[C];2011年

7 孫明軒;王惠峰;畢宏博;;反饋輔助迭代學(xué)習(xí)控制[A];第25屆中國控制與決策會議論文集[C];2013年

8 孫明軒;萬伯任;;迭代學(xué)習(xí)控制系統(tǒng)的初始條件問題[A];1995年中國智能自動化學(xué)術(shù)會議暨智能自動化專業(yè)委員會成立大會論文集(下冊)[C];1995年

9 師佳;江青茵;曹志凱;周華;;一種基于2維魯棒預(yù)測控制的迭代學(xué)習(xí)控制方案[A];第二十九屆中國控制會議論文集[C];2010年

10 池榮虎;侯忠生;;基于學(xué)習(xí)自適應(yīng)估計環(huán)的迭代學(xué)習(xí)控制[A];第三屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2005年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 張春麗;幾類非線性系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制研究[D];西安電子科技大學(xué);2014年

2 張瑞坤;受限非線性參數(shù)化系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制[D];北京交通大學(xué);2016年

3 謝振東;非線性迭代學(xué)習(xí)控制理論及其在機器人控制中的應(yīng)用[D];華南理工大學(xué);2000年

4 姜曉明;迭代學(xué)習(xí)控制方法及其在掃描光刻系統(tǒng)中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2014年

5 王軼;基于迭代學(xué)習(xí)控制的幾類列車自動控制問題研究[D];北京交通大學(xué);2010年

6 楊勝躍;迭代學(xué)習(xí)控制算法設(shè)計與優(yōu)化研究[D];中南大學(xué);2004年

7 曹偉;迭代學(xué)習(xí)控制及其在故障診斷中的應(yīng)用研究[D];哈爾濱工程大學(xué);2013年

8 徐敏;基于迭代學(xué)習(xí)控制理論的勵磁控制研究[D];西北工業(yè)大學(xué);2005年

9 柳春平;迭代學(xué)習(xí)控制理論及其在網(wǎng)絡(luò)控制系統(tǒng)中的應(yīng)用[D];浙江大學(xué);2013年

10 池榮虎;非線性離散時間系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制及應(yīng)用[D];北京交通大學(xué);2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 蔡麗;抗非重復(fù)性干擾的迭代學(xué)習(xí)控制研究[D];鄭州大學(xué);2011年

2 李彩麗;基于迭代域的迭代學(xué)習(xí)控制方法的研究[D];大連海事大學(xué);2015年

3 魏少龍;二維LQG基準(zhǔn)下迭代學(xué)習(xí)控制的性能評估[D];北京化工大學(xué);2015年

4 趙麗娜;基于迭代學(xué)習(xí)控制的有限狀態(tài)機在動力型假肢中的應(yīng)用[D];河北工業(yè)大學(xué);2015年

5 余劍平;非線性系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制[D];云南師范大學(xué);2015年

6 張暢;具有重復(fù)特性系統(tǒng)的控制方法研究[D];東北石油大學(xué);2015年

7 李廣印;基于未知控制方向的非線性系統(tǒng)的自適應(yīng)學(xué)習(xí)控制[D];云南師范大學(xué);2015年

8 錢亞中;自適應(yīng)魯棒重復(fù)/迭代學(xué)習(xí)控制及其在電機上的應(yīng)用[D];浙江工業(yè)大學(xué);2015年

9 陳樂劍;約束自適應(yīng)模糊迭代學(xué)習(xí)控制[D];浙江工業(yè)大學(xué);2015年

10 顧偉國;幾類非線性系統(tǒng)的迭代學(xué)習(xí)控制[D];蘇州科技學(xué)院;2015年

,

本文編號:705912

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/705912.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶93c22***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com