天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

模型自由的離散時間系統(tǒng)的隨機(jī)線性二次最優(yōu)控制

發(fā)布時間:2017-07-29 08:33

  本文關(guān)鍵詞:模型自由的離散時間系統(tǒng)的隨機(jī)線性二次最優(yōu)控制


  更多相關(guān)文章: Q學(xué)習(xí)算法 值函數(shù) 隨機(jī)線性二次最優(yōu)控制 隨機(jī)代數(shù)方程


【摘要】:針對模型自由的隨機(jī)線性離散時間系統(tǒng),通過Q學(xué)習(xí)算法求解無限時間隨機(jī)線性二次最優(yōu)控制問題。首先根據(jù)貝爾曼最優(yōu)性原理定義Q函數(shù),通過值迭代算法的思想構(gòu)造Q學(xué)習(xí)算法;其次給出Q學(xué)習(xí)算法的等價形式并證明其收斂性;最后通過一個仿真實例說明Q學(xué)習(xí)算法的有效性。
【作者單位】: 遼寧石油化工大學(xué)理學(xué)院;東北大學(xué)信息科學(xué)與工程學(xué)院;沈陽師范大學(xué)計算機(jī)與數(shù)學(xué)基礎(chǔ)教學(xué)部;
【關(guān)鍵詞】Q學(xué)習(xí)算法 值函數(shù) 隨機(jī)線性二次最優(yōu)控制 隨機(jī)代數(shù)方程
【基金】:教育部基本科研業(yè)務(wù)項目(N140404004)
【分類號】:TP13
【正文快照】: 隨機(jī)線性二次(SLQ)最優(yōu)控制問題由W.M.Wonhan[1]首次提出,隨后得到了迅速的發(fā)展[2-5]。SLQ最優(yōu)控制問題的可解性等價于求解隨機(jī)代數(shù)方程,文獻(xiàn)[6]引入了一般化Riccati方程,充分論證了SLQ最優(yōu)控制問題的可解性等價于一般化Riccati方程的可解性;文獻(xiàn)[7]通過矩陣?yán)窭嗜斩ɡ斫o出

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 楊朋松;孫秀霞;董文瀚;武杰;;一類不確定離散時間系統(tǒng)的積分滑模控制[J];控制與決策;2012年09期

2 戴冠中;離散時間系統(tǒng)的定常狀態(tài)估計器[J];控制理論與應(yīng)用;1984年02期

3 許慶山;;離散時間系統(tǒng)狀態(tài)方程時域解的討論[J];工科電工教學(xué);1988年02期

4 周瑗;;計算機(jī)模擬離散時間系統(tǒng)卷積和求解過程[J];武測科技;1991年04期

5 王子棟,唐國慶;方差約束了不確定線性離散時間系統(tǒng)的魯棒H_∞控制(英文)[J];控制理論與應(yīng)用;1997年02期

6 史林杰;離散時間系統(tǒng)邊界條件的確定準(zhǔn)則[J];電工教學(xué);1997年02期

7 王佐偉;吳宏鑫;;非線性離散時間系統(tǒng)的自適應(yīng)模糊補(bǔ)償控制[J];控制工程;2004年01期

8 趙亞丹;王亞慧;程培新;;離散時間系統(tǒng)變結(jié)構(gòu)擬滑?刂聘倪M(jìn)算法[J];計算機(jī)仿真;2008年11期

9 林小峰;張衡;宋紹劍;宋春寧;;非線性離散時間系統(tǒng)帶ε誤差限的自適應(yīng)動態(tài)規(guī)劃[J];控制與決策;2011年10期

10 阮榮耀;多輸入—多輸出離散時間系統(tǒng)的辨識和最優(yōu)控制設(shè)計的軟件[J];信息與控制;1982年06期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 郁文生;黃琳;;關(guān)于離散時間系統(tǒng)魯棒嚴(yán)格正實鎮(zhèn)定的幾個問題[A];1998年中國控制會議論文集[C];1998年

2 李少遠(yuǎn);曹保定;;離散控制系統(tǒng)數(shù)學(xué)模型的重新參數(shù)化[A];1994中國控制與決策學(xué)術(shù)年會論文集[C];1994年

3 戴浩暉;陳樹中;汪志鳴;;非線性離散時間系統(tǒng)穩(wěn)定性的李雅普諾夫方法[A];第二十四屆中國控制會議論文集(上冊)[C];2005年

4 馬維海;王美春;蓋如棟;;離散時間系統(tǒng)Δ調(diào)制的混沌動力學(xué)研究[A];2007'儀表,自動化及先進(jìn)集成技術(shù)大會論文集(二)[C];2007年

5 阮榮耀;李勇智;潘仁良;畢平;;控制方向未知的離散時間系統(tǒng)的自適應(yīng)調(diào)節(jié)[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年

6 陳寧;桂衛(wèi)華;張小峰;;具有范數(shù)界參數(shù)不確定性多通道離散時間系統(tǒng)的魯棒分散H_∞控制[A];第二十四屆中國控制會議論文集(下冊)[C];2005年

7 魏麗霞;崔寶同;李向麗;;一種離散時間系統(tǒng)變結(jié)構(gòu)控制的方法[A];全國自動化新技術(shù)學(xué)術(shù)交流會會議論文集(一)[C];2005年

8 郝飛;楚天廣;黃琳;;離散時間系統(tǒng)混合l_1/H_∞-控制問題[A];第二十屆中國控制會議論文集(上)[C];2001年

9 朱尚偉;伍鏡波;;Hilbert空間上纏結(jié)離散時間系統(tǒng)的穩(wěn)定性[A];第二十屆中國控制會議論文集(下)[C];2001年

10 陳彭年;韓正之;;C*代數(shù)上離散時間系統(tǒng)的鎮(zhèn)定[A];1993中國控制與決策學(xué)術(shù)年會論文集[C];1993年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 黃淼;非線性離散時間系統(tǒng)多模型自適應(yīng)控制策略研究[D];華東理工大學(xué);2015年

2 韓士元;含有控制時滯離散時間系統(tǒng)的最優(yōu)控制及其應(yīng)用研究[D];中國海洋大學(xué);2012年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 范一心;多時滯離散時間系統(tǒng)跟蹤控制[D];浙江工業(yè)大學(xué);2015年

2 韓秀梅;兩類離散時間系統(tǒng)的事件觸發(fā)控制[D];東北大學(xué);2014年

3 劉凱;一般非線性離散時間系統(tǒng)的輸入到狀態(tài)穩(wěn)定性研究[D];鄭州大學(xué);2008年

4 王晶晶;基于PCGSHF的離散時間MIMO系統(tǒng)零點(diǎn)穩(wěn)定性研究[D];重慶大學(xué);2010年

5 李俊領(lǐng);離散時間系統(tǒng)直接型與魯棒混雜間接型模型參考自適應(yīng)控制[D];曲阜師范大學(xué);2006年

6 孫娜娜;不確定離散時間系統(tǒng)滑?刂蒲芯縖D];華東理工大學(xué);2013年

7 張德霞;離散時間系統(tǒng)自適應(yīng)迭代學(xué)習(xí)控制中的幾類問題研究[D];青島科技大學(xué);2014年

8 李平;線性離散時間系統(tǒng)的魯棒自適應(yīng)控制方法研究[D];曲阜師范大學(xué);2014年

9 羅劉敏;離散時間系統(tǒng)滑模變結(jié)構(gòu)控制理論若干問題研究[D];東北大學(xué);2009年

10 李慧珍;不確定時變時滯非線性離散時間系統(tǒng)的魯棒H_∞控制[D];遼寧科技大學(xué);2013年



本文編號:588293

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/588293.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eeb7b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com