基于迭代神經(jīng)動態(tài)規(guī)劃的數(shù)據(jù)驅(qū)動非線性近似最優(yōu)調(diào)節(jié)
本文關(guān)鍵詞: 自適應(yīng)動態(tài)規(guī)劃 數(shù)據(jù)驅(qū)動控制 迭代神經(jīng)動態(tài)規(guī)劃 神經(jīng)網(wǎng)絡(luò) 非線性近似最優(yōu)調(diào)節(jié) 出處:《自動化學(xué)報》2017年03期 論文類型:期刊論文
【摘要】:利用數(shù)據(jù)驅(qū)動控制思想,建立一種設(shè)計(jì)離散時間非線性系統(tǒng)近似最優(yōu)調(diào)節(jié)器的迭代神經(jīng)動態(tài)規(guī)劃方法.提出針對離散時間一般非線性系統(tǒng)的迭代自適應(yīng)動態(tài)規(guī)劃算法并且證明其收斂性與最優(yōu)性.通過構(gòu)建三種神經(jīng)網(wǎng)絡(luò),給出全局二次啟發(fā)式動態(tài)規(guī)劃技術(shù)及其詳細(xì)的實(shí)現(xiàn)過程,其中執(zhí)行網(wǎng)絡(luò)是在神經(jīng)動態(tài)規(guī)劃的框架下進(jìn)行訓(xùn)練.這種新穎的結(jié)構(gòu)可以近似代價函數(shù)及其導(dǎo)函數(shù),同時在不依賴系統(tǒng)動態(tài)的情況下自適應(yīng)地學(xué)習(xí)近似最優(yōu)控制律.值得注意的是,這在降低對于控制矩陣或者其神經(jīng)網(wǎng)絡(luò)表示的要求方面,明顯地改進(jìn)了迭代自適應(yīng)動態(tài)規(guī)劃算法的現(xiàn)有結(jié)果,能夠促進(jìn)復(fù)雜非線性系統(tǒng)基于數(shù)據(jù)的優(yōu)化與控制設(shè)計(jì)的發(fā)展.通過兩個仿真實(shí)驗(yàn),驗(yàn)證本文提出的數(shù)據(jù)驅(qū)動最優(yōu)調(diào)節(jié)方法的有效性.
[Abstract]:The use of data driven control theory, dynamic programming method of iterative neural approximate optimal regulator to establish a design of discrete time nonlinear systems is proposed. Iterative adaptive dynamic programming algorithm for discrete time nonlinear systems and prove its convergence and optimality. Through the construction of three kinds of neural networks, the global technology and two heuristic dynamic programming the detailed implementation process, the implementation of network is trained in the framework of neural dynamic programming. This novel structure can approximate the cost function and its derivative function, at the same time does not depend on the system under the condition of dynamic adaptive learning approximate optimal control law. It is worth noting that, in the lower control matrix or the nerve the network said, obviously improved the existing iterative adaptive dynamic programming algorithm, can promote the complex non linear The development of system optimization and control design based on data. Through two simulation experiments validate the proposed data-driven effective optimal adjustment method.
【作者單位】: 中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室;天津市過程檢測與控制重點(diǎn)實(shí)驗(yàn)室 天津大學(xué)電氣自動化與信息工程學(xué)院;北京科技大學(xué)自動化學(xué)院;
【基金】:國家自然科學(xué)基金(61233001,61273140,61304018,61304086,61533017,U1501251,61411130160) 北京市自然科學(xué)基金(4162065) 天津市自然科學(xué)基金(14JCQNJC05400) 中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室優(yōu)秀人才基金 天津市過程檢測與控制重點(diǎn)實(shí)驗(yàn)室開放課題基金(TKLPMC-201612)資助~~
【分類號】:O232
【正文快照】: 最優(yōu)控制研究如何設(shè)計(jì)控制器使得系統(tǒng)的性能指標(biāo)達(dá)到最優(yōu).它廣泛存在于工程技術(shù)和社會生活中,是現(xiàn)代控制理論的重要內(nèi)容之一.與線性系統(tǒng)的最優(yōu)控制問題需要求解Riccati方程不同,研究非線性系統(tǒng)的最優(yōu)控制通常需要求解非線性HamiltonJacobi-Bellman(HJB)方程.例如,對于離散時間
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王雪枝;;大數(shù)據(jù)時代圖書館數(shù)據(jù)驅(qū)動服務(wù)模式的構(gòu)建[J];科技風(fēng);2013年20期
2 王方;蘇玉召;黃文睿;;數(shù)據(jù)驅(qū)動與目標(biāo)驅(qū)動的個性化比較[J];河南科技;2012年12期
3 張顏顏;唐立新;;改進(jìn)的數(shù)據(jù)驅(qū)動子空間算法求解鋼鐵企業(yè)能源預(yù)測問題[J];控制理論與應(yīng)用;2012年12期
4 任玉梅;;智慧城市的生活圖景[J];大眾科學(xué);2014年04期
5 楊麗君;劉渝妍;;基于數(shù)據(jù)驅(qū)動建模的毒情預(yù)測方法研究[J];云南警官學(xué)院學(xué)報;2012年04期
6 李朝霞;;元數(shù)據(jù)驅(qū)動的SaaS定制技術(shù)研究[J];科技信息;2013年01期
7 王衛(wèi)紅;侯忠生;霍海波;金尚泰;;基于數(shù)據(jù)驅(qū)動方法的控制器設(shè)計(jì)及其參數(shù)整定[J];系統(tǒng)科學(xué)與數(shù)學(xué);2010年06期
8 嚴(yán)金貴;羅軍;;數(shù)據(jù)驅(qū)動的MIS應(yīng)用系統(tǒng)平臺研究[J];科技資訊;2007年04期
9 哀微;朱學(xué)峰;;水廠混凝投藥大滯后過程的數(shù)據(jù)驅(qū)動直接控制方法[J];控制理論與應(yīng)用;2011年03期
10 鐘寧;梁佩鵬;秦裕林;呂勝富;楊延輝;李坤成;;數(shù)據(jù)驅(qū)動的科學(xué)發(fā)現(xiàn)的神經(jīng)機(jī)制:一項(xiàng)fMRI研究[J];中國科學(xué)(C輯:生命科學(xué));2009年03期
相關(guān)會議論文 前7條
1 胡繼華;;元數(shù)據(jù)驅(qū)動在信息資源管理中的應(yīng)用研究——以城建行業(yè)為例[A];中國地理信息系統(tǒng)協(xié)會第三次代表大會暨第七屆年會論文集[C];2003年
2 石磊;;數(shù)據(jù)驅(qū)動新聞的制約與挑戰(zhàn)[A];媒介化社會的社會文明建構(gòu)——第四屆“華中地區(qū)研究生新聞傳播學(xué)術(shù)論壇”優(yōu)秀論文集[C];2013年
3 韓守鵬;邱曉剛;黃柯棣;;動態(tài)數(shù)據(jù)驅(qū)動的適應(yīng)性建模與仿真[A];中國系統(tǒng)仿真學(xué)會第五次全國會員代表大會暨2006年全國學(xué)術(shù)年會論文集[C];2006年
4 鄒自明;;國際日地空間物理虛擬觀測臺新進(jìn)展[A];中國地球物理學(xué)會第二十四屆年會論文集[C];2008年
5 王承博;朱登明;;數(shù)據(jù)驅(qū)動的大規(guī)模水面動畫合成方法[A];第六屆全國幾何設(shè)計(jì)與計(jì)算學(xué)術(shù)會議論文集[C];2013年
6 劉倩;王緝憲;孫永海;;“數(shù)據(jù)驅(qū)動”的城市停車政策革新:方法與啟示——以深圳為例[A];:城鄉(xiāng)治理與規(guī)劃改革——2014中國城市規(guī)劃年會論文集(05 城市交通規(guī)劃)[C];2014年
7 黃大網(wǎng);南佐民;楊新亮;;數(shù)據(jù)驅(qū)動學(xué)習(xí)與英語寫作教學(xué)中的語域知識傳授——基于CLEC語料庫的個案研究[A];英語寫作教學(xué)與研究的中國視角——第四屆中國英語寫作教學(xué)與研究國際研討會論文集[C];2008年
相關(guān)重要報紙文章 前10條
1 上海科學(xué)學(xué)研究所 李輝 湯琦 梁Pr;數(shù)據(jù)驅(qū)動的創(chuàng)新[N];文匯報;2013年
2 趙國利;大數(shù)據(jù)驅(qū)動創(chuàng)新思維[N];解放軍報;2013年
3 吳勇毅;如何建立大數(shù)據(jù)驅(qū)動的商業(yè)模式[N];中國冶金報;2014年
4 羅慶朗;運(yùn)用大數(shù)據(jù)驅(qū)動創(chuàng)新發(fā)展[N];學(xué)習(xí)時報;2014年
5 本報記者 姚傳富;數(shù)據(jù)驅(qū)動業(yè)務(wù)已經(jīng)成為潮流[N];人民郵電;2014年
6 本報記者 別坤;大數(shù)據(jù)驅(qū)動智能交通[N];計(jì)算機(jī)世界;2013年
7 ;探尋“大數(shù)據(jù)驅(qū)動創(chuàng)新”的路徑[N];文匯報;2013年
8 中國科學(xué)院院士 郭華東;科學(xué)大數(shù)據(jù)驅(qū)動學(xué)科發(fā)展[N];中國信息化周報;2014年
9 本報記者 宋辰;新互聯(lián)時代 數(shù)據(jù)驅(qū)動商業(yè)變革[N];計(jì)算機(jī)世界;2013年
10 姜浩端 國務(wù)院發(fā)展研究中心信息中心副研究員;數(shù)據(jù)驅(qū)動決策的挑戰(zhàn)[N];中國經(jīng)濟(jì)時報;2013年
相關(guān)博士學(xué)位論文 前10條
1 汲小溪;大數(shù)據(jù)驅(qū)動的計(jì)算生物標(biāo)識研究[D];復(fù)旦大學(xué);2014年
2 黃愛芹;基于數(shù)據(jù)驅(qū)動的調(diào)節(jié)閥故障診斷方法研究[D];山東大學(xué);2015年
3 馬驍鵬;基于數(shù)據(jù)驅(qū)動的時變太陽風(fēng)磁流體數(shù)值模擬[D];中國科學(xué)院國家空間科學(xué)中心;2016年
4 王楊剛;基于數(shù)據(jù)驅(qū)動的基礎(chǔ)地質(zhì)圖件更新關(guān)鍵技術(shù)研究[D];中國地質(zhì)大學(xué)(北京);2016年
5 何章鳴;非預(yù)期故障的數(shù)據(jù)驅(qū)動診斷方法研究[D];國防科學(xué)技術(shù)大學(xué);2015年
6 丁建偉;數(shù)據(jù)驅(qū)動的復(fù)雜裝備異常檢測方法[D];清華大學(xué);2015年
7 洪悅;基于機(jī)理和數(shù)據(jù)驅(qū)動的冷軋生產(chǎn)過程操作優(yōu)化研究[D];東北大學(xué);2014年
8 劉強(qiáng);數(shù)據(jù)驅(qū)動與機(jī)理分析相結(jié)合的冷軋連退過程故障診斷方法研究[D];東北大學(xué);2012年
9 李永強(qiáng);數(shù)據(jù)驅(qū)動非線性控制:鎮(zhèn)定、最優(yōu)鎮(zhèn)定以及輸出跟蹤[D];北京交通大學(xué);2014年
10 謝雯;網(wǎng)絡(luò)化系統(tǒng)中的數(shù)據(jù)驅(qū)動估計(jì)與控制[D];北京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 李方前;基于數(shù)據(jù)驅(qū)動的TE過程故障診斷研究[D];昆明理工大學(xué);2015年
2 劉浩;基于即時學(xué)習(xí)的模型未知系統(tǒng)數(shù)據(jù)驅(qū)動控制策略研究[D];燕山大學(xué);2015年
3 周晶晶;基于語料庫的大學(xué)英語詞匯教學(xué)實(shí)證研究[D];閩南師范大學(xué);2015年
4 薛亮;數(shù)據(jù)驅(qū)動的商品推送系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
5 陳金龍;大數(shù)據(jù)驅(qū)動的智能交通云服務(wù)構(gòu)建與組合技術(shù)研究[D];杭州師范大學(xué);2015年
6 李曉晨;面向軟件倉庫挖掘的數(shù)據(jù)驅(qū)動特征構(gòu)建方法[D];大連理工大學(xué);2015年
7 王秋鈺;大數(shù)據(jù)驅(qū)動下的影響者營銷研究[D];南京大學(xué);2015年
8 汪盼;基于語料庫的數(shù)據(jù)驅(qū)動學(xué)習(xí)法在初中英語語法課堂教學(xué)中的運(yùn)用研究[D];杭州師范大學(xué);2015年
9 李娜;基于數(shù)據(jù)驅(qū)動的PID控制器優(yōu)化研究[D];華北電力大學(xué);2015年
10 黃鼎慧;基于數(shù)據(jù)驅(qū)動的FAO系統(tǒng)測試方法研究[D];北京交通大學(xué);2016年
,本文編號:1481111
本文鏈接:http://sikaile.net/kejilunwen/yysx/1481111.html