基于迭代神經動態(tài)規(guī)劃的數(shù)據(jù)驅動非線性近似最優(yōu)調節(jié)
本文關鍵詞: 自適應動態(tài)規(guī)劃 數(shù)據(jù)驅動控制 迭代神經動態(tài)規(guī)劃 神經網絡 非線性近似最優(yōu)調節(jié) 出處:《自動化學報》2017年03期 論文類型:期刊論文
【摘要】:利用數(shù)據(jù)驅動控制思想,建立一種設計離散時間非線性系統(tǒng)近似最優(yōu)調節(jié)器的迭代神經動態(tài)規(guī)劃方法.提出針對離散時間一般非線性系統(tǒng)的迭代自適應動態(tài)規(guī)劃算法并且證明其收斂性與最優(yōu)性.通過構建三種神經網絡,給出全局二次啟發(fā)式動態(tài)規(guī)劃技術及其詳細的實現(xiàn)過程,其中執(zhí)行網絡是在神經動態(tài)規(guī)劃的框架下進行訓練.這種新穎的結構可以近似代價函數(shù)及其導函數(shù),同時在不依賴系統(tǒng)動態(tài)的情況下自適應地學習近似最優(yōu)控制律.值得注意的是,這在降低對于控制矩陣或者其神經網絡表示的要求方面,明顯地改進了迭代自適應動態(tài)規(guī)劃算法的現(xiàn)有結果,能夠促進復雜非線性系統(tǒng)基于數(shù)據(jù)的優(yōu)化與控制設計的發(fā)展.通過兩個仿真實驗,驗證本文提出的數(shù)據(jù)驅動最優(yōu)調節(jié)方法的有效性.
[Abstract]:The use of data driven control theory, dynamic programming method of iterative neural approximate optimal regulator to establish a design of discrete time nonlinear systems is proposed. Iterative adaptive dynamic programming algorithm for discrete time nonlinear systems and prove its convergence and optimality. Through the construction of three kinds of neural networks, the global technology and two heuristic dynamic programming the detailed implementation process, the implementation of network is trained in the framework of neural dynamic programming. This novel structure can approximate the cost function and its derivative function, at the same time does not depend on the system under the condition of dynamic adaptive learning approximate optimal control law. It is worth noting that, in the lower control matrix or the nerve the network said, obviously improved the existing iterative adaptive dynamic programming algorithm, can promote the complex non linear The development of system optimization and control design based on data. Through two simulation experiments validate the proposed data-driven effective optimal adjustment method.
【作者單位】: 中國科學院自動化研究所復雜系統(tǒng)管理與控制國家重點實驗室;天津市過程檢測與控制重點實驗室 天津大學電氣自動化與信息工程學院;北京科技大學自動化學院;
【基金】:國家自然科學基金(61233001,61273140,61304018,61304086,61533017,U1501251,61411130160) 北京市自然科學基金(4162065) 天津市自然科學基金(14JCQNJC05400) 中國科學院自動化研究所復雜系統(tǒng)管理與控制國家重點實驗室優(yōu)秀人才基金 天津市過程檢測與控制重點實驗室開放課題基金(TKLPMC-201612)資助~~
【分類號】:O232
【正文快照】: 最優(yōu)控制研究如何設計控制器使得系統(tǒng)的性能指標達到最優(yōu).它廣泛存在于工程技術和社會生活中,是現(xiàn)代控制理論的重要內容之一.與線性系統(tǒng)的最優(yōu)控制問題需要求解Riccati方程不同,研究非線性系統(tǒng)的最優(yōu)控制通常需要求解非線性HamiltonJacobi-Bellman(HJB)方程.例如,對于離散時間
【相似文獻】
相關期刊論文 前10條
1 王雪枝;;大數(shù)據(jù)時代圖書館數(shù)據(jù)驅動服務模式的構建[J];科技風;2013年20期
2 王方;蘇玉召;黃文睿;;數(shù)據(jù)驅動與目標驅動的個性化比較[J];河南科技;2012年12期
3 張顏顏;唐立新;;改進的數(shù)據(jù)驅動子空間算法求解鋼鐵企業(yè)能源預測問題[J];控制理論與應用;2012年12期
4 任玉梅;;智慧城市的生活圖景[J];大眾科學;2014年04期
5 楊麗君;劉渝妍;;基于數(shù)據(jù)驅動建模的毒情預測方法研究[J];云南警官學院學報;2012年04期
6 李朝霞;;元數(shù)據(jù)驅動的SaaS定制技術研究[J];科技信息;2013年01期
7 王衛(wèi)紅;侯忠生;霍海波;金尚泰;;基于數(shù)據(jù)驅動方法的控制器設計及其參數(shù)整定[J];系統(tǒng)科學與數(shù)學;2010年06期
8 嚴金貴;羅軍;;數(shù)據(jù)驅動的MIS應用系統(tǒng)平臺研究[J];科技資訊;2007年04期
9 哀微;朱學峰;;水廠混凝投藥大滯后過程的數(shù)據(jù)驅動直接控制方法[J];控制理論與應用;2011年03期
10 鐘寧;梁佩鵬;秦裕林;呂勝富;楊延輝;李坤成;;數(shù)據(jù)驅動的科學發(fā)現(xiàn)的神經機制:一項fMRI研究[J];中國科學(C輯:生命科學);2009年03期
相關會議論文 前7條
1 胡繼華;;元數(shù)據(jù)驅動在信息資源管理中的應用研究——以城建行業(yè)為例[A];中國地理信息系統(tǒng)協(xié)會第三次代表大會暨第七屆年會論文集[C];2003年
2 石磊;;數(shù)據(jù)驅動新聞的制約與挑戰(zhàn)[A];媒介化社會的社會文明建構——第四屆“華中地區(qū)研究生新聞傳播學術論壇”優(yōu)秀論文集[C];2013年
3 韓守鵬;邱曉剛;黃柯棣;;動態(tài)數(shù)據(jù)驅動的適應性建模與仿真[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年
4 鄒自明;;國際日地空間物理虛擬觀測臺新進展[A];中國地球物理學會第二十四屆年會論文集[C];2008年
5 王承博;朱登明;;數(shù)據(jù)驅動的大規(guī)模水面動畫合成方法[A];第六屆全國幾何設計與計算學術會議論文集[C];2013年
6 劉倩;王緝憲;孫永海;;“數(shù)據(jù)驅動”的城市停車政策革新:方法與啟示——以深圳為例[A];:城鄉(xiāng)治理與規(guī)劃改革——2014中國城市規(guī)劃年會論文集(05 城市交通規(guī)劃)[C];2014年
7 黃大網;南佐民;楊新亮;;數(shù)據(jù)驅動學習與英語寫作教學中的語域知識傳授——基于CLEC語料庫的個案研究[A];英語寫作教學與研究的中國視角——第四屆中國英語寫作教學與研究國際研討會論文集[C];2008年
相關重要報紙文章 前10條
1 上?茖W學研究所 李輝 湯琦 梁Pr;數(shù)據(jù)驅動的創(chuàng)新[N];文匯報;2013年
2 趙國利;大數(shù)據(jù)驅動創(chuàng)新思維[N];解放軍報;2013年
3 吳勇毅;如何建立大數(shù)據(jù)驅動的商業(yè)模式[N];中國冶金報;2014年
4 羅慶朗;運用大數(shù)據(jù)驅動創(chuàng)新發(fā)展[N];學習時報;2014年
5 本報記者 姚傳富;數(shù)據(jù)驅動業(yè)務已經成為潮流[N];人民郵電;2014年
6 本報記者 別坤;大數(shù)據(jù)驅動智能交通[N];計算機世界;2013年
7 ;探尋“大數(shù)據(jù)驅動創(chuàng)新”的路徑[N];文匯報;2013年
8 中國科學院院士 郭華東;科學大數(shù)據(jù)驅動學科發(fā)展[N];中國信息化周報;2014年
9 本報記者 宋辰;新互聯(lián)時代 數(shù)據(jù)驅動商業(yè)變革[N];計算機世界;2013年
10 姜浩端 國務院發(fā)展研究中心信息中心副研究員;數(shù)據(jù)驅動決策的挑戰(zhàn)[N];中國經濟時報;2013年
相關博士學位論文 前10條
1 汲小溪;大數(shù)據(jù)驅動的計算生物標識研究[D];復旦大學;2014年
2 黃愛芹;基于數(shù)據(jù)驅動的調節(jié)閥故障診斷方法研究[D];山東大學;2015年
3 馬驍鵬;基于數(shù)據(jù)驅動的時變太陽風磁流體數(shù)值模擬[D];中國科學院國家空間科學中心;2016年
4 王楊剛;基于數(shù)據(jù)驅動的基礎地質圖件更新關鍵技術研究[D];中國地質大學(北京);2016年
5 何章鳴;非預期故障的數(shù)據(jù)驅動診斷方法研究[D];國防科學技術大學;2015年
6 丁建偉;數(shù)據(jù)驅動的復雜裝備異常檢測方法[D];清華大學;2015年
7 洪悅;基于機理和數(shù)據(jù)驅動的冷軋生產過程操作優(yōu)化研究[D];東北大學;2014年
8 劉強;數(shù)據(jù)驅動與機理分析相結合的冷軋連退過程故障診斷方法研究[D];東北大學;2012年
9 李永強;數(shù)據(jù)驅動非線性控制:鎮(zhèn)定、最優(yōu)鎮(zhèn)定以及輸出跟蹤[D];北京交通大學;2014年
10 謝雯;網絡化系統(tǒng)中的數(shù)據(jù)驅動估計與控制[D];北京理工大學;2014年
相關碩士學位論文 前10條
1 李方前;基于數(shù)據(jù)驅動的TE過程故障診斷研究[D];昆明理工大學;2015年
2 劉浩;基于即時學習的模型未知系統(tǒng)數(shù)據(jù)驅動控制策略研究[D];燕山大學;2015年
3 周晶晶;基于語料庫的大學英語詞匯教學實證研究[D];閩南師范大學;2015年
4 薛亮;數(shù)據(jù)驅動的商品推送系統(tǒng)的設計與實現(xiàn)[D];哈爾濱工業(yè)大學;2015年
5 陳金龍;大數(shù)據(jù)驅動的智能交通云服務構建與組合技術研究[D];杭州師范大學;2015年
6 李曉晨;面向軟件倉庫挖掘的數(shù)據(jù)驅動特征構建方法[D];大連理工大學;2015年
7 王秋鈺;大數(shù)據(jù)驅動下的影響者營銷研究[D];南京大學;2015年
8 汪盼;基于語料庫的數(shù)據(jù)驅動學習法在初中英語語法課堂教學中的運用研究[D];杭州師范大學;2015年
9 李娜;基于數(shù)據(jù)驅動的PID控制器優(yōu)化研究[D];華北電力大學;2015年
10 黃鼎慧;基于數(shù)據(jù)驅動的FAO系統(tǒng)測試方法研究[D];北京交通大學;2016年
,本文編號:1481111
本文鏈接:http://sikaile.net/kejilunwen/yysx/1481111.html