基于ADP算法的隨機離散線性二次最優(yōu)控制問題的研究
發(fā)布時間:2020-12-05 13:57
隨著現(xiàn)代科學技術的快速發(fā)展,工業(yè)生產過程變得異常復雜.受不確定性、強非線性和多變量等因素的影響,很難用精確的數學模型描述系統(tǒng)的動態(tài)特性,從而對研究最優(yōu)控制問題造成了極大的困難.因此,未知系統(tǒng)下的最優(yōu)控制問題成為研究熱點.本文提出基于神經網絡的自適應動態(tài)規(guī)劃(Adaptive/Approximate Dynamic Programming,ADP)算法研究未知隨機離散系統(tǒng)在無限時域的線性二次型(Linear Quadratic,LQ)最優(yōu)控制問題.具體研究內容如下:一、研究了未知平均場隨機離散系統(tǒng)下在無限時域的LQ最優(yōu)控制問題.首先,將黎卡提(Riccati)方程推廣到廣義的Riccati方程組,狀態(tài)反饋增益矩陣擴展為增益矩陣對,給出了平均場系統(tǒng)的LQ最優(yōu)控制存在的充分條件.然后,將隨機系統(tǒng)轉化為確定性系統(tǒng),提出一種值迭代的ADP算法并進行了收斂性分析.同時,用反向傳播(Back Propagation,BP)神經網絡設計模型網絡、評價網絡和執(zhí)行網絡來分別估計未知的系統(tǒng)模型、目標函數、控制增益矩陣對.最后,通過系統(tǒng)仿真驗證了ADP方法的有效性.二、解決了未知的斯坦克爾伯格博弈隨機離散系統(tǒng)...
【文章來源】:山東科技大學山東省
【文章頁數】:62 頁
【學位級別】:碩士
【部分圖文】:
圖2.1?HDP結構示意圖??
?10?12?14?16?1?已?20??Time?steps??圖3.2狀態(tài)曲線圖X??Fig.?3.2?The?state?trajectory?X??21??
?10??T*mo?stops??圖3.1狀態(tài)曲線圖叉??Fig.?3.1?The?state?trajectory?X??8?k?I?!?i?l?i?i?
【參考文獻】:
碩士論文
[1]一類宏觀經濟系統(tǒng)及其線性二次型最優(yōu)控制[D]. 曹雋喆.大連理工大學 2009
本文編號:2899559
【文章來源】:山東科技大學山東省
【文章頁數】:62 頁
【學位級別】:碩士
【部分圖文】:
圖2.1?HDP結構示意圖??
?10?12?14?16?1?已?20??Time?steps??圖3.2狀態(tài)曲線圖X??Fig.?3.2?The?state?trajectory?X??21??
?10??T*mo?stops??圖3.1狀態(tài)曲線圖叉??Fig.?3.1?The?state?trajectory?X??8?k?I?!?i?l?i?i?
【參考文獻】:
碩士論文
[1]一類宏觀經濟系統(tǒng)及其線性二次型最優(yōu)控制[D]. 曹雋喆.大連理工大學 2009
本文編號:2899559
本文鏈接:http://sikaile.net/kejilunwen/yysx/2899559.html