基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究

發(fā)布時(shí)間：2022-08-23 22:50

　　PID控制器是現(xiàn)代工業(yè)中最常用的控制器,具有結(jié)構(gòu)簡(jiǎn)單、容易實(shí)現(xiàn)、控制效果好和魯棒性強(qiáng)等特點(diǎn),能夠滿足一般的工業(yè)控制要求。隨著技術(shù)的進(jìn)步,人們對(duì)控制精度要求不斷提高。電液伺服系統(tǒng)存在非線性、時(shí)變性、不確定性和干擾力等因素。實(shí)現(xiàn)高精度控制,控制器的參數(shù)應(yīng)該隨著系統(tǒng)變化而自動(dòng)調(diào)整到最佳,而常規(guī)PID控制器在控制過(guò)程中,參數(shù)一旦確定,就無(wú)法調(diào)整。因此,對(duì)于精度要求高的系統(tǒng),常規(guī)PID控制器往往難以達(dá)到理想的控制效果。由于人工智能技術(shù)的迅速發(fā)展,研究人員將人工智能算法與PID控制結(jié)合起來(lái),能夠?qū)崿F(xiàn)參數(shù)自適應(yīng)的PID控制器成為了研究熱點(diǎn),擁有較高的研究?jī)r(jià)值和廣闊的應(yīng)用前景。強(qiáng)化學(xué)習(xí)作為一種機(jī)器學(xué)習(xí)方法,強(qiáng)調(diào)在與環(huán)境交互學(xué)習(xí)中獲得評(píng)價(jià)性的回報(bào)信號(hào),以極大化未來(lái)的回報(bào)為學(xué)習(xí)目標(biāo)。它不需要教師信號(hào),在求解先驗(yàn)信息較少的復(fù)雜優(yōu)化決策問(wèn)題中應(yīng)用廣泛。在多種領(lǐng)域中,已顯示出其性能優(yōu)勢(shì)。因此,本文提出了一種基于強(qiáng)化學(xué)習(xí)思想中Actor-Critic結(jié)構(gòu)的控制策略,以解決PID參數(shù)不能在線調(diào)整的問(wèn)題。該策略不需先驗(yàn)知識(shí),能夠?qū)?shù)進(jìn)行在線調(diào)整,實(shí)現(xiàn)系統(tǒng)性能優(yōu)化。通過(guò)MATLAB中的Simulink模塊進(jìn)行仿真分析...

【文章頁(yè)數(shù)】：71 頁(yè)

【學(xué)位級(jí)別】：碩士

【圖文】：

電液伺服系統(tǒng)組成框圖

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究

fi開(kāi)環(huán)系統(tǒng)bode圖

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究

強(qiáng)化學(xué)習(xí)基本框架

【參考文獻(xiàn)】：
期刊論文
[1]基于Actor-Critic和神經(jīng)網(wǎng)絡(luò)的閉環(huán)腦機(jī)接口控制器設(shè)計(jì)[J]. 孫京誥,楊嘉雄,王碩,薛瑞,潘紅光.  控制與決策. 2018(11)
[2]增量式雙自然策略梯度的行動(dòng)者評(píng)論家算法[J]. 章鵬,劉全,鐘珊,翟建偉,錢(qián)煒晟.  通信學(xué)報(bào). 2017(04)
[3]改進(jìn)型Smith-專(zhuān)家PID算法在烘缸溫度串級(jí)系統(tǒng)上的應(yīng)用[J]. 張愛(ài)娟,胡慕伊,黃亞南.  化工自動(dòng)化及儀表. 2016(02)
[4]大數(shù)據(jù)環(huán)境下的增強(qiáng)學(xué)習(xí)綜述[J]. 仵博,馮延蓬,孟憲軍,江建舉,何國(guó)坤.  深圳職業(yè)技術(shù)學(xué)院學(xué)報(bào). 2014(03)
[5]電液伺服系統(tǒng)位置和力模糊切換控制方法[J]. 高炳微,邵俊鵬,韓桂華.  電機(jī)與控制學(xué)報(bào). 2014(05)
[6]電液伺服技術(shù)的發(fā)展與展望[J]. 王軍政,趙江波,汪首坤.  液壓與氣動(dòng). 2014(05)
[7]增強(qiáng)學(xué)習(xí)的PID控制參數(shù)優(yōu)化快速整定算法[J]. 劉巖.  計(jì)算機(jī)測(cè)量與控制. 2014(02)
[8]基于核方法的連續(xù)動(dòng)作Actor-Critic學(xué)習(xí)[J]. 陳興國(guó),高陽(yáng),范順國(guó),俞亞君.  模式識(shí)別與人工智能. 2014(02)
[9]基于虛擬軋制的冷帶軋機(jī)壓下電液伺服系統(tǒng)建模與仿真[J]. 孫孟輝,張偉,王益群.  機(jī)床與液壓. 2012(09)
[10]具有最優(yōu)學(xué)習(xí)率的RBF神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J]. 衛(wèi)敏,余樂(lè)安.  管理科學(xué)學(xué)報(bào). 2012(04)

博士論文
[1]連續(xù)空間強(qiáng)化學(xué)習(xí)研究[D]. 張春元.電子科技大學(xué) 2016

碩士論文
[1]基于RBF神經(jīng)網(wǎng)絡(luò)的PID自校正控制研究及應(yīng)用[D]. 朱逢銳.安徽理工大學(xué) 2017
[2]基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃研究[D]. 劉仕超.山東科技大學(xué) 2017
[3]電液伺服系統(tǒng)液壓缸非線性運(yùn)動(dòng)特征研究[D]. 武文開(kāi).燕山大學(xué) 2016
[4]基于增強(qiáng)學(xué)習(xí)的啟發(fā)式和元啟發(fā)式搜索的參數(shù)調(diào)優(yōu)策略[D]. 劉賽賽.電子科技大學(xué) 2016
[5]基于貝葉斯理論的行動(dòng)者評(píng)論家算法研究[D]. 陳仕超.蘇州大學(xué) 2015
[6]強(qiáng)化學(xué)習(xí)中值函數(shù)逼近方法的研究[D]. 陳桂興.蘇州大學(xué) 2014
[7]基于粒子群算法的液壓位置伺服系統(tǒng)的研究[D]. 許來(lái).合肥工業(yè)大學(xué) 2014
[8]基于增強(qiáng)學(xué)習(xí)的無(wú)人車(chē)輛智能決策方法研究[D]. 鄭睿.國(guó)防科學(xué)技術(shù)大學(xué) 2013
[9]電液伺服系統(tǒng)PID神經(jīng)網(wǎng)絡(luò)控制策略研究與應(yīng)用[D]. 李拓彬.中南大學(xué) 2013
[10]基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化及應(yīng)用[D]. 王耀東.西安科技大學(xué) 2012

本文編號(hào)：3678627

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/jixiegongchenglunwen/3678627.html

上一篇：面向復(fù)雜精密裝備總裝車(chē)間的智能制造模式及部分關(guān)鍵技術(shù)研究
下一篇：電液伺服閥靜態(tài)性能測(cè)試系統(tǒng)的可視化設(shè)計(jì)

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究