基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究
發(fā)布時間:2022-08-23 22:50
PID控制器是現(xiàn)代工業(yè)中最常用的控制器,具有結(jié)構(gòu)簡單、容易實(shí)現(xiàn)、控制效果好和魯棒性強(qiáng)等特點(diǎn),能夠滿足一般的工業(yè)控制要求。隨著技術(shù)的進(jìn)步,人們對控制精度要求不斷提高。電液伺服系統(tǒng)存在非線性、時變性、不確定性和干擾力等因素。實(shí)現(xiàn)高精度控制,控制器的參數(shù)應(yīng)該隨著系統(tǒng)變化而自動調(diào)整到最佳,而常規(guī)PID控制器在控制過程中,參數(shù)一旦確定,就無法調(diào)整。因此,對于精度要求高的系統(tǒng),常規(guī)PID控制器往往難以達(dá)到理想的控制效果。由于人工智能技術(shù)的迅速發(fā)展,研究人員將人工智能算法與PID控制結(jié)合起來,能夠?qū)崿F(xiàn)參數(shù)自適應(yīng)的PID控制器成為了研究熱點(diǎn),擁有較高的研究價值和廣闊的應(yīng)用前景。強(qiáng)化學(xué)習(xí)作為一種機(jī)器學(xué)習(xí)方法,強(qiáng)調(diào)在與環(huán)境交互學(xué)習(xí)中獲得評價性的回報信號,以極大化未來的回報為學(xué)習(xí)目標(biāo)。它不需要教師信號,在求解先驗(yàn)信息較少的復(fù)雜優(yōu)化決策問題中應(yīng)用廣泛。在多種領(lǐng)域中,已顯示出其性能優(yōu)勢。因此,本文提出了一種基于強(qiáng)化學(xué)習(xí)思想中Actor-Critic結(jié)構(gòu)的控制策略,以解決PID參數(shù)不能在線調(diào)整的問題。該策略不需先驗(yàn)知識,能夠?qū)?shù)進(jìn)行在線調(diào)整,實(shí)現(xiàn)系統(tǒng)性能優(yōu)化。通過MATLAB中的Simulink模塊進(jìn)行仿真分析...
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【圖文】:
電液伺服系統(tǒng)組成框圖
fi開環(huán)系統(tǒng)bode圖
強(qiáng)化學(xué)習(xí)基本框架
【參考文獻(xiàn)】:
期刊論文
[1]基于Actor-Critic和神經(jīng)網(wǎng)絡(luò)的閉環(huán)腦機(jī)接口控制器設(shè)計(jì)[J]. 孫京誥,楊嘉雄,王碩,薛瑞,潘紅光. 控制與決策. 2018(11)
[2]增量式雙自然策略梯度的行動者評論家算法[J]. 章鵬,劉全,鐘珊,翟建偉,錢煒晟. 通信學(xué)報. 2017(04)
[3]改進(jìn)型Smith-專家PID算法在烘缸溫度串級系統(tǒng)上的應(yīng)用[J]. 張愛娟,胡慕伊,黃亞南. 化工自動化及儀表. 2016(02)
[4]大數(shù)據(jù)環(huán)境下的增強(qiáng)學(xué)習(xí)綜述[J]. 仵博,馮延蓬,孟憲軍,江建舉,何國坤. 深圳職業(yè)技術(shù)學(xué)院學(xué)報. 2014(03)
[5]電液伺服系統(tǒng)位置和力模糊切換控制方法[J]. 高炳微,邵俊鵬,韓桂華. 電機(jī)與控制學(xué)報. 2014(05)
[6]電液伺服技術(shù)的發(fā)展與展望[J]. 王軍政,趙江波,汪首坤. 液壓與氣動. 2014(05)
[7]增強(qiáng)學(xué)習(xí)的PID控制參數(shù)優(yōu)化快速整定算法[J]. 劉巖. 計(jì)算機(jī)測量與控制. 2014(02)
[8]基于核方法的連續(xù)動作Actor-Critic學(xué)習(xí)[J]. 陳興國,高陽,范順國,俞亞君. 模式識別與人工智能. 2014(02)
[9]基于虛擬軋制的冷帶軋機(jī)壓下電液伺服系統(tǒng)建模與仿真[J]. 孫孟輝,張偉,王益群. 機(jī)床與液壓. 2012(09)
[10]具有最優(yōu)學(xué)習(xí)率的RBF神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J]. 衛(wèi)敏,余樂安. 管理科學(xué)學(xué)報. 2012(04)
博士論文
[1]連續(xù)空間強(qiáng)化學(xué)習(xí)研究[D]. 張春元.電子科技大學(xué) 2016
碩士論文
[1]基于RBF神經(jīng)網(wǎng)絡(luò)的PID自校正控制研究及應(yīng)用[D]. 朱逢銳.安徽理工大學(xué) 2017
[2]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究[D]. 劉仕超.山東科技大學(xué) 2017
[3]電液伺服系統(tǒng)液壓缸非線性運(yùn)動特征研究[D]. 武文開.燕山大學(xué) 2016
[4]基于增強(qiáng)學(xué)習(xí)的啟發(fā)式和元啟發(fā)式搜索的參數(shù)調(diào)優(yōu)策略[D]. 劉賽賽.電子科技大學(xué) 2016
[5]基于貝葉斯理論的行動者評論家算法研究[D]. 陳仕超.蘇州大學(xué) 2015
[6]強(qiáng)化學(xué)習(xí)中值函數(shù)逼近方法的研究[D]. 陳桂興.蘇州大學(xué) 2014
[7]基于粒子群算法的液壓位置伺服系統(tǒng)的研究[D]. 許來.合肥工業(yè)大學(xué) 2014
[8]基于增強(qiáng)學(xué)習(xí)的無人車輛智能決策方法研究[D]. 鄭睿.國防科學(xué)技術(shù)大學(xué) 2013
[9]電液伺服系統(tǒng)PID神經(jīng)網(wǎng)絡(luò)控制策略研究與應(yīng)用[D]. 李拓彬.中南大學(xué) 2013
[10]基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化及應(yīng)用[D]. 王耀東.西安科技大學(xué) 2012
本文編號:3678627
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【圖文】:
電液伺服系統(tǒng)組成框圖
fi開環(huán)系統(tǒng)bode圖
強(qiáng)化學(xué)習(xí)基本框架
【參考文獻(xiàn)】:
期刊論文
[1]基于Actor-Critic和神經(jīng)網(wǎng)絡(luò)的閉環(huán)腦機(jī)接口控制器設(shè)計(jì)[J]. 孫京誥,楊嘉雄,王碩,薛瑞,潘紅光. 控制與決策. 2018(11)
[2]增量式雙自然策略梯度的行動者評論家算法[J]. 章鵬,劉全,鐘珊,翟建偉,錢煒晟. 通信學(xué)報. 2017(04)
[3]改進(jìn)型Smith-專家PID算法在烘缸溫度串級系統(tǒng)上的應(yīng)用[J]. 張愛娟,胡慕伊,黃亞南. 化工自動化及儀表. 2016(02)
[4]大數(shù)據(jù)環(huán)境下的增強(qiáng)學(xué)習(xí)綜述[J]. 仵博,馮延蓬,孟憲軍,江建舉,何國坤. 深圳職業(yè)技術(shù)學(xué)院學(xué)報. 2014(03)
[5]電液伺服系統(tǒng)位置和力模糊切換控制方法[J]. 高炳微,邵俊鵬,韓桂華. 電機(jī)與控制學(xué)報. 2014(05)
[6]電液伺服技術(shù)的發(fā)展與展望[J]. 王軍政,趙江波,汪首坤. 液壓與氣動. 2014(05)
[7]增強(qiáng)學(xué)習(xí)的PID控制參數(shù)優(yōu)化快速整定算法[J]. 劉巖. 計(jì)算機(jī)測量與控制. 2014(02)
[8]基于核方法的連續(xù)動作Actor-Critic學(xué)習(xí)[J]. 陳興國,高陽,范順國,俞亞君. 模式識別與人工智能. 2014(02)
[9]基于虛擬軋制的冷帶軋機(jī)壓下電液伺服系統(tǒng)建模與仿真[J]. 孫孟輝,張偉,王益群. 機(jī)床與液壓. 2012(09)
[10]具有最優(yōu)學(xué)習(xí)率的RBF神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J]. 衛(wèi)敏,余樂安. 管理科學(xué)學(xué)報. 2012(04)
博士論文
[1]連續(xù)空間強(qiáng)化學(xué)習(xí)研究[D]. 張春元.電子科技大學(xué) 2016
碩士論文
[1]基于RBF神經(jīng)網(wǎng)絡(luò)的PID自校正控制研究及應(yīng)用[D]. 朱逢銳.安徽理工大學(xué) 2017
[2]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究[D]. 劉仕超.山東科技大學(xué) 2017
[3]電液伺服系統(tǒng)液壓缸非線性運(yùn)動特征研究[D]. 武文開.燕山大學(xué) 2016
[4]基于增強(qiáng)學(xué)習(xí)的啟發(fā)式和元啟發(fā)式搜索的參數(shù)調(diào)優(yōu)策略[D]. 劉賽賽.電子科技大學(xué) 2016
[5]基于貝葉斯理論的行動者評論家算法研究[D]. 陳仕超.蘇州大學(xué) 2015
[6]強(qiáng)化學(xué)習(xí)中值函數(shù)逼近方法的研究[D]. 陳桂興.蘇州大學(xué) 2014
[7]基于粒子群算法的液壓位置伺服系統(tǒng)的研究[D]. 許來.合肥工業(yè)大學(xué) 2014
[8]基于增強(qiáng)學(xué)習(xí)的無人車輛智能決策方法研究[D]. 鄭睿.國防科學(xué)技術(shù)大學(xué) 2013
[9]電液伺服系統(tǒng)PID神經(jīng)網(wǎng)絡(luò)控制策略研究與應(yīng)用[D]. 李拓彬.中南大學(xué) 2013
[10]基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化及應(yīng)用[D]. 王耀東.西安科技大學(xué) 2012
本文編號:3678627
本文鏈接:http://sikaile.net/jixiegongchenglunwen/3678627.html
最近更新
教材專著