天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 機(jī)電工程論文 >

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究

發(fā)布時間:2022-08-23 22:50
  PID控制器是現(xiàn)代工業(yè)中最常用的控制器,具有結(jié)構(gòu)簡單、容易實(shí)現(xiàn)、控制效果好和魯棒性強(qiáng)等特點(diǎn),能夠滿足一般的工業(yè)控制要求。隨著技術(shù)的進(jìn)步,人們對控制精度要求不斷提高。電液伺服系統(tǒng)存在非線性、時變性、不確定性和干擾力等因素。實(shí)現(xiàn)高精度控制,控制器的參數(shù)應(yīng)該隨著系統(tǒng)變化而自動調(diào)整到最佳,而常規(guī)PID控制器在控制過程中,參數(shù)一旦確定,就無法調(diào)整。因此,對于精度要求高的系統(tǒng),常規(guī)PID控制器往往難以達(dá)到理想的控制效果。由于人工智能技術(shù)的迅速發(fā)展,研究人員將人工智能算法與PID控制結(jié)合起來,能夠?qū)崿F(xiàn)參數(shù)自適應(yīng)的PID控制器成為了研究熱點(diǎn),擁有較高的研究價值和廣闊的應(yīng)用前景。強(qiáng)化學(xué)習(xí)作為一種機(jī)器學(xué)習(xí)方法,強(qiáng)調(diào)在與環(huán)境交互學(xué)習(xí)中獲得評價性的回報信號,以極大化未來的回報為學(xué)習(xí)目標(biāo)。它不需要教師信號,在求解先驗(yàn)信息較少的復(fù)雜優(yōu)化決策問題中應(yīng)用廣泛。在多種領(lǐng)域中,已顯示出其性能優(yōu)勢。因此,本文提出了一種基于強(qiáng)化學(xué)習(xí)思想中Actor-Critic結(jié)構(gòu)的控制策略,以解決PID參數(shù)不能在線調(diào)整的問題。該策略不需先驗(yàn)知識,能夠?qū)?shù)進(jìn)行在線調(diào)整,實(shí)現(xiàn)系統(tǒng)性能優(yōu)化。通過MATLAB中的Simulink模塊進(jìn)行仿真分析... 

【文章頁數(shù)】:71 頁

【學(xué)位級別】:碩士

【圖文】:

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究


電液伺服系統(tǒng)組成框圖

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究


fi開環(huán)系統(tǒng)bode圖

基于Actor-Critic學(xué)習(xí)的自適應(yīng)PID控制策略研究


強(qiáng)化學(xué)習(xí)基本框架

【參考文獻(xiàn)】:
期刊論文
[1]基于Actor-Critic和神經(jīng)網(wǎng)絡(luò)的閉環(huán)腦機(jī)接口控制器設(shè)計(jì)[J]. 孫京誥,楊嘉雄,王碩,薛瑞,潘紅光.  控制與決策. 2018(11)
[2]增量式雙自然策略梯度的行動者評論家算法[J]. 章鵬,劉全,鐘珊,翟建偉,錢煒晟.  通信學(xué)報. 2017(04)
[3]改進(jìn)型Smith-專家PID算法在烘缸溫度串級系統(tǒng)上的應(yīng)用[J]. 張愛娟,胡慕伊,黃亞南.  化工自動化及儀表. 2016(02)
[4]大數(shù)據(jù)環(huán)境下的增強(qiáng)學(xué)習(xí)綜述[J]. 仵博,馮延蓬,孟憲軍,江建舉,何國坤.  深圳職業(yè)技術(shù)學(xué)院學(xué)報. 2014(03)
[5]電液伺服系統(tǒng)位置和力模糊切換控制方法[J]. 高炳微,邵俊鵬,韓桂華.  電機(jī)與控制學(xué)報. 2014(05)
[6]電液伺服技術(shù)的發(fā)展與展望[J]. 王軍政,趙江波,汪首坤.  液壓與氣動. 2014(05)
[7]增強(qiáng)學(xué)習(xí)的PID控制參數(shù)優(yōu)化快速整定算法[J]. 劉巖.  計(jì)算機(jī)測量與控制. 2014(02)
[8]基于核方法的連續(xù)動作Actor-Critic學(xué)習(xí)[J]. 陳興國,高陽,范順國,俞亞君.  模式識別與人工智能. 2014(02)
[9]基于虛擬軋制的冷帶軋機(jī)壓下電液伺服系統(tǒng)建模與仿真[J]. 孫孟輝,張偉,王益群.  機(jī)床與液壓. 2012(09)
[10]具有最優(yōu)學(xué)習(xí)率的RBF神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J]. 衛(wèi)敏,余樂安.  管理科學(xué)學(xué)報. 2012(04)

博士論文
[1]連續(xù)空間強(qiáng)化學(xué)習(xí)研究[D]. 張春元.電子科技大學(xué) 2016

碩士論文
[1]基于RBF神經(jīng)網(wǎng)絡(luò)的PID自校正控制研究及應(yīng)用[D]. 朱逢銳.安徽理工大學(xué) 2017
[2]基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究[D]. 劉仕超.山東科技大學(xué) 2017
[3]電液伺服系統(tǒng)液壓缸非線性運(yùn)動特征研究[D]. 武文開.燕山大學(xué) 2016
[4]基于增強(qiáng)學(xué)習(xí)的啟發(fā)式和元啟發(fā)式搜索的參數(shù)調(diào)優(yōu)策略[D]. 劉賽賽.電子科技大學(xué) 2016
[5]基于貝葉斯理論的行動者評論家算法研究[D]. 陳仕超.蘇州大學(xué) 2015
[6]強(qiáng)化學(xué)習(xí)中值函數(shù)逼近方法的研究[D]. 陳桂興.蘇州大學(xué) 2014
[7]基于粒子群算法的液壓位置伺服系統(tǒng)的研究[D]. 許來.合肥工業(yè)大學(xué) 2014
[8]基于增強(qiáng)學(xué)習(xí)的無人車輛智能決策方法研究[D]. 鄭睿.國防科學(xué)技術(shù)大學(xué) 2013
[9]電液伺服系統(tǒng)PID神經(jīng)網(wǎng)絡(luò)控制策略研究與應(yīng)用[D]. 李拓彬.中南大學(xué) 2013
[10]基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化及應(yīng)用[D]. 王耀東.西安科技大學(xué) 2012



本文編號:3678627

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jixiegongchenglunwen/3678627.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e7edc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com