基于模糊強(qiáng)化學(xué)習(xí)的柔性結(jié)構(gòu)控制方法研究
發(fā)布時間:2017-09-04 02:29
本文關(guān)鍵詞:基于模糊強(qiáng)化學(xué)習(xí)的柔性結(jié)構(gòu)控制方法研究
更多相關(guān)文章: 大天線 柔性振動 強(qiáng)化學(xué)習(xí) 維數(shù)難 函數(shù)逼近 模糊推理 二型模糊系統(tǒng) 魯棒性
【摘要】:隨著深空探測、射電天文的不斷發(fā)展,大型射電望遠(yuǎn)鏡被廣泛應(yīng)用。新一代射電望遠(yuǎn)鏡的口徑也越來越大以獲得更好的觀測性能。但由于大天線的柔性、外界干擾等不利因素的存在,對天線控制系統(tǒng)提出了更高的指向精度、跟蹤精度及魯棒性等要求。本文以大天線控制問題為研究背景,將人工智能領(lǐng)域的強(qiáng)化學(xué)習(xí)作為柔性結(jié)構(gòu)控制方法,在保證一定跟蹤精度的同時,抑制柔性振動。但是,傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法適于處理小規(guī)模的離散狀態(tài)或離散動作學(xué)習(xí)任務(wù)而不能求解連續(xù)狀態(tài)空間和連續(xù)動作空間的問題。針對此不足,本文把模糊推理作為函數(shù)逼近器引入到強(qiáng)化學(xué)習(xí)中,利用模糊推理的廣泛逼近性,使得提出的模糊強(qiáng)化學(xué)習(xí)算法能夠較好地處理大規(guī)模或連續(xù)空間問題。與此同時,將基于模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制應(yīng)用于連續(xù)空間柔性尺模型的控制中進(jìn)行驗(yàn)證。本文主要工作如下:(1)針對傳統(tǒng)Q值查找表型強(qiáng)化學(xué)習(xí)算法在處理連續(xù)空間學(xué)習(xí)任務(wù)時所面臨的“維數(shù)難”以及輸出動作策略不連續(xù)問題,提出基于一型模糊推理的強(qiáng)化學(xué)習(xí)算法。該算法首先將連續(xù)狀態(tài)空間進(jìn)行模糊劃分;其次,以狀態(tài)為模糊規(guī)則前件輸入、動作及相應(yīng)的Q值函數(shù)分量為規(guī)則后件輸出構(gòu)建模糊規(guī)則,通過模糊推理獲得組合連續(xù)動作;最后由強(qiáng)化學(xué)習(xí)時間差分誤差采用梯度下降法在線反向調(diào)節(jié)后件參數(shù)。(2)針對基于一型模糊推理的強(qiáng)化學(xué)習(xí)存在的魯棒局限性,提出基于二型模糊推理的強(qiáng)化學(xué)習(xí)算法。以具有三維特性、能夠更加貼切描述實(shí)際不確定性的二型模糊集合為基礎(chǔ)的二型模糊系統(tǒng),在處理干擾等不確定性問題時其相對于一型表現(xiàn)出更強(qiáng)的處理系統(tǒng)不確定性的能力。與此同時,考慮使用作為二型模糊集合特例的區(qū)間二型模糊集,結(jié)合其能夠極大簡化廣義上二型模糊集合的運(yùn)算量的優(yōu)勢,最終設(shè)計出一種基于區(qū)間二型模糊推理的強(qiáng)化學(xué)習(xí)算法。該算法在實(shí)現(xiàn)較好處理連續(xù)空間問題的基礎(chǔ)上,對噪聲干擾的魯棒性得到了進(jìn)一步的加強(qiáng)。(3)通過對柔性尺模型的仿真控制驗(yàn)證本文所提兩種模糊強(qiáng)化學(xué)習(xí)算法。結(jié)果表明,基于一型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,相比于基于查找表型強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,其在保證一定跟蹤精度的同時,較好地抑制了末端柔性振動;基于區(qū)間二型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,相比于基于一型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,其魯棒性更強(qiáng)。
【關(guān)鍵詞】:大天線 柔性振動 強(qiáng)化學(xué)習(xí) 維數(shù)難 函數(shù)逼近 模糊推理 二型模糊系統(tǒng) 魯棒性
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TH743;TP18
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 符號對照表10-12
- 縮略語對照表12-15
- 第一章 緒論15-23
- 1.1 研究背景及意義15-16
- 1.2 國內(nèi)外研究現(xiàn)狀16-19
- 1.3 本文的主要工作19-20
- 1.4 論文結(jié)構(gòu)20-23
- 第二章 理論基礎(chǔ)23-37
- 2.1 強(qiáng)化學(xué)習(xí)23-29
- 2.1.1 馬爾科夫決策過程23-25
- 2.1.2 探索與利用25-26
- 2.1.3 時間差分算法26-29
- 2.2 模糊控制理論29-33
- 2.2.1 模糊集合29-31
- 2.2.2 模糊控制器31-32
- 2.2.3 模糊推理32-33
- 2.3 模糊推理Q值函數(shù)33-35
- 2.4 本章小結(jié)35-37
- 第三章 基于一型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制37-55
- 3.1 柔性尺建模37-43
- 3.2 一型模糊近似強(qiáng)化學(xué)習(xí)43-46
- 3.3 T1FIS-SARSA算法流程46
- 3.4 仿真實(shí)驗(yàn)46-53
- 3.4.1 柔性尺仿真模型驗(yàn)證47-50
- 3.4.2 T1FIS-SARSA控制仿真50-53
- 3.5 本章小結(jié)53-55
- 第四章 基于區(qū)間二型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制55-67
- 4.1 二型模糊55-59
- 4.1.1 區(qū)間二型模糊集合55-57
- 4.1.2 二型模糊推理57-59
- 4.2 二型模糊近似強(qiáng)化學(xué)習(xí)59-62
- 4.3 IT2FIS-SARSA算法流程62-63
- 4.4 仿真實(shí)驗(yàn)63-65
- 4.5 本章小結(jié)65-67
- 第五章 總結(jié)與展望67-69
- 5.1 總結(jié)67-68
- 5.2 展望68-69
- 參考文獻(xiàn)69-73
- 致謝73-75
- 作者簡介75-76
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 陳宗海;文鋒;聶建斌;吳曉曙;;基于節(jié)點(diǎn)生長k-均值聚類算法的強(qiáng)化學(xué)習(xí)方法[J];計算機(jī)研究與發(fā)展;2006年04期
2 范波,潘泉,張洪才;多智能體學(xué)習(xí)中基于知識的強(qiáng)化函數(shù)設(shè)計方法[J];計算機(jī)工程與應(yīng)用;2005年03期
,本文編號:788836
本文鏈接:http://sikaile.net/kejilunwen/yiqiyibiao/788836.html
最近更新
教材專著