天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 儀器儀表論文 >

基于模糊強(qiáng)化學(xué)習(xí)的柔性結(jié)構(gòu)控制方法研究

發(fā)布時間:2017-09-04 02:29

  本文關(guān)鍵詞:基于模糊強(qiáng)化學(xué)習(xí)的柔性結(jié)構(gòu)控制方法研究


  更多相關(guān)文章: 大天線 柔性振動 強(qiáng)化學(xué)習(xí) 維數(shù)難 函數(shù)逼近 模糊推理 二型模糊系統(tǒng) 魯棒性


【摘要】:隨著深空探測、射電天文的不斷發(fā)展,大型射電望遠(yuǎn)鏡被廣泛應(yīng)用。新一代射電望遠(yuǎn)鏡的口徑也越來越大以獲得更好的觀測性能。但由于大天線的柔性、外界干擾等不利因素的存在,對天線控制系統(tǒng)提出了更高的指向精度、跟蹤精度及魯棒性等要求。本文以大天線控制問題為研究背景,將人工智能領(lǐng)域的強(qiáng)化學(xué)習(xí)作為柔性結(jié)構(gòu)控制方法,在保證一定跟蹤精度的同時,抑制柔性振動。但是,傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法適于處理小規(guī)模的離散狀態(tài)或離散動作學(xué)習(xí)任務(wù)而不能求解連續(xù)狀態(tài)空間和連續(xù)動作空間的問題。針對此不足,本文把模糊推理作為函數(shù)逼近器引入到強(qiáng)化學(xué)習(xí)中,利用模糊推理的廣泛逼近性,使得提出的模糊強(qiáng)化學(xué)習(xí)算法能夠較好地處理大規(guī)模或連續(xù)空間問題。與此同時,將基于模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制應(yīng)用于連續(xù)空間柔性尺模型的控制中進(jìn)行驗(yàn)證。本文主要工作如下:(1)針對傳統(tǒng)Q值查找表型強(qiáng)化學(xué)習(xí)算法在處理連續(xù)空間學(xué)習(xí)任務(wù)時所面臨的“維數(shù)難”以及輸出動作策略不連續(xù)問題,提出基于一型模糊推理的強(qiáng)化學(xué)習(xí)算法。該算法首先將連續(xù)狀態(tài)空間進(jìn)行模糊劃分;其次,以狀態(tài)為模糊規(guī)則前件輸入、動作及相應(yīng)的Q值函數(shù)分量為規(guī)則后件輸出構(gòu)建模糊規(guī)則,通過模糊推理獲得組合連續(xù)動作;最后由強(qiáng)化學(xué)習(xí)時間差分誤差采用梯度下降法在線反向調(diào)節(jié)后件參數(shù)。(2)針對基于一型模糊推理的強(qiáng)化學(xué)習(xí)存在的魯棒局限性,提出基于二型模糊推理的強(qiáng)化學(xué)習(xí)算法。以具有三維特性、能夠更加貼切描述實(shí)際不確定性的二型模糊集合為基礎(chǔ)的二型模糊系統(tǒng),在處理干擾等不確定性問題時其相對于一型表現(xiàn)出更強(qiáng)的處理系統(tǒng)不確定性的能力。與此同時,考慮使用作為二型模糊集合特例的區(qū)間二型模糊集,結(jié)合其能夠極大簡化廣義上二型模糊集合的運(yùn)算量的優(yōu)勢,最終設(shè)計出一種基于區(qū)間二型模糊推理的強(qiáng)化學(xué)習(xí)算法。該算法在實(shí)現(xiàn)較好處理連續(xù)空間問題的基礎(chǔ)上,對噪聲干擾的魯棒性得到了進(jìn)一步的加強(qiáng)。(3)通過對柔性尺模型的仿真控制驗(yàn)證本文所提兩種模糊強(qiáng)化學(xué)習(xí)算法。結(jié)果表明,基于一型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,相比于基于查找表型強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,其在保證一定跟蹤精度的同時,較好地抑制了末端柔性振動;基于區(qū)間二型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,相比于基于一型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制,其魯棒性更強(qiáng)。
【關(guān)鍵詞】:大天線 柔性振動 強(qiáng)化學(xué)習(xí) 維數(shù)難 函數(shù)逼近 模糊推理 二型模糊系統(tǒng) 魯棒性
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TH743;TP18
【目錄】:
  • 摘要5-6
  • ABSTRACT6-10
  • 符號對照表10-12
  • 縮略語對照表12-15
  • 第一章 緒論15-23
  • 1.1 研究背景及意義15-16
  • 1.2 國內(nèi)外研究現(xiàn)狀16-19
  • 1.3 本文的主要工作19-20
  • 1.4 論文結(jié)構(gòu)20-23
  • 第二章 理論基礎(chǔ)23-37
  • 2.1 強(qiáng)化學(xué)習(xí)23-29
  • 2.1.1 馬爾科夫決策過程23-25
  • 2.1.2 探索與利用25-26
  • 2.1.3 時間差分算法26-29
  • 2.2 模糊控制理論29-33
  • 2.2.1 模糊集合29-31
  • 2.2.2 模糊控制器31-32
  • 2.2.3 模糊推理32-33
  • 2.3 模糊推理Q值函數(shù)33-35
  • 2.4 本章小結(jié)35-37
  • 第三章 基于一型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制37-55
  • 3.1 柔性尺建模37-43
  • 3.2 一型模糊近似強(qiáng)化學(xué)習(xí)43-46
  • 3.3 T1FIS-SARSA算法流程46
  • 3.4 仿真實(shí)驗(yàn)46-53
  • 3.4.1 柔性尺仿真模型驗(yàn)證47-50
  • 3.4.2 T1FIS-SARSA控制仿真50-53
  • 3.5 本章小結(jié)53-55
  • 第四章 基于區(qū)間二型模糊強(qiáng)化學(xué)習(xí)算法的柔性結(jié)構(gòu)控制55-67
  • 4.1 二型模糊55-59
  • 4.1.1 區(qū)間二型模糊集合55-57
  • 4.1.2 二型模糊推理57-59
  • 4.2 二型模糊近似強(qiáng)化學(xué)習(xí)59-62
  • 4.3 IT2FIS-SARSA算法流程62-63
  • 4.4 仿真實(shí)驗(yàn)63-65
  • 4.5 本章小結(jié)65-67
  • 第五章 總結(jié)與展望67-69
  • 5.1 總結(jié)67-68
  • 5.2 展望68-69
  • 參考文獻(xiàn)69-73
  • 致謝73-75
  • 作者簡介75-76

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 陳宗海;文鋒;聶建斌;吳曉曙;;基于節(jié)點(diǎn)生長k-均值聚類算法的強(qiáng)化學(xué)習(xí)方法[J];計算機(jī)研究與發(fā)展;2006年04期

2 范波,潘泉,張洪才;多智能體學(xué)習(xí)中基于知識的強(qiáng)化函數(shù)設(shè)計方法[J];計算機(jī)工程與應(yīng)用;2005年03期



本文編號:788836

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yiqiyibiao/788836.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4bdeb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
成年人免费看国产视频| 中文字幕91在线观看| 国产午夜精品美女露脸视频| 精品日韩视频在线观看| 国产在线小视频你懂的| 在线观看国产午夜福利| 日韩一区二区三区有码| 日韩中文字幕人妻精品| 极品少妇一区二区三区精品视频| 久久精品国产99精品亚洲| 久久亚洲精品成人国产| 国产免费观看一区二区| 中文字幕欧美视频二区| 狠狠做深爱婷婷久久综合| 日韩av亚洲一区二区三区| 亚洲第一区欧美日韩在线| 超薄丝袜足一区二区三区| 亚洲一区二区三区在线免费| 婷婷基地五月激情五月| 国产精品伦一区二区三区四季| 久久热在线视频免费观看| 国产精品视频久久一区| 99视频精品免费视频播放| 好吊妞视频只有这里有精品| 国产av精品一区二区| 日本成人三级在线播放| 黄男女激情一区二区三区| 欧美成人精品国产成人综合| 亚洲一区二区欧美在线| 国产亚洲二区精品美女久久| 成人精品视频在线观看不卡| 欧美日韩亚洲精品内裤| 91偷拍视频久久精品| 午夜福利视频日本一区| 97人妻人人揉人人躁人人| 麻豆视频传媒入口在线看| 黄片美女在线免费观看| 国产户外勾引精品露出一区| 亚洲做性视频在线播放| 后入美臀少妇一区二区| 男女激情视频在线免费观看|