基于神經網絡的三自由度直升機智能控制方法研究
發(fā)布時間:2021-02-16 22:05
近年來,小型無人機以其良好的機動性受到了歡迎,個人持有率極大的提高。廣闊的商業(yè)前景使得飛行器的控制受到了更廣泛的關注。合適的控制算法能結合硬件特點,發(fā)揮出系統最好的表現。而智能控制算法以其自適應性部分彌補了人工設計存在的不可建模誤差,使獲得適合系統的控制算法變得可能。本文選取的三自由度直升機系統具有典型的飛行器系統特點,同時易于采集數據,是驗證智能控制算法應用于飛行器系統的理想平臺。在此平臺上,課題主要研究了基于神經網絡的兩種智能控制方法,反步自適應控制方法和強化學習控制方法,完成了如下工作:(1)在反步自適應方法中,使用神經網絡逼近非線性部分,結合反步設計方法進行了控制器設計并對于設計后的系統給出了穩(wěn)定性證明。在三自由度直升機的仿真及實物平臺上進行了實驗。達到了較好的控制效果。(2)在強化學習方法中,使用了執(zhí)行器-評價器算法。引入動態(tài)指標對傳統二值獎勵進行了改進,避免了選擇閾值的過程中出現的大初始誤差和小運行誤差難以同時兼顧的問題。改進的方法在仿真平臺上進行了訓練和驗證,可以基本完成對時變信號的跟蹤任務。課題成功將基于神經網絡的兩種智能控制方法應用于三自由度直升機上,并結合平臺應用特...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:57 頁
【學位級別】:碩士
【部分圖文】:
三自由度直升機
RBF 神經網絡的使用。圖 2-3 RBF 神經網絡的拓撲結構圖 2-3 為徑向基函數神經網絡(RBFNN)的拓撲結構圖,為區(qū)別于前文的單個神經網絡模型,這里1[ ,..., ]TqZ z z是神經網絡輸入向量,1[ ,..., ]T llW w w R是輸入維數; 1( ) [ ,..., ( )]T llS Z s Z s Z R是基函數向量, l 1是權向量,其中q為節(jié)點數。結合前文對神經網絡的介紹,使用圖中標號可以得到( ) ( )TNNf Z W S Z(2-6)RBF 中的 is Z 一般為 Gauss 函數: 2( )exp , 1, 2,...,Ti iiiZ Zs Z i l (2-7)這里1 2[ , ,..., ]Ti i i iq 表示 Gauss 函數的中心向量,i 表示 Gauss 函數的寬度?梢宰C明
傾斜方向仿真跟隨輸出
【參考文獻】:
期刊論文
[1]一種基于深度強化學習的自適應巡航控制算法[J]. 韓向敏,鮑泓,梁軍,潘峰,玄祖興. 計算機工程. 2018(07)
[2]基于深度強化學習的水下機器人最優(yōu)軌跡控制[J]. 馬瓊雄,余潤笙,石振宇,黃晁星,李騰龍. 華南師范大學學報(自然科學版). 2018(01)
[3]液壓伺服位置系統的神經網絡backstepping控制[J]. 方一鳴,李葉紅,石勝利,李建雄. 電機與控制學報. 2014(06)
[4]基于迭代學習的BP神經網絡權值訓練算法[J]. 周小勇,翟春艷,李書臣,蘇成利. 遼寧石油化工大學學報. 2013(04)
[5]基于混合型魯棒輸入訓練神經網絡的非線性數據校正方法及其應用[J]. 任少君,司風琪,李歡歡,徐治皋. 東南大學學報(自然科學版). 2013(02)
[6]基于小波神經網絡自適應反推的永磁同步電機位置伺服控制[J]. 劉達,李木國. 電力自動化設備. 2013(02)
[7]基于雙閉環(huán)的液壓伺服系統控制[J]. 于建均,陳千平,孫亮,李建更,阮曉鋼. 北京工業(yè)大學學報. 2007(03)
[8]BP網絡的改進研究[J]. 遠禎,羅波. 信息技術. 2006(02)
博士論文
[1]連續(xù)空間強化學習研究[D]. 張春元.電子科技大學 2016
[2]強化學習及其在機器人系統中的應用研究[D]. 陳學松.廣東工業(yè)大學 2011
碩士論文
[1]基于深度強化學習的游戲控制算法研究與實現[D]. 顏志鵬.電子科技大學 2018
[2]不確定非線性系統的自適應神經網絡跟蹤控制[D]. 鄭曉龍.渤海大學 2016
[3]面向連續(xù)狀態(tài)的神經網絡強化學習研究[D]. 王婷婷.中國礦業(yè)大學 2016
[4]對含輸入飽和約束和未知信息的非線性系統的研究[D]. 張騰飛.北京交通大學 2016
[5]電液伺服系統的神經網絡自整定PID控制策略研究[D]. 韋亞娟.燕山大學 2009
[6]一類非線性時滯系統的自適應控制器設計[D]. 鄭健.中國石油大學 2008
[7]不確定非線性系統的自適應迭代學習控制研究[D]. 劉萍.南京理工大學 2007
[8]不確定系統的神經網絡控制研究[D]. 高宏宇.大慶石油學院 2006
[9]感應電機無速度傳感器矢量控制系統的研究[D]. 李自成.華中科技大學 2005
本文編號:3036994
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:57 頁
【學位級別】:碩士
【部分圖文】:
三自由度直升機
RBF 神經網絡的使用。圖 2-3 RBF 神經網絡的拓撲結構圖 2-3 為徑向基函數神經網絡(RBFNN)的拓撲結構圖,為區(qū)別于前文的單個神經網絡模型,這里1[ ,..., ]TqZ z z是神經網絡輸入向量,1[ ,..., ]T llW w w R是輸入維數; 1( ) [ ,..., ( )]T llS Z s Z s Z R是基函數向量, l 1是權向量,其中q為節(jié)點數。結合前文對神經網絡的介紹,使用圖中標號可以得到( ) ( )TNNf Z W S Z(2-6)RBF 中的 is Z 一般為 Gauss 函數: 2( )exp , 1, 2,...,Ti iiiZ Zs Z i l (2-7)這里1 2[ , ,..., ]Ti i i iq 表示 Gauss 函數的中心向量,i 表示 Gauss 函數的寬度?梢宰C明
傾斜方向仿真跟隨輸出
【參考文獻】:
期刊論文
[1]一種基于深度強化學習的自適應巡航控制算法[J]. 韓向敏,鮑泓,梁軍,潘峰,玄祖興. 計算機工程. 2018(07)
[2]基于深度強化學習的水下機器人最優(yōu)軌跡控制[J]. 馬瓊雄,余潤笙,石振宇,黃晁星,李騰龍. 華南師范大學學報(自然科學版). 2018(01)
[3]液壓伺服位置系統的神經網絡backstepping控制[J]. 方一鳴,李葉紅,石勝利,李建雄. 電機與控制學報. 2014(06)
[4]基于迭代學習的BP神經網絡權值訓練算法[J]. 周小勇,翟春艷,李書臣,蘇成利. 遼寧石油化工大學學報. 2013(04)
[5]基于混合型魯棒輸入訓練神經網絡的非線性數據校正方法及其應用[J]. 任少君,司風琪,李歡歡,徐治皋. 東南大學學報(自然科學版). 2013(02)
[6]基于小波神經網絡自適應反推的永磁同步電機位置伺服控制[J]. 劉達,李木國. 電力自動化設備. 2013(02)
[7]基于雙閉環(huán)的液壓伺服系統控制[J]. 于建均,陳千平,孫亮,李建更,阮曉鋼. 北京工業(yè)大學學報. 2007(03)
[8]BP網絡的改進研究[J]. 遠禎,羅波. 信息技術. 2006(02)
博士論文
[1]連續(xù)空間強化學習研究[D]. 張春元.電子科技大學 2016
[2]強化學習及其在機器人系統中的應用研究[D]. 陳學松.廣東工業(yè)大學 2011
碩士論文
[1]基于深度強化學習的游戲控制算法研究與實現[D]. 顏志鵬.電子科技大學 2018
[2]不確定非線性系統的自適應神經網絡跟蹤控制[D]. 鄭曉龍.渤海大學 2016
[3]面向連續(xù)狀態(tài)的神經網絡強化學習研究[D]. 王婷婷.中國礦業(yè)大學 2016
[4]對含輸入飽和約束和未知信息的非線性系統的研究[D]. 張騰飛.北京交通大學 2016
[5]電液伺服系統的神經網絡自整定PID控制策略研究[D]. 韋亞娟.燕山大學 2009
[6]一類非線性時滯系統的自適應控制器設計[D]. 鄭健.中國石油大學 2008
[7]不確定非線性系統的自適應迭代學習控制研究[D]. 劉萍.南京理工大學 2007
[8]不確定系統的神經網絡控制研究[D]. 高宏宇.大慶石油學院 2006
[9]感應電機無速度傳感器矢量控制系統的研究[D]. 李自成.華中科技大學 2005
本文編號:3036994
本文鏈接:http://sikaile.net/kejilunwen/hangkongsky/3036994.html