基于視覺深度預測的水下航行器自主強化控制研究
發(fā)布時間:2021-11-13 17:45
隨著人類對海洋開發(fā)和認識的逐步深入,視覺水下航行器已成為探索海洋的關鍵設備,并廣泛應用于水下搜救、勘測及海洋生物監(jiān)測等任務。視覺環(huán)境感知作為視覺水下航行器獲取、分析和認知所處環(huán)境的重要手段,通過處理和反饋視覺信息輔助水下航行器自主控制決策,保障了決策的正確性及水下航行器的安全性。在不同水下任務下環(huán)境感知與自主控制決策的實時性存在差異,不匹配的感知和控制方案會造成狀態(tài)提取與控制決策的異步,無法保障水下航行器自主航行控制的魯棒性,嚴重時甚至造成控制系統(tǒng)的失穩(wěn)導致任務失敗。在此背景下,本文以水下航行器為研究對象,以離散視覺(圖像)和連續(xù)視覺(視頻)感知條件下的自主強化控制決策為目標,利用深度學習通過環(huán)境數據驅動獲取感知特征,利用強化學習通過航行狀態(tài)驅動獲取動作決策,進而滿足水下航行器自主感知與分析、決策與控制一體化的自主航行需求,主要研究工作如下:論文在論述了水下航行器及其智能感知與決策算法的發(fā)展與研究現(xiàn)狀的基礎上,闡述了深度強化學習算法的原理。針對離散視覺的水下環(huán)境深度預測,設計了一種具備離散深度特征信息提取功能的全卷積殘差網絡,在編碼器—解碼器的神經網絡架構下,結合殘差學習和監(jiān)督學習,解...
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:89 頁
【學位級別】:碩士
【部分圖文】:
圖2.2深度神經網絡結構圖??Fig.?2.2?Structure?of?Deep?Neural?Networks??
連接和權??值共享兩大基本特征,下面著重介紹卷積神經網絡的基本組成部分,將分別從卷積層、??池化層、激活函數和全連接層四個方面展開闡述。??2.2.1卷積層??卷積神經網絡中的每個卷積層(Convolutional?layer)都由若干卷積單元組成,并且??每個卷積單元的參數都通過反向傳播算法進行優(yōu)化的。卷積運算的目的是提取神經網??絡輸入的相關特征,單層卷積只能提取一些低級特征,例如邊緣、線條和角等層級等,??多層卷積可以從低級特征中經不斷迭代提取更復雜的特征。通常的卷積層模型如圖2.3??所示。??輸入??一1— ̄'<4^?5??卷積核?Vi?-U弋h??r?。福颍保颍??輸出??圖2.3卷積層基本模型??Fig.?2.3?Basic?model?of?convolutional?layer??2.2.2池化層??池化層(Pooling?Layer)通常作為卷積層中的第三層次,前面兩個層次分別由卷積核??進行卷積操作和由激活函數進行非線性操作,而在池化層中則是對前兩層提取的特征??進行再處理。池化層使用某一位置相鄰輸出的總體統(tǒng)計信息來表示該區(qū)域的特征,池??化的目的主要是為了減少特征表觀的維度大小,從而降低網絡結構的復雜性?偨Y池??化層的具體作用主要為以下幾點:??(1)降低特征尺寸的維度,并減少計算量;??(2)在一定程度緩解了過擬合問題,更方便優(yōu)化;??(3)使得特征具有位移不變性。無論采用最大池化操作還是平均池化操作,都和特??征的位置沒有關系;??-10-??
??此能夠適當地提高網絡的參數。??2.2.3激活函數??激活函數(Activation?Function)是神經元的重要組成部分。神經網絡引入的激活函??數是為了增加神經網絡模型的非線性,以便它們可以逼近任何非線性函數,這樣神經??網絡可以應用于許多非線性模型。下面介紹幾種常用的激活函數。??(1)?Sigmoid?函數??Sigmoid函數是一種較早出現(xiàn)的激活函數,把激活值最終投射到0到1的區(qū)間上。??Sigmoid激活函數通?梢宰鳛楦怕式忉,通過這種方式加入非線性因素。如圖2.4所??示,其數學形式定義為:??辦)+?e(-wi+6)'?(2.2)??也可以寫成:??z?=?wx?+?b,?,f(z)?=?1?^?(2.3)??■L十6??一?I?丨.丨,??0.4-???h??!?17??0?^?丨?I??-8-6?-4?-2?02468??圖2.4?Sigmoid激活函數??Fig.?2.4?Sigmoid?activation?function??在實際應用中,Sigmoid函數因為它的性質引起了兩個顯著的缺點:??①Sigmoid激活函數輸出分布非零點對稱。對于神經網絡權重的梯度更新來說,若??數據流經過神經元的數據為正,那么在反向傳播的權重梯度也將為正(取決于表達式的??梯度),這種情況下造成的梯度并非理想,但是將其加入到整批數據最終更新的權重上??時,相比過飽和激活函數來說結果可以接受;??②Sigmoid激活函數飽和導致的梯度驟減。當Sigmoid激活函數飽和時,函數值非??0即1。在反向傳播的過程中,局部梯度會乘以整個網絡最終輸出的梯度。因此,如果??梯度很
【參考文獻】:
期刊論文
[1]國外大型無人水下航行器發(fā)展綜述[J]. 鐘宏偉,李國良,宋林樺,莫春軍. 水下無人系統(tǒng)學報. 2018(04)
[2]國外海洋無人航行器的發(fā)展現(xiàn)狀及趨勢[J]. 代威,張雯,張瀝,解春雷,惠俊鵬. 兵器裝備工程學報. 2018(07)
[3]基于深度強化學習的水下機器人最優(yōu)軌跡控制[J]. 馬瓊雄,余潤笙,石振宇,黃晁星,李騰龍. 華南師范大學學報(自然科學版). 2018(01)
[4]國外水下無人系統(tǒng)技術發(fā)展現(xiàn)狀與趨勢淺析[J]. 李亮,鄒金順. 艦船科學技術. 2017(23)
[5]無人水下航行器的發(fā)展現(xiàn)狀與關鍵技術[J]. 王童豪,彭星光,潘光,徐德民. 宇航總體技術. 2017(04)
[6]深度強化學習綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進. 計算機學報. 2018(01)
[7]潛用UUV回收技術[J]. 周杰,周文林. 四川兵工學報. 2011(08)
[8]基于神經網絡的自主水下機器人動態(tài)反饋控制[J]. 周煥銀,劉開周,封錫盛. 電機與控制學報. 2011(07)
[9]基于L2干擾抑制的水下機器人人三三維航跡跟蹤控制[J]. 張利軍,賈鶴鳴,邊信黔,嚴浙平,程相勤. 控制理論與應用. 2011(05)
[10]水下機器人的神經網絡自適應控制[J]. 俞建成,李強,張艾群,王曉輝. 控制理論與應用. 2008(01)
本文編號:3493437
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:89 頁
【學位級別】:碩士
【部分圖文】:
圖2.2深度神經網絡結構圖??Fig.?2.2?Structure?of?Deep?Neural?Networks??
連接和權??值共享兩大基本特征,下面著重介紹卷積神經網絡的基本組成部分,將分別從卷積層、??池化層、激活函數和全連接層四個方面展開闡述。??2.2.1卷積層??卷積神經網絡中的每個卷積層(Convolutional?layer)都由若干卷積單元組成,并且??每個卷積單元的參數都通過反向傳播算法進行優(yōu)化的。卷積運算的目的是提取神經網??絡輸入的相關特征,單層卷積只能提取一些低級特征,例如邊緣、線條和角等層級等,??多層卷積可以從低級特征中經不斷迭代提取更復雜的特征。通常的卷積層模型如圖2.3??所示。??輸入??一1— ̄'<4^?5??卷積核?Vi?-U弋h??r?。福颍保颍??輸出??圖2.3卷積層基本模型??Fig.?2.3?Basic?model?of?convolutional?layer??2.2.2池化層??池化層(Pooling?Layer)通常作為卷積層中的第三層次,前面兩個層次分別由卷積核??進行卷積操作和由激活函數進行非線性操作,而在池化層中則是對前兩層提取的特征??進行再處理。池化層使用某一位置相鄰輸出的總體統(tǒng)計信息來表示該區(qū)域的特征,池??化的目的主要是為了減少特征表觀的維度大小,從而降低網絡結構的復雜性?偨Y池??化層的具體作用主要為以下幾點:??(1)降低特征尺寸的維度,并減少計算量;??(2)在一定程度緩解了過擬合問題,更方便優(yōu)化;??(3)使得特征具有位移不變性。無論采用最大池化操作還是平均池化操作,都和特??征的位置沒有關系;??-10-??
??此能夠適當地提高網絡的參數。??2.2.3激活函數??激活函數(Activation?Function)是神經元的重要組成部分。神經網絡引入的激活函??數是為了增加神經網絡模型的非線性,以便它們可以逼近任何非線性函數,這樣神經??網絡可以應用于許多非線性模型。下面介紹幾種常用的激活函數。??(1)?Sigmoid?函數??Sigmoid函數是一種較早出現(xiàn)的激活函數,把激活值最終投射到0到1的區(qū)間上。??Sigmoid激活函數通?梢宰鳛楦怕式忉,通過這種方式加入非線性因素。如圖2.4所??示,其數學形式定義為:??辦)+?e(-wi+6)'?(2.2)??也可以寫成:??z?=?wx?+?b,?,f(z)?=?1?^?(2.3)??■L十6??一?I?丨.丨,??0.4-???h??!?17??0?^?丨?I??-8-6?-4?-2?02468??圖2.4?Sigmoid激活函數??Fig.?2.4?Sigmoid?activation?function??在實際應用中,Sigmoid函數因為它的性質引起了兩個顯著的缺點:??①Sigmoid激活函數輸出分布非零點對稱。對于神經網絡權重的梯度更新來說,若??數據流經過神經元的數據為正,那么在反向傳播的權重梯度也將為正(取決于表達式的??梯度),這種情況下造成的梯度并非理想,但是將其加入到整批數據最終更新的權重上??時,相比過飽和激活函數來說結果可以接受;??②Sigmoid激活函數飽和導致的梯度驟減。當Sigmoid激活函數飽和時,函數值非??0即1。在反向傳播的過程中,局部梯度會乘以整個網絡最終輸出的梯度。因此,如果??梯度很
【參考文獻】:
期刊論文
[1]國外大型無人水下航行器發(fā)展綜述[J]. 鐘宏偉,李國良,宋林樺,莫春軍. 水下無人系統(tǒng)學報. 2018(04)
[2]國外海洋無人航行器的發(fā)展現(xiàn)狀及趨勢[J]. 代威,張雯,張瀝,解春雷,惠俊鵬. 兵器裝備工程學報. 2018(07)
[3]基于深度強化學習的水下機器人最優(yōu)軌跡控制[J]. 馬瓊雄,余潤笙,石振宇,黃晁星,李騰龍. 華南師范大學學報(自然科學版). 2018(01)
[4]國外水下無人系統(tǒng)技術發(fā)展現(xiàn)狀與趨勢淺析[J]. 李亮,鄒金順. 艦船科學技術. 2017(23)
[5]無人水下航行器的發(fā)展現(xiàn)狀與關鍵技術[J]. 王童豪,彭星光,潘光,徐德民. 宇航總體技術. 2017(04)
[6]深度強化學習綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進. 計算機學報. 2018(01)
[7]潛用UUV回收技術[J]. 周杰,周文林. 四川兵工學報. 2011(08)
[8]基于神經網絡的自主水下機器人動態(tài)反饋控制[J]. 周煥銀,劉開周,封錫盛. 電機與控制學報. 2011(07)
[9]基于L2干擾抑制的水下機器人人三三維航跡跟蹤控制[J]. 張利軍,賈鶴鳴,邊信黔,嚴浙平,程相勤. 控制理論與應用. 2011(05)
[10]水下機器人的神經網絡自適應控制[J]. 俞建成,李強,張艾群,王曉輝. 控制理論與應用. 2008(01)
本文編號:3493437
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3493437.html