基于深度強化學(xué)習(xí)的無人船路徑規(guī)劃研究
發(fā)布時間:2022-02-26 15:50
無人船具有廣闊的應(yīng)用前景,自主路徑規(guī)劃作為其關(guān)鍵技術(shù),已在無人船研究領(lǐng)域中發(fā)展成為熱點研究方向。結(jié)合人工智能理論方法,本文開展基于深度強化學(xué)習(xí)的無人船路徑規(guī)劃研究,解決未知復(fù)雜航行環(huán)境下的無人船自主航路規(guī)劃問題。首先,在開闊水域中,通過對環(huán)境進(jìn)行無人船安全范圍的區(qū)域劃分和視覺可視剪枝技術(shù),并結(jié)合Theta*理論生成足夠稀疏的全局最優(yōu)航路點。進(jìn)一步,在復(fù)雜的狹窄水域中,將精英和多樣化策略融入遺傳算法,設(shè)計了能夠生成稀疏航路點的精英遺傳算法。進(jìn)一步部署了B樣條技術(shù),以進(jìn)行靈活平滑的插值,從而得到由最佳稀疏路點組成的平滑路徑。其次,在不可預(yù)見的情況下,為具有運動學(xué)約束的無人船創(chuàng)建了一種結(jié)合了全局路徑規(guī)劃和局部層次結(jié)構(gòu)的運動學(xué)約束的全局-局部混合路徑規(guī)劃方案。為了應(yīng)對動態(tài)不可預(yù)見的環(huán)境,通過模糊決策層和精細(xì)動態(tài)窗口層建立了局部分層結(jié)構(gòu),分別通過控制前向和艏搖角速度來分別負(fù)責(zé)避免大范圍和近距離碰撞。借助于精細(xì)動態(tài)窗口層,與無人船有關(guān)的受約束的運動學(xué)將融入到局部路徑規(guī)劃中,進(jìn)而得到一條可跟蹤且避免碰撞的局部路徑。同時,設(shè)立虛擬航路點使局部路徑和全局路徑無縫銜接。從而為整個混合路徑規(guī)劃方案做出貢獻(xiàn)。...
【文章來源】:大連海事大學(xué)遼寧省211工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1本文各章節(jié)間的邏輯關(guān)系??Fig.?1.1?Relationship?of?each?chapter?in?this?paper??
?大連海事大學(xué)碩士學(xué)位論文???^___p]/_??,??■麵■■路徑1?■?路徑2??圖2.1?LOS算法示意圖??Fig.?2.1?Schematic?diagram?of?LOS?algorithm??路徑1:此時,Theta*和A*所做的相同。對于中間點尸,有兩部分需要計算。從起??點凡到中間點P的距離和從P到,的直線距離||p-,||,得到一個值??路徑2:這一部分中,Theta*還需要考慮中間點夕的父節(jié)點加入到距離的??計算中。同樣,存在兩部分。從起點凡到的距離和若/?’能“看??到腳/?時,計算與/;'的直線距離,得到一個值扣(/;》+??\\parent(p) ̄p'\\?〇??從圖中,根據(jù)三角形不等式,可以很明顯看出路徑2的長度比路徑1要短,此時??Theta*就會更新以及/>'的父節(jié)點。??2.?1.3粒子群算法??粒子群算法?]屬于啟發(fā)式算法的一種。該算法自提出以來,已經(jīng)廣泛使用在各個領(lǐng)??域中。粒子群算法是通過每個粒子對自我和社會的認(rèn)知來實現(xiàn)最優(yōu)解的。??在粒子群算法中,求解的對象是個體,而它們的更新方式如下:??vr.?[k]?=?wv(.?(A:?-1)?+?c,?(pbesti?-x,.?(A:?-1))?+?c2?^gbest?-?x.?[k?-1))?(2.2)??其中,表示第/個粒子在々時刻具有的速度,w為慣性參數(shù),Cl為粒子自我認(rèn)知能??力,表示第/個粒子的歷史最優(yōu)值,為第/個粒子在灸-1時刻的位置,c2??為粒子的社會認(rèn)知能力,g如對表示群體所有粒子的歷史最優(yōu)值。??-6?-??
?大連海事大學(xué)碩士學(xué)位論文???當(dāng)慣性系數(shù)為0時,粒子將會因失去記憶能力而收斂到當(dāng)前位置;若粒子的自我認(rèn)??知能力為0,雖然能夠在群體的作用下收斂,但非常容易出現(xiàn)局部最優(yōu);若粒子的社會??認(rèn)知能力為0,則會斷絕與群體的聯(lián)系進(jìn)行自我搜索,這樣會使得群體發(fā)散無法收斂。??2.?1.4遺傳算法??遺傳算法[29]由Holland在20世紀(jì)60年代提出,并在70年代發(fā)表的通過對“優(yōu)勝??劣汰”的自然選擇規(guī)律與遺傳學(xué)中的染色體匹配機制相結(jié)合得到的尋優(yōu)模型。其實質(zhì)是??一種在解空間中搜索與環(huán)境最匹配的自適應(yīng)方法。??初代種群通過采取隨機生成的方式得到,此時它們開始遵循由我們設(shè)定的選擇規(guī)律??進(jìn)行繁衍,從而不斷演化得到最優(yōu)解。在選擇過程中設(shè)計問題導(dǎo)向的適應(yīng)度函數(shù),同時??使用遺傳學(xué)中染色體的交叉與變異操作來進(jìn)行代代相傳。??選擇算子:選擇算子的主要目的是將好的解保留并遺棄不好的解,保持群體的大小??恒定。選擇算子通過個體與總體適應(yīng)值的占比確定生存概率再使用輪盤選擇的方式得到??下一代。之后,將選出來的個體,再送入到交叉和變異算子中,得到后代。??交叉算子:該算子是遺傳算法的核心機制,它能對個體進(jìn)行基因重組以獲得更好的??后代。交叉機制如圖2.2所示,從群體中隨機選擇兩個父本,并且隨機生成兩個交叉點,??個體基因的某些部分在兩個交叉部分之間交換以創(chuàng)建新的個體。??w?交叉點?,,??父本?1?|?45?1^?|?A?1?^?67??^?1?|??后代1?45?56?...?17?67??后代2?23?78?...?23?9??圖2.2交叉過程??Fig,?2.2?Crossover?process??-7?-??
本文編號:3644736
【文章來源】:大連海事大學(xué)遼寧省211工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1本文各章節(jié)間的邏輯關(guān)系??Fig.?1.1?Relationship?of?each?chapter?in?this?paper??
?大連海事大學(xué)碩士學(xué)位論文???^___p]/_??,??■麵■■路徑1?■?路徑2??圖2.1?LOS算法示意圖??Fig.?2.1?Schematic?diagram?of?LOS?algorithm??路徑1:此時,Theta*和A*所做的相同。對于中間點尸,有兩部分需要計算。從起??點凡到中間點P的距離和從P到,的直線距離||p-,||,得到一個值??路徑2:這一部分中,Theta*還需要考慮中間點夕的父節(jié)點加入到距離的??計算中。同樣,存在兩部分。從起點凡到的距離和若/?’能“看??到腳/?時,計算與/;'的直線距離,得到一個值扣(/;》+??\\parent(p) ̄p'\\?〇??從圖中,根據(jù)三角形不等式,可以很明顯看出路徑2的長度比路徑1要短,此時??Theta*就會更新以及/>'的父節(jié)點。??2.?1.3粒子群算法??粒子群算法?]屬于啟發(fā)式算法的一種。該算法自提出以來,已經(jīng)廣泛使用在各個領(lǐng)??域中。粒子群算法是通過每個粒子對自我和社會的認(rèn)知來實現(xiàn)最優(yōu)解的。??在粒子群算法中,求解的對象是個體,而它們的更新方式如下:??vr.?[k]?=?wv(.?(A:?-1)?+?c,?(pbesti?-x,.?(A:?-1))?+?c2?^gbest?-?x.?[k?-1))?(2.2)??其中,表示第/個粒子在々時刻具有的速度,w為慣性參數(shù),Cl為粒子自我認(rèn)知能??力,表示第/個粒子的歷史最優(yōu)值,為第/個粒子在灸-1時刻的位置,c2??為粒子的社會認(rèn)知能力,g如對表示群體所有粒子的歷史最優(yōu)值。??-6?-??
?大連海事大學(xué)碩士學(xué)位論文???當(dāng)慣性系數(shù)為0時,粒子將會因失去記憶能力而收斂到當(dāng)前位置;若粒子的自我認(rèn)??知能力為0,雖然能夠在群體的作用下收斂,但非常容易出現(xiàn)局部最優(yōu);若粒子的社會??認(rèn)知能力為0,則會斷絕與群體的聯(lián)系進(jìn)行自我搜索,這樣會使得群體發(fā)散無法收斂。??2.?1.4遺傳算法??遺傳算法[29]由Holland在20世紀(jì)60年代提出,并在70年代發(fā)表的通過對“優(yōu)勝??劣汰”的自然選擇規(guī)律與遺傳學(xué)中的染色體匹配機制相結(jié)合得到的尋優(yōu)模型。其實質(zhì)是??一種在解空間中搜索與環(huán)境最匹配的自適應(yīng)方法。??初代種群通過采取隨機生成的方式得到,此時它們開始遵循由我們設(shè)定的選擇規(guī)律??進(jìn)行繁衍,從而不斷演化得到最優(yōu)解。在選擇過程中設(shè)計問題導(dǎo)向的適應(yīng)度函數(shù),同時??使用遺傳學(xué)中染色體的交叉與變異操作來進(jìn)行代代相傳。??選擇算子:選擇算子的主要目的是將好的解保留并遺棄不好的解,保持群體的大小??恒定。選擇算子通過個體與總體適應(yīng)值的占比確定生存概率再使用輪盤選擇的方式得到??下一代。之后,將選出來的個體,再送入到交叉和變異算子中,得到后代。??交叉算子:該算子是遺傳算法的核心機制,它能對個體進(jìn)行基因重組以獲得更好的??后代。交叉機制如圖2.2所示,從群體中隨機選擇兩個父本,并且隨機生成兩個交叉點,??個體基因的某些部分在兩個交叉部分之間交換以創(chuàng)建新的個體。??w?交叉點?,,??父本?1?|?45?1^?|?A?1?^?67??^?1?|??后代1?45?56?...?17?67??后代2?23?78?...?23?9??圖2.2交叉過程??Fig,?2.2?Crossover?process??-7?-??
本文編號:3644736
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3644736.html
最近更新
教材專著