行為樹在自動駕駛行為規(guī)劃策略中的應(yīng)用研究
發(fā)布時間:2021-08-12 15:48
自動駕駛技術(shù)致力于解決交通擁堵并減少交通事故,近年來發(fā)展迅速。其中一個關(guān)鍵的開放問題是,根據(jù)周圍交通狀況選擇有效駕駛行為的行為規(guī)劃策略。目前的大量技術(shù)實現(xiàn)都以有限狀態(tài)機作為全場景的整體策略模型,但是有限狀態(tài)機內(nèi)部模塊之間存在強耦合,需要專業(yè)知識手動設(shè)計,步驟繁瑣,不利于更新和維護。而最新的分場景研究方法則往往以單個強化學(xué)習(xí)智能體面向整個場景進行訓(xùn)練,存在狀態(tài)空間維度高,訓(xùn)練難度高,基于神經(jīng)網(wǎng)絡(luò)的策略無安全保障等問題�;诖�,本文提出使用模塊化程度更高、可擴展性更強的行為樹模型代替有限狀態(tài)機作為行為規(guī)劃策略的主模型。行為樹的結(jié)構(gòu)與子節(jié)點設(shè)計結(jié)合遺傳編程算法和強化學(xué)習(xí)算法,以適應(yīng)不同場景的策略規(guī)劃需求。具體而言,本文的主要工作內(nèi)容有:1)在CARLA模擬器中構(gòu)建包含行人和其他障礙車輛的3種不同交通場景——帶有信號燈的十字交叉路口、多車道直行路段和環(huán)島路段,并建立行為樹策略所需的基本條件節(jié)點和動作節(jié)點;2)通過分析行為樹的冗余節(jié)點,規(guī)范化行為樹的結(jié)構(gòu),以縮小遺傳編程的搜索空間,并在此基礎(chǔ)上設(shè)計實現(xiàn)加入了dropout遺傳操作和哈希集合的遺傳編程算法;3)設(shè)計并訓(xùn)練加入了深度Q學(xué)習(xí)(Deep ...
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:91 頁
【學(xué)位級別】:碩士
【部分圖文】:
000年至2016年車禍死亡人數(shù)(每百萬人)與死亡率[2]
蘭州大學(xué)碩士學(xué)位論文基于行為樹的自動駕駛行為規(guī)劃策略研究2自動駕駛的技術(shù)棧主要由環(huán)境感知、地圖定位、規(guī)劃決策和控制四部分組成[3],如圖1-2所示。地圖模塊分為高精度地圖和定位兩部分:高精度地圖負責(zé)離線構(gòu)建自動駕駛車輛行駛環(huán)境的靜態(tài)地圖信息,包括車道線坐標、每條車道的方向、允許轉(zhuǎn)向的信息、交通標志、紅綠燈坐標等;定位則是通過GNSS(GlobalNavigationSatelliteSystem,GNSS)、IMU(InertialMeasurementUnit,IMU)等傳感器確定車輛在世界坐標系以及本地高精度地圖坐標系當中的位置、朝向和運動狀態(tài)。環(huán)境感知模塊根據(jù)激光雷達、毫米波雷達、攝像頭等傳感器的實時輸入計算出周圍環(huán)境其他不包含在高精度地圖中的動態(tài)車輛、行人與障礙物信息。規(guī)劃決策模塊在用戶設(shè)定好車輛預(yù)計到達的目標地點的基礎(chǔ)上,通過與目前常見導(dǎo)航系統(tǒng)類似的算法得出車輛在城市路網(wǎng)中的宏觀路徑規(guī)劃,再結(jié)合周圍實時的動態(tài)車輛和行人信息,能夠生成車輛在短期內(nèi)計劃行駛的軌跡。最后,控制模塊通過車輛運動學(xué)和動力學(xué)模型計算出方向盤、油門、剎車等部件的控制量,令車輛盡可能嚴格按照短期的軌跡規(guī)劃行駛。圖1-2自動駕駛系統(tǒng)模塊結(jié)構(gòu)圖[3]其中,規(guī)劃決策模塊又可以分成三部分:任務(wù)規(guī)劃、行為規(guī)劃和軌跡規(guī)劃。任務(wù)規(guī)劃主要負責(zé)在路網(wǎng)中給出從自動駕駛車輛(下文簡稱主車)當前位置到目標點的一條預(yù)計到達成本最小(耗時最少或距離最短)的路徑,行為規(guī)劃則根據(jù)周圍的交通狀況生成主車當前最佳的駕駛行為,并最終由軌跡規(guī)劃器根據(jù)抽象化的駕駛行為指令生成主車能夠?qū)嶋H通過的具體路徑。從任務(wù)規(guī)劃到軌跡規(guī)劃是一個從高級指令到低級指令,從抽象到具體的過渡過程。
用策略來應(yīng)對所有交通場景在目前還不切實際,而根據(jù)不同交通場景分解成許多子問題進行求解則更加可行。行為規(guī)劃軟件模塊在實際運行時也會依據(jù)當前所處的不同交通場景選擇調(diào)用不同的子策略來執(zhí)行行為規(guī)劃任務(wù)。行為規(guī)劃策略基于全局規(guī)劃路徑、靜態(tài)地圖信息以及周圍環(huán)境的動態(tài)路況,規(guī)劃出當前應(yīng)該執(zhí)行的駕駛行為。這里的駕駛行為并不是最終傳遞到車輛底盤的方向盤轉(zhuǎn)角、油門開度、剎車開度等控制量,而是如加速、減速、變道、跟車等抽象駕駛行為指令,由下層的軌跡規(guī)劃模塊負責(zé)解釋執(zhí)行和實現(xiàn)。行為規(guī)劃策略的輸入與輸出如圖1-3所示。圖1-3行為規(guī)劃策略的輸入與輸出[3][5]
【參考文獻】:
期刊論文
[1]行為樹技術(shù)的研究進展與應(yīng)用[J]. 劉瑞峰,王家勝,張灝龍,田夢凡. 計算機與現(xiàn)代化. 2020(02)
[2]中國100個城市交通擁堵的空間格局研究——基于高德交通擁堵大數(shù)據(jù)的分析[J]. 王卉彤,劉傳明. 山東財經(jīng)大學(xué)學(xué)報. 2020(01)
[3]智能車輛駕駛行為決策方法研究[J]. 趙志成,華一丁,王文揚,陳正. 現(xiàn)代信息科技. 2019(24)
[4]基于值函數(shù)和策略梯度的深度強化學(xué)習(xí)綜述[J]. 劉建偉,高峰,羅雄麟. 計算機學(xué)報. 2019(06)
[5]深度強化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進. 計算機學(xué)報. 2018(01)
[6]深度強化學(xué)習(xí)綜述:兼論計算機圍棋的發(fā)展[J]. 趙冬斌,邵坤,朱圓恒,李棟,陳亞冉,王海濤,劉德榮,周彤,王成紅. 控制理論與應(yīng)用. 2016(06)
[7]基于有限狀態(tài)機的差動轉(zhuǎn)向無人車整車控制策略設(shè)計[J]. 熊璐,黃少帥,王龍祥,楊光興. 制造業(yè)自動化. 2015(19)
[8]基于有限狀態(tài)機的智能車輛交叉口行為預(yù)測與控制[J]. 熊光明,李勇,王詩源. 北京理工大學(xué)學(xué)報. 2015(01)
[9]遺傳編程實現(xiàn)的研究[J]. 查志琴,高波,鄭成增. 計算機應(yīng)用. 2003(07)
博士論文
[1]城區(qū)不確定環(huán)境下無人駕駛車輛行為決策方法研究[D]. 耿新力.中國科學(xué)技術(shù)大學(xué) 2017
[2]城市環(huán)境下無人駕駛車輛決策系統(tǒng)研究[D]. 陳佳佳.中國科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]基于深度Q網(wǎng)絡(luò)算法與模型的研究[D]. 翟建偉.蘇州大學(xué) 2017
本文編號:3338606
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:91 頁
【學(xué)位級別】:碩士
【部分圖文】:
000年至2016年車禍死亡人數(shù)(每百萬人)與死亡率[2]
蘭州大學(xué)碩士學(xué)位論文基于行為樹的自動駕駛行為規(guī)劃策略研究2自動駕駛的技術(shù)棧主要由環(huán)境感知、地圖定位、規(guī)劃決策和控制四部分組成[3],如圖1-2所示。地圖模塊分為高精度地圖和定位兩部分:高精度地圖負責(zé)離線構(gòu)建自動駕駛車輛行駛環(huán)境的靜態(tài)地圖信息,包括車道線坐標、每條車道的方向、允許轉(zhuǎn)向的信息、交通標志、紅綠燈坐標等;定位則是通過GNSS(GlobalNavigationSatelliteSystem,GNSS)、IMU(InertialMeasurementUnit,IMU)等傳感器確定車輛在世界坐標系以及本地高精度地圖坐標系當中的位置、朝向和運動狀態(tài)。環(huán)境感知模塊根據(jù)激光雷達、毫米波雷達、攝像頭等傳感器的實時輸入計算出周圍環(huán)境其他不包含在高精度地圖中的動態(tài)車輛、行人與障礙物信息。規(guī)劃決策模塊在用戶設(shè)定好車輛預(yù)計到達的目標地點的基礎(chǔ)上,通過與目前常見導(dǎo)航系統(tǒng)類似的算法得出車輛在城市路網(wǎng)中的宏觀路徑規(guī)劃,再結(jié)合周圍實時的動態(tài)車輛和行人信息,能夠生成車輛在短期內(nèi)計劃行駛的軌跡。最后,控制模塊通過車輛運動學(xué)和動力學(xué)模型計算出方向盤、油門、剎車等部件的控制量,令車輛盡可能嚴格按照短期的軌跡規(guī)劃行駛。圖1-2自動駕駛系統(tǒng)模塊結(jié)構(gòu)圖[3]其中,規(guī)劃決策模塊又可以分成三部分:任務(wù)規(guī)劃、行為規(guī)劃和軌跡規(guī)劃。任務(wù)規(guī)劃主要負責(zé)在路網(wǎng)中給出從自動駕駛車輛(下文簡稱主車)當前位置到目標點的一條預(yù)計到達成本最小(耗時最少或距離最短)的路徑,行為規(guī)劃則根據(jù)周圍的交通狀況生成主車當前最佳的駕駛行為,并最終由軌跡規(guī)劃器根據(jù)抽象化的駕駛行為指令生成主車能夠?qū)嶋H通過的具體路徑。從任務(wù)規(guī)劃到軌跡規(guī)劃是一個從高級指令到低級指令,從抽象到具體的過渡過程。
用策略來應(yīng)對所有交通場景在目前還不切實際,而根據(jù)不同交通場景分解成許多子問題進行求解則更加可行。行為規(guī)劃軟件模塊在實際運行時也會依據(jù)當前所處的不同交通場景選擇調(diào)用不同的子策略來執(zhí)行行為規(guī)劃任務(wù)。行為規(guī)劃策略基于全局規(guī)劃路徑、靜態(tài)地圖信息以及周圍環(huán)境的動態(tài)路況,規(guī)劃出當前應(yīng)該執(zhí)行的駕駛行為。這里的駕駛行為并不是最終傳遞到車輛底盤的方向盤轉(zhuǎn)角、油門開度、剎車開度等控制量,而是如加速、減速、變道、跟車等抽象駕駛行為指令,由下層的軌跡規(guī)劃模塊負責(zé)解釋執(zhí)行和實現(xiàn)。行為規(guī)劃策略的輸入與輸出如圖1-3所示。圖1-3行為規(guī)劃策略的輸入與輸出[3][5]
【參考文獻】:
期刊論文
[1]行為樹技術(shù)的研究進展與應(yīng)用[J]. 劉瑞峰,王家勝,張灝龍,田夢凡. 計算機與現(xiàn)代化. 2020(02)
[2]中國100個城市交通擁堵的空間格局研究——基于高德交通擁堵大數(shù)據(jù)的分析[J]. 王卉彤,劉傳明. 山東財經(jīng)大學(xué)學(xué)報. 2020(01)
[3]智能車輛駕駛行為決策方法研究[J]. 趙志成,華一丁,王文揚,陳正. 現(xiàn)代信息科技. 2019(24)
[4]基于值函數(shù)和策略梯度的深度強化學(xué)習(xí)綜述[J]. 劉建偉,高峰,羅雄麟. 計算機學(xué)報. 2019(06)
[5]深度強化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進. 計算機學(xué)報. 2018(01)
[6]深度強化學(xué)習(xí)綜述:兼論計算機圍棋的發(fā)展[J]. 趙冬斌,邵坤,朱圓恒,李棟,陳亞冉,王海濤,劉德榮,周彤,王成紅. 控制理論與應(yīng)用. 2016(06)
[7]基于有限狀態(tài)機的差動轉(zhuǎn)向無人車整車控制策略設(shè)計[J]. 熊璐,黃少帥,王龍祥,楊光興. 制造業(yè)自動化. 2015(19)
[8]基于有限狀態(tài)機的智能車輛交叉口行為預(yù)測與控制[J]. 熊光明,李勇,王詩源. 北京理工大學(xué)學(xué)報. 2015(01)
[9]遺傳編程實現(xiàn)的研究[J]. 查志琴,高波,鄭成增. 計算機應(yīng)用. 2003(07)
博士論文
[1]城區(qū)不確定環(huán)境下無人駕駛車輛行為決策方法研究[D]. 耿新力.中國科學(xué)技術(shù)大學(xué) 2017
[2]城市環(huán)境下無人駕駛車輛決策系統(tǒng)研究[D]. 陳佳佳.中國科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]基于深度Q網(wǎng)絡(luò)算法與模型的研究[D]. 翟建偉.蘇州大學(xué) 2017
本文編號:3338606
本文鏈接:http://sikaile.net/kejilunwen/qiche/3338606.html
最近更新
教材專著