基于深度增強(qiáng)學(xué)習(xí)的智能車安全并道決策研究
發(fā)布時間:2022-04-17 20:14
“并道”全稱為“向左、右變更車道”,即在道路同一方向上有兩條或以上機(jī)動車道時,可以在不影響相關(guān)道內(nèi)行駛的機(jī)動車的正常行駛的前提下,改變行車道路。汽車智能化技術(shù)作為當(dāng)今世界車輛工程領(lǐng)域的研究熱點,加強(qiáng)智能車安全并道決策行為研究對于緩解道路擁堵,提高道路通行能力,改善綠色生態(tài)駕駛環(huán)境具有重大意義。傳統(tǒng)的經(jīng)驗規(guī)則決策算法對智能車及環(huán)境模型的依賴較高,在復(fù)雜動態(tài)的交通環(huán)境下,車輛的換道空間具有明顯的差異性,換道過程中的大量動態(tài)性、不確定信息也為自動駕駛車輛的駕駛決策帶來了巨大挑戰(zhàn)。本文為保障智能車并道決策的安全性,研究并設(shè)計了兩種智能車決策模型。首先,對分層狀態(tài)機(jī)的混合式?jīng)Q策規(guī)劃模型進(jìn)行設(shè)計;谝欢ǖ鸟{駛先驗規(guī)則,通過分層狀態(tài)機(jī)進(jìn)行不同駕駛狀態(tài)、子行為間的切換,能夠?qū)?fù)雜的決策邏輯清晰條理化。軌跡規(guī)劃模塊采用滾動時域優(yōu)化的局部路徑規(guī)劃方法,將行為規(guī)劃的結(jié)果綜合傳感器感知的周圍環(huán)境,針對不同的條件約束,采用高次多項式擬合的方式,考慮安全和舒適等原則,實時規(guī)劃出最優(yōu)路徑,最后通過連續(xù)變道的仿真驗證算法的有效性。然后,對深度增強(qiáng)學(xué)習(xí)DQN的動作反應(yīng)式?jīng)Q策模型進(jìn)行設(shè)計。首先針對傳統(tǒng)經(jīng)驗回放改進(jìn),引入...
【文章頁數(shù)】:92 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及意義
1.2 駕駛決策算法研究現(xiàn)狀
1.2.1 先驗規(guī)則型
1.2.2 數(shù)據(jù)統(tǒng)計驅(qū)動型
1.3 論文的結(jié)構(gòu)安排
第二章 基本理論
2.1 決策規(guī)劃系統(tǒng)體系結(jié)構(gòu)
2.1.1 逐層遞階式
2.1.2 動作反應(yīng)式
2.1.3 混合式
2.2 智能車輛的運動分析
2.3 深度增強(qiáng)學(xué)習(xí)的基本理論
2.3.1 增強(qiáng)學(xué)習(xí)
2.3.2 深度學(xué)習(xí)
2.3.3 典型算法框架及應(yīng)用
2.4 本章小節(jié)
第三章 基于分層狀態(tài)機(jī)的混合式駕駛決策模型
3.1 引言
3.2 換道行為分析
3.2.1 換道動機(jī)
3.2.2 換道風(fēng)險系數(shù)
3.2.3 車輛跟馳模型
3.2.4 換道執(zhí)行過程
3.3 層次有限狀態(tài)機(jī)
3.4 分層狀態(tài)機(jī)的行為規(guī)劃設(shè)計
3.5 滾動時域優(yōu)化的路徑規(guī)劃
3.5.1 規(guī)劃過程
3.5.2 階段性實驗結(jié)果
3.6 實驗設(shè)計及仿真
3.7 本章小結(jié)
第四章 基于DQN的動作反應(yīng)式?jīng)Q策模型
4.1 引言
4.2 DQN與智能車決策問題的契合
4.3 經(jīng)驗回放的優(yōu)先級采樣
4.4 多車道的選擇性換道
4.4.1 駕駛環(huán)境模型
4.4.2 駕駛行為的MDP過程建模
4.4.2.1 MDP狀態(tài)集合的設(shè)計
4.4.2.2 MDP動作集合的設(shè)計
4.4.2.3 MDP回報集合的設(shè)計
4.4.3 長短時記憶網(wǎng)絡(luò)LSTM
4.4.4 實驗設(shè)計及結(jié)果仿真
4.4.4.1 實驗?zāi)繕?biāo)及實驗環(huán)境
4.4.4.2 實驗描述
4.4.4.3 實驗結(jié)果分析
4.5 匝道合流目的性換道
4.5.1 駕駛行為的MDP過程建模
4.5.2 實驗設(shè)計及結(jié)果仿真
4.6 模型特點比較
4.7 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果
【參考文獻(xiàn)】:
期刊論文
[1]基于強(qiáng)化學(xué)習(xí)的無人駕駛匝道匯入模型[J]. 喬良,鮑泓,玄祖興,梁軍,潘峰. 計算機(jī)工程. 2018(07)
[2]車輛換道交互行為分析和建模[J]. 曲大義,陳文嬌,楊萬三,萬孟飛,曹俊業(yè). 公路交通科技. 2016(06)
[3]基于混合體系結(jié)構(gòu)的無人駕駛車輛系統(tǒng)[J]. 修彩靖,陳慧. 農(nóng)業(yè)機(jī)械學(xué)報. 2012(01)
[4]基于MAS的駕駛行為決策模型的研究[J]. 徐亮,張自力. 計算機(jī)工程與科學(xué). 2010(05)
[5]智能車輛自由換道模型研究[J]. 李瑋,高德芝,段建民. 公路交通科技. 2010(02)
[6]基于決策樹的駕駛行為決策機(jī)制研究[J]. 王曉原,楊新月. 系統(tǒng)仿真學(xué)報. 2008(02)
博士論文
[1]城市環(huán)境下無人駕駛車輛決策系統(tǒng)研究[D]. 陳佳佳.中國科學(xué)技術(shù)大學(xué) 2014
[2]智能車輛自主導(dǎo)航中避障路徑規(guī)劃與跟蹤控制研究[D]. 汪明磊.合肥工業(yè)大學(xué) 2013
碩士論文
[1]基于深度學(xué)習(xí)的換道行為建模與分析[D]. 房哲哲.北京交通大學(xué) 2018
[2]基于深度強(qiáng)化學(xué)習(xí)的視頻游戲決策模型研究與應(yīng)用[D]. 郭勤.江西理工大學(xué) 2018
[3]基于深度強(qiáng)化學(xué)習(xí)的股市投資模型構(gòu)建及實證研究[D]. 滿奇.廣東財經(jīng)大學(xué) 2017
[4]Q學(xué)習(xí)結(jié)合神經(jīng)網(wǎng)絡(luò)的智能駕駛行為決策系統(tǒng)[D]. 鄢婷.天津工業(yè)大學(xué) 2017
[5]復(fù)雜動態(tài)城市環(huán)境下無人駕駛車輛仿生換道決策模型研究[D]. 田賡.北京理工大學(xué) 2016
[6]深度強(qiáng)化學(xué)習(xí)在視頻游戲中的應(yīng)用[D]. 邱立威.華南理工大學(xué) 2015
[7]基于增強(qiáng)學(xué)習(xí)的無人車輛智能決策方法研究[D]. 鄭睿.國防科學(xué)技術(shù)大學(xué) 2013
本文編號:3646194
【文章頁數(shù)】:92 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及意義
1.2 駕駛決策算法研究現(xiàn)狀
1.2.1 先驗規(guī)則型
1.2.2 數(shù)據(jù)統(tǒng)計驅(qū)動型
1.3 論文的結(jié)構(gòu)安排
第二章 基本理論
2.1 決策規(guī)劃系統(tǒng)體系結(jié)構(gòu)
2.1.1 逐層遞階式
2.1.2 動作反應(yīng)式
2.1.3 混合式
2.2 智能車輛的運動分析
2.3 深度增強(qiáng)學(xué)習(xí)的基本理論
2.3.1 增強(qiáng)學(xué)習(xí)
2.3.2 深度學(xué)習(xí)
2.3.3 典型算法框架及應(yīng)用
2.4 本章小節(jié)
第三章 基于分層狀態(tài)機(jī)的混合式駕駛決策模型
3.1 引言
3.2 換道行為分析
3.2.1 換道動機(jī)
3.2.2 換道風(fēng)險系數(shù)
3.2.3 車輛跟馳模型
3.2.4 換道執(zhí)行過程
3.3 層次有限狀態(tài)機(jī)
3.4 分層狀態(tài)機(jī)的行為規(guī)劃設(shè)計
3.5 滾動時域優(yōu)化的路徑規(guī)劃
3.5.1 規(guī)劃過程
3.5.2 階段性實驗結(jié)果
3.6 實驗設(shè)計及仿真
3.7 本章小結(jié)
第四章 基于DQN的動作反應(yīng)式?jīng)Q策模型
4.1 引言
4.2 DQN與智能車決策問題的契合
4.3 經(jīng)驗回放的優(yōu)先級采樣
4.4 多車道的選擇性換道
4.4.1 駕駛環(huán)境模型
4.4.2 駕駛行為的MDP過程建模
4.4.2.1 MDP狀態(tài)集合的設(shè)計
4.4.2.2 MDP動作集合的設(shè)計
4.4.2.3 MDP回報集合的設(shè)計
4.4.3 長短時記憶網(wǎng)絡(luò)LSTM
4.4.4 實驗設(shè)計及結(jié)果仿真
4.4.4.1 實驗?zāi)繕?biāo)及實驗環(huán)境
4.4.4.2 實驗描述
4.4.4.3 實驗結(jié)果分析
4.5 匝道合流目的性換道
4.5.1 駕駛行為的MDP過程建模
4.5.2 實驗設(shè)計及結(jié)果仿真
4.6 模型特點比較
4.7 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的成果
【參考文獻(xiàn)】:
期刊論文
[1]基于強(qiáng)化學(xué)習(xí)的無人駕駛匝道匯入模型[J]. 喬良,鮑泓,玄祖興,梁軍,潘峰. 計算機(jī)工程. 2018(07)
[2]車輛換道交互行為分析和建模[J]. 曲大義,陳文嬌,楊萬三,萬孟飛,曹俊業(yè). 公路交通科技. 2016(06)
[3]基于混合體系結(jié)構(gòu)的無人駕駛車輛系統(tǒng)[J]. 修彩靖,陳慧. 農(nóng)業(yè)機(jī)械學(xué)報. 2012(01)
[4]基于MAS的駕駛行為決策模型的研究[J]. 徐亮,張自力. 計算機(jī)工程與科學(xué). 2010(05)
[5]智能車輛自由換道模型研究[J]. 李瑋,高德芝,段建民. 公路交通科技. 2010(02)
[6]基于決策樹的駕駛行為決策機(jī)制研究[J]. 王曉原,楊新月. 系統(tǒng)仿真學(xué)報. 2008(02)
博士論文
[1]城市環(huán)境下無人駕駛車輛決策系統(tǒng)研究[D]. 陳佳佳.中國科學(xué)技術(shù)大學(xué) 2014
[2]智能車輛自主導(dǎo)航中避障路徑規(guī)劃與跟蹤控制研究[D]. 汪明磊.合肥工業(yè)大學(xué) 2013
碩士論文
[1]基于深度學(xué)習(xí)的換道行為建模與分析[D]. 房哲哲.北京交通大學(xué) 2018
[2]基于深度強(qiáng)化學(xué)習(xí)的視頻游戲決策模型研究與應(yīng)用[D]. 郭勤.江西理工大學(xué) 2018
[3]基于深度強(qiáng)化學(xué)習(xí)的股市投資模型構(gòu)建及實證研究[D]. 滿奇.廣東財經(jīng)大學(xué) 2017
[4]Q學(xué)習(xí)結(jié)合神經(jīng)網(wǎng)絡(luò)的智能駕駛行為決策系統(tǒng)[D]. 鄢婷.天津工業(yè)大學(xué) 2017
[5]復(fù)雜動態(tài)城市環(huán)境下無人駕駛車輛仿生換道決策模型研究[D]. 田賡.北京理工大學(xué) 2016
[6]深度強(qiáng)化學(xué)習(xí)在視頻游戲中的應(yīng)用[D]. 邱立威.華南理工大學(xué) 2015
[7]基于增強(qiáng)學(xué)習(xí)的無人車輛智能決策方法研究[D]. 鄭睿.國防科學(xué)技術(shù)大學(xué) 2013
本文編號:3646194
本文鏈接:http://sikaile.net/kejilunwen/qiche/3646194.html
最近更新
教材專著