基于強(qiáng)化學(xué)習(xí)的多車隊(duì)列縱向協(xié)同控制算法研究
發(fā)布時(shí)間:2021-05-06 00:52
本文主要對(duì)多車隊(duì)列協(xié)同縱向行駛的決策控制算法進(jìn)行了一定的研究。區(qū)別于傳統(tǒng)基于規(guī)則的控制方法,本文選擇強(qiáng)化學(xué)習(xí)方法解決車輛協(xié)同跟車行駛中的加速度決策問題。在多車隊(duì)列中除領(lǐng)航車外,每一輛跟隨車都處于類似的外部行駛環(huán)境,為降低系統(tǒng)的策略學(xué)習(xí)難度,隊(duì)列中的每輛車均可視為獨(dú)立的智能體,所有跟隨車輛共享相同的決策模型。多車協(xié)同行駛控制問題可拆解為節(jié)點(diǎn)協(xié)同跟馳策略的學(xué)習(xí),當(dāng)單車的跟馳策略收斂,整個(gè)隊(duì)列也將穩(wěn)定地行駛。本文的研究?jī)?nèi)容主要包含以下4方面:(1)介紹強(qiáng)化學(xué)習(xí)的基本理論,以及相關(guān)代表性算法的原理。在分析各算法的優(yōu)缺點(diǎn)后,最終提出一種結(jié)合模仿學(xué)習(xí)思想的深度確定性策略梯度(DDPG)算法優(yōu)化方案。(2)以經(jīng)驗(yàn)回放和目標(biāo)網(wǎng)絡(luò)技巧為切入點(diǎn)闡述DDPG算法的具體實(shí)現(xiàn)過(guò)程。建立跟隨車輛協(xié)同行駛的MDP模型,在此基礎(chǔ)上運(yùn)用DDPG算法訓(xùn)練車輛學(xué)習(xí)固定車間距下的協(xié)同行駛策略。在單車節(jié)點(diǎn)上層控制器的策略收斂時(shí),進(jìn)行四車隊(duì)列的協(xié)同行駛仿真實(shí)驗(yàn),仿真結(jié)果表明所學(xué)控制策略可滿足隊(duì)列的行駛穩(wěn)定性。(3)選取全速度差跟馳模型作為指導(dǎo)車輛跟隨前車行駛的演示策略。針對(duì)演示策略增設(shè)對(duì)應(yīng)的監(jiān)督損失,以保證訓(xùn)練過(guò)程中發(fā)揮其監(jiān)督作...
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 CACC系統(tǒng)研究現(xiàn)狀
1.2.2 強(qiáng)化學(xué)習(xí)研究現(xiàn)狀
1.3 論文主要研究?jī)?nèi)容
第二章 多車協(xié)同行駛決策控制問題與解決方案
2.1 多車協(xié)同行駛決策控制框架
2.2 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.3 深度確定性策略梯度算法
2.4 強(qiáng)化學(xué)習(xí)算法優(yōu)化方案
2.5 本章小結(jié)
第三章 基于DDPG的車輛協(xié)同行駛決策控制技術(shù)
3.1 DDPG算法具體實(shí)現(xiàn)
3.2 基于DDPG的車輛協(xié)同決策控制算法設(shè)計(jì)
3.2.1 車輛縱向動(dòng)力學(xué)模型及驗(yàn)證
3.2.2 車輛節(jié)點(diǎn)MDP建模
3.2.3 網(wǎng)絡(luò)結(jié)構(gòu)及相關(guān)參數(shù)設(shè)計(jì)
3.2.4 跟車決策學(xué)習(xí)過(guò)程
3.3 仿真與結(jié)果分析
3.4 本章小結(jié)
第四章 基于改進(jìn)DDPG的車輛協(xié)同行駛決策技術(shù)
4.1 基于全速度差跟馳模型的演示策略
4.2 DDPG算法優(yōu)化過(guò)程
4.2.1 Replay buffer結(jié)構(gòu)改進(jìn)
4.2.2 演示策略監(jiān)督誤差設(shè)計(jì)
4.2.3 MDP模型優(yōu)化
4.3 仿真與結(jié)果分析
4.3.1 預(yù)訓(xùn)練效果分析
4.3.2 各算法結(jié)果對(duì)比
4.4 本章小結(jié)
第五章 智能小車軟硬件實(shí)驗(yàn)平臺(tái)搭建
5.1 智能小車平臺(tái)硬件組成
5.2 平臺(tái)底層控制系統(tǒng)設(shè)計(jì)
5.2.1 基于增量PID的閉環(huán)車速控制
5.2.2 基于純追蹤算法的定航向控制
5.3 基于ROS的上位機(jī)程序運(yùn)行框架
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
作者簡(jiǎn)介
【參考文獻(xiàn)】:
期刊論文
[1]車隊(duì)控制中的一種通用可變時(shí)距策略[J]. 于曉海,郭戈. 自動(dòng)化學(xué)報(bào). 2019(07)
[2]智能網(wǎng)聯(lián)汽車技術(shù)應(yīng)用與發(fā)展趨勢(shì)[J]. 關(guān)宇豪,蔣園園. 汽車實(shí)用技術(shù). 2018(22)
[3]電動(dòng)汽車發(fā)展綜述[J]. 胡堋湫,譚澤富,邱剛,王欣煜,鄧明. 電氣應(yīng)用. 2018(20)
[4]基于Vissim的車聯(lián)網(wǎng)及自動(dòng)駕駛車輛交通仿真研究[J]. 宋皓晨,吳鼎新. 物流工程與管理. 2018(09)
[5]基于改進(jìn)優(yōu)化速度函數(shù)的跟馳模型研究[J]. 楊龍海,趙順,徐洪. 交通運(yùn)輸系統(tǒng)工程與信息. 2017(02)
[6]混合-增強(qiáng)智能:協(xié)作與認(rèn)知(英文)[J]. Nan-ning ZHENG,Zi-yi LIU,Peng-ju REN,Yong-qiang MA,Shi-tao CHEN,Si-yu YU,Jian-ru XUE,Ba-dong CHEN,Fei-yue WANG. Frontiers of Information Technology & Electronic Engineering. 2017(02)
[7]面向智能網(wǎng)聯(lián)汽車的V2X通信技術(shù)探討[J]. 陳荊花,黃曉彬,李潔. 電信技術(shù). 2016(05)
[8]基于隊(duì)列行駛的混合動(dòng)力汽車節(jié)能預(yù)測(cè)控制方法研究[J]. 余開江,許孝卓,胡治國(guó),王莉. 系統(tǒng)仿真技術(shù). 2015(03)
[9]車聯(lián)網(wǎng)技術(shù)應(yīng)用綜述[J]. 蘇靜,王冬,張菲菲. 物聯(lián)網(wǎng)技術(shù). 2014(06)
[10]協(xié)同式自適應(yīng)巡航技術(shù)發(fā)展現(xiàn)狀及趨勢(shì)[J]. 秦曉輝,謝伯元. 現(xiàn)代電信科技. 2014(03)
本文編號(hào):3170918
【文章來(lái)源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 CACC系統(tǒng)研究現(xiàn)狀
1.2.2 強(qiáng)化學(xué)習(xí)研究現(xiàn)狀
1.3 論文主要研究?jī)?nèi)容
第二章 多車協(xié)同行駛決策控制問題與解決方案
2.1 多車協(xié)同行駛決策控制框架
2.2 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.3 深度確定性策略梯度算法
2.4 強(qiáng)化學(xué)習(xí)算法優(yōu)化方案
2.5 本章小結(jié)
第三章 基于DDPG的車輛協(xié)同行駛決策控制技術(shù)
3.1 DDPG算法具體實(shí)現(xiàn)
3.2 基于DDPG的車輛協(xié)同決策控制算法設(shè)計(jì)
3.2.1 車輛縱向動(dòng)力學(xué)模型及驗(yàn)證
3.2.2 車輛節(jié)點(diǎn)MDP建模
3.2.3 網(wǎng)絡(luò)結(jié)構(gòu)及相關(guān)參數(shù)設(shè)計(jì)
3.2.4 跟車決策學(xué)習(xí)過(guò)程
3.3 仿真與結(jié)果分析
3.4 本章小結(jié)
第四章 基于改進(jìn)DDPG的車輛協(xié)同行駛決策技術(shù)
4.1 基于全速度差跟馳模型的演示策略
4.2 DDPG算法優(yōu)化過(guò)程
4.2.1 Replay buffer結(jié)構(gòu)改進(jìn)
4.2.2 演示策略監(jiān)督誤差設(shè)計(jì)
4.2.3 MDP模型優(yōu)化
4.3 仿真與結(jié)果分析
4.3.1 預(yù)訓(xùn)練效果分析
4.3.2 各算法結(jié)果對(duì)比
4.4 本章小結(jié)
第五章 智能小車軟硬件實(shí)驗(yàn)平臺(tái)搭建
5.1 智能小車平臺(tái)硬件組成
5.2 平臺(tái)底層控制系統(tǒng)設(shè)計(jì)
5.2.1 基于增量PID的閉環(huán)車速控制
5.2.2 基于純追蹤算法的定航向控制
5.3 基于ROS的上位機(jī)程序運(yùn)行框架
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
作者簡(jiǎn)介
【參考文獻(xiàn)】:
期刊論文
[1]車隊(duì)控制中的一種通用可變時(shí)距策略[J]. 于曉海,郭戈. 自動(dòng)化學(xué)報(bào). 2019(07)
[2]智能網(wǎng)聯(lián)汽車技術(shù)應(yīng)用與發(fā)展趨勢(shì)[J]. 關(guān)宇豪,蔣園園. 汽車實(shí)用技術(shù). 2018(22)
[3]電動(dòng)汽車發(fā)展綜述[J]. 胡堋湫,譚澤富,邱剛,王欣煜,鄧明. 電氣應(yīng)用. 2018(20)
[4]基于Vissim的車聯(lián)網(wǎng)及自動(dòng)駕駛車輛交通仿真研究[J]. 宋皓晨,吳鼎新. 物流工程與管理. 2018(09)
[5]基于改進(jìn)優(yōu)化速度函數(shù)的跟馳模型研究[J]. 楊龍海,趙順,徐洪. 交通運(yùn)輸系統(tǒng)工程與信息. 2017(02)
[6]混合-增強(qiáng)智能:協(xié)作與認(rèn)知(英文)[J]. Nan-ning ZHENG,Zi-yi LIU,Peng-ju REN,Yong-qiang MA,Shi-tao CHEN,Si-yu YU,Jian-ru XUE,Ba-dong CHEN,Fei-yue WANG. Frontiers of Information Technology & Electronic Engineering. 2017(02)
[7]面向智能網(wǎng)聯(lián)汽車的V2X通信技術(shù)探討[J]. 陳荊花,黃曉彬,李潔. 電信技術(shù). 2016(05)
[8]基于隊(duì)列行駛的混合動(dòng)力汽車節(jié)能預(yù)測(cè)控制方法研究[J]. 余開江,許孝卓,胡治國(guó),王莉. 系統(tǒng)仿真技術(shù). 2015(03)
[9]車聯(lián)網(wǎng)技術(shù)應(yīng)用綜述[J]. 蘇靜,王冬,張菲菲. 物聯(lián)網(wǎng)技術(shù). 2014(06)
[10]協(xié)同式自適應(yīng)巡航技術(shù)發(fā)展現(xiàn)狀及趨勢(shì)[J]. 秦曉輝,謝伯元. 現(xiàn)代電信科技. 2014(03)
本文編號(hào):3170918
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/3170918.html
最近更新
教材專著