基于深度強(qiáng)化學(xué)習(xí)的信號燈自適應(yīng)決策
【學(xué)位單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:U491.54;TP18
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題研究背景和意義
1.2 信號燈自適應(yīng)控制方法回顧
1.3 本論文的研究目標(biāo)及內(nèi)容安排
2 相關(guān)背景知識
2.1 深度學(xué)習(xí)
2.1.1 神經(jīng)網(wǎng)絡(luò)
2.1.2 批歸一化
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)
2.2 強(qiáng)化學(xué)習(xí)
2.2.1 馬爾可夫決策過程與強(qiáng)化學(xué)習(xí)
2.2.2 Q學(xué)習(xí)和Sarsa
2.2.3 探索策略
2.2.4 值函數(shù)近似
2.3 深度強(qiáng)化學(xué)習(xí)
2.4 本章小結(jié)
3 基于Q值遷移深度強(qiáng)化學(xué)習(xí)的信號燈協(xié)同控制
3.1 多Agent系統(tǒng)中的強(qiáng)化學(xué)習(xí)
3.2 多交叉口信號燈控制建模
3.2.1 多交叉口結(jié)構(gòu)描述
3.2.2 基于多Agent的深度強(qiáng)化學(xué)習(xí)建模
3.3 基于Q值遷移的協(xié)同DQN控制方法
3.4 仿真實驗與結(jié)果分析
3.4.1 實驗環(huán)境
3.4.2 參數(shù)設(shè)置及評價指標(biāo)
3.4.3 實驗結(jié)果和分析
3.5 本章小結(jié)
4 基于多任務(wù)深度Q網(wǎng)絡(luò)的Q值遷移協(xié)同控制
4.1 基于多任務(wù)深度強(qiáng)化學(xué)習(xí)的多交叉口信號燈控制
4.2 仿真實驗與結(jié)果分析
4.2.1 實驗環(huán)境及參數(shù)設(shè)置
4.2.2 實驗結(jié)果和分析
4.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 葛鵬;;無信號燈路口發(fā)生事故如何判定責(zé)任[J];汽車與安全;2017年02期
2 邢靜;秦嘉寶;;智能交通信號燈控制系統(tǒng)研究[J];信息技術(shù)與信息化;2019年06期
3 武亞雄;;基于PLC的信號燈控制系統(tǒng)[J];信息通信;2014年12期
4 張娟萍;;PLC技術(shù)在交通信號燈控制方面的應(yīng)用[J];電腦開發(fā)與應(yīng)用;2014年05期
5 沈昊;;無信號燈控制平交口綠化設(shè)計與安全性研究[J];智能城市;2016年04期
6 侯鵬飛;陳虹霖;羅毅;商春雪;唐明靖;時燕;;基于車流量的智能信號燈的控制算法研究[J];物聯(lián)網(wǎng)技術(shù);2019年08期
7 楊聚寶;白帆;張瑜;;智能信號燈控制系統(tǒng)設(shè)計[J];河南師范大學(xué)學(xué)報(自然科學(xué)版);2007年01期
8 侯寶生;;交通信號燈控制綜合設(shè)計性實驗的研究與實踐[J];中國教育技術(shù)裝備;2011年18期
9 高戰(zhàn);田鵬;喬云嬌;;基于ARM的航行信號燈控制系統(tǒng)設(shè)計[J];日用電器;2018年04期
10 李旻朔;姚明海;;用于交通信號燈控制的特征表示近似Q學(xué)習(xí)[J];計算機(jī)科學(xué);2018年S2期
相關(guān)博士學(xué)位論文 前1條
1 李銀飛;城市道路通暢性問題研究[D];浙江大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 胡猛;基于Q-Learning算法的智能信號燈系統(tǒng)[D];大連理工大學(xué);2019年
2 相迎宵;I-SIG系統(tǒng)中雙向投毒攻擊分析及防護(hù)[D];北京交通大學(xué);2019年
3 宋玉美;基于深度強(qiáng)化學(xué)習(xí)的信號燈自適應(yīng)決策[D];大連理工大學(xué);2019年
4 李振勤;V2X在無人駕駛智能車信號燈檢測中的應(yīng)用研究[D];安徽工業(yè)大學(xué);2019年
5 韓京慧;基于自耦型電感和分段控制模式的特種信號燈研制[D];延邊大學(xué);2018年
6 張孟東;基于北斗導(dǎo)航的車載監(jiān)視信號燈系統(tǒng)的設(shè)計與實現(xiàn)[D];北方民族大學(xué);2018年
7 吳艷蘭;考慮車輛與行人的單交叉口信號燈配時優(yōu)化研究[D];長沙理工大學(xué);2018年
8 張博;車輛速度與信號燈協(xié)同控制研究[D];大連理工大學(xué);2017年
9 劉連芳;基于RFID和ZigBee技術(shù)的智能信號燈控制系統(tǒng)[D];長春工業(yè)大學(xué);2011年
10 邢玉梅;基于Agent智能交通信號燈控制的研究[D];吉林大學(xué);2008年
本文編號:2852264
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2852264.html