基于深度強化學習的信號燈自適應決策
【學位單位】:大連理工大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:U491.54;TP18
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題研究背景和意義
1.2 信號燈自適應控制方法回顧
1.3 本論文的研究目標及內(nèi)容安排
2 相關(guān)背景知識
2.1 深度學習
2.1.1 神經(jīng)網(wǎng)絡
2.1.2 批歸一化
2.1.3 卷積神經(jīng)網(wǎng)絡
2.2 強化學習
2.2.1 馬爾可夫決策過程與強化學習
2.2.2 Q學習和Sarsa
2.2.3 探索策略
2.2.4 值函數(shù)近似
2.3 深度強化學習
2.4 本章小結(jié)
3 基于Q值遷移深度強化學習的信號燈協(xié)同控制
3.1 多Agent系統(tǒng)中的強化學習
3.2 多交叉口信號燈控制建模
3.2.1 多交叉口結(jié)構(gòu)描述
3.2.2 基于多Agent的深度強化學習建模
3.3 基于Q值遷移的協(xié)同DQN控制方法
3.4 仿真實驗與結(jié)果分析
3.4.1 實驗環(huán)境
3.4.2 參數(shù)設置及評價指標
3.4.3 實驗結(jié)果和分析
3.5 本章小結(jié)
4 基于多任務深度Q網(wǎng)絡的Q值遷移協(xié)同控制
4.1 基于多任務深度強化學習的多交叉口信號燈控制
4.2 仿真實驗與結(jié)果分析
4.2.1 實驗環(huán)境及參數(shù)設置
4.2.2 實驗結(jié)果和分析
4.3 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表學術(shù)論文情況
致謝
【相似文獻】
相關(guān)期刊論文 前10條
1 葛鵬;;無信號燈路口發(fā)生事故如何判定責任[J];汽車與安全;2017年02期
2 邢靜;秦嘉寶;;智能交通信號燈控制系統(tǒng)研究[J];信息技術(shù)與信息化;2019年06期
3 武亞雄;;基于PLC的信號燈控制系統(tǒng)[J];信息通信;2014年12期
4 張娟萍;;PLC技術(shù)在交通信號燈控制方面的應用[J];電腦開發(fā)與應用;2014年05期
5 沈昊;;無信號燈控制平交口綠化設計與安全性研究[J];智能城市;2016年04期
6 侯鵬飛;陳虹霖;羅毅;商春雪;唐明靖;時燕;;基于車流量的智能信號燈的控制算法研究[J];物聯(lián)網(wǎng)技術(shù);2019年08期
7 楊聚寶;白帆;張瑜;;智能信號燈控制系統(tǒng)設計[J];河南師范大學學報(自然科學版);2007年01期
8 侯寶生;;交通信號燈控制綜合設計性實驗的研究與實踐[J];中國教育技術(shù)裝備;2011年18期
9 高戰(zhàn);田鵬;喬云嬌;;基于ARM的航行信號燈控制系統(tǒng)設計[J];日用電器;2018年04期
10 李旻朔;姚明海;;用于交通信號燈控制的特征表示近似Q學習[J];計算機科學;2018年S2期
相關(guān)博士學位論文 前1條
1 李銀飛;城市道路通暢性問題研究[D];浙江大學;2006年
相關(guān)碩士學位論文 前10條
1 胡猛;基于Q-Learning算法的智能信號燈系統(tǒng)[D];大連理工大學;2019年
2 相迎宵;I-SIG系統(tǒng)中雙向投毒攻擊分析及防護[D];北京交通大學;2019年
3 宋玉美;基于深度強化學習的信號燈自適應決策[D];大連理工大學;2019年
4 李振勤;V2X在無人駕駛智能車信號燈檢測中的應用研究[D];安徽工業(yè)大學;2019年
5 韓京慧;基于自耦型電感和分段控制模式的特種信號燈研制[D];延邊大學;2018年
6 張孟東;基于北斗導航的車載監(jiān)視信號燈系統(tǒng)的設計與實現(xiàn)[D];北方民族大學;2018年
7 吳艷蘭;考慮車輛與行人的單交叉口信號燈配時優(yōu)化研究[D];長沙理工大學;2018年
8 張博;車輛速度與信號燈協(xié)同控制研究[D];大連理工大學;2017年
9 劉連芳;基于RFID和ZigBee技術(shù)的智能信號燈控制系統(tǒng)[D];長春工業(yè)大學;2011年
10 邢玉梅;基于Agent智能交通信號燈控制的研究[D];吉林大學;2008年
本文編號:2852264
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2852264.html