基于Q-Learning算法的智能信號燈系統(tǒng)
發(fā)布時間:2021-10-22 12:18
隨著經(jīng)濟(jì)的飛速發(fā)展,科技的進(jìn)步,汽車已經(jīng)進(jìn)入了千家萬戶,為人們的出行帶來了極大的方便。但隨之而來的是一系列不可避免的環(huán)境和社會問題。例如,噪聲污染、汽車尾氣造成的環(huán)境污染、交通擁堵等。特別是交通擁堵,隨著汽車數(shù)量的快速增長已經(jīng)是一個不可避免的問題。為了解決交通擁堵的問題,研究者們將人工智能引入交通控制系統(tǒng)中,通過智能算法來優(yōu)化交通資源的分配。在交通控制系統(tǒng)中,信號燈控制系統(tǒng)是最重要的一項。在現(xiàn)階段,投入實際應(yīng)用的信號燈控制系統(tǒng)中,固定時長的信號燈控制策略仍舊占據(jù)主導(dǎo)地位。而在多變的交通模式下,固定時長的信號燈策略已經(jīng)不能合理地分配交通資源,造成了交通資源的浪費。本文中提出了一種基于Q-Learning算法的智能信號燈系統(tǒng)。在此系統(tǒng)中,參照蟻群算法,引入了數(shù)字信息素,將其作為車道上交通信息的載體。假設(shè)車輛在車道上留下數(shù)字信息素,系統(tǒng)根據(jù)車道上數(shù)字信息素的量來制定下周期的紅綠燈時長策略。由于信息素會在車道上保留下來,信息素不僅可以保留下實時的交通信息,而且會保存歷史的交通信息。故在分配下一周期的紅綠燈時長時,不僅考慮到了實時的交通信息,而且會受到歷史交通信息的影響。系統(tǒng)可以利用數(shù)字信息素的...
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景和意義
1.2 智能交通系統(tǒng)研究現(xiàn)狀及發(fā)展趨勢
1.3 論文的主要研究內(nèi)容
1.4 論文章節(jié)安排
2 相關(guān)基礎(chǔ)知識
2.1 基于智能體的建模方法簡介
2.2 蟻群算法
2.2.1 經(jīng)典蟻群算法
2.2.2 信號燈系統(tǒng)中的蟻群算法
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)
2.3.2 Q-Learning算法
2.3.3 Q-Learning算法的實例
2.4 Q-Learning算法在交通控制中的優(yōu)勢
2.5 城市交通仿真軟件SUMO
2.6 本章小結(jié)
3 仿真模型設(shè)計
3.1 道路環(huán)境
3.2 車輛的相關(guān)參數(shù)
3.3 信號燈系統(tǒng)時長設(shè)置策略
3.4 Q-Learning算法的相關(guān)定義
3.4.1 狀態(tài)空間
3.4.2 行為空間
3.4.3 獎勵值函數(shù)
3.4.4 行為選擇策略
3.5 本章小結(jié)
4 模型驗證
4.1 實驗前準(zhǔn)備
4.2 交通需求恒定
4.2.1 車輛數(shù)恒定
4.2.2 交通需求比恒定
4.3 變化的交通需求
4.3.1 車輛需求變化幅度的影響
4.3.2 車輛需求變化頻率的影響
4.4 本章小結(jié)
5 基于Q-Learning算法的智能信號燈系統(tǒng)實驗結(jié)果分析
5.1 車輛需求設(shè)置及驗證
5.2 Q-Learning算法相關(guān)參數(shù)優(yōu)化
5.3 仿真實驗結(jié)果與分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號:3451083
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景和意義
1.2 智能交通系統(tǒng)研究現(xiàn)狀及發(fā)展趨勢
1.3 論文的主要研究內(nèi)容
1.4 論文章節(jié)安排
2 相關(guān)基礎(chǔ)知識
2.1 基于智能體的建模方法簡介
2.2 蟻群算法
2.2.1 經(jīng)典蟻群算法
2.2.2 信號燈系統(tǒng)中的蟻群算法
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)
2.3.2 Q-Learning算法
2.3.3 Q-Learning算法的實例
2.4 Q-Learning算法在交通控制中的優(yōu)勢
2.5 城市交通仿真軟件SUMO
2.6 本章小結(jié)
3 仿真模型設(shè)計
3.1 道路環(huán)境
3.2 車輛的相關(guān)參數(shù)
3.3 信號燈系統(tǒng)時長設(shè)置策略
3.4 Q-Learning算法的相關(guān)定義
3.4.1 狀態(tài)空間
3.4.2 行為空間
3.4.3 獎勵值函數(shù)
3.4.4 行為選擇策略
3.5 本章小結(jié)
4 模型驗證
4.1 實驗前準(zhǔn)備
4.2 交通需求恒定
4.2.1 車輛數(shù)恒定
4.2.2 交通需求比恒定
4.3 變化的交通需求
4.3.1 車輛需求變化幅度的影響
4.3.2 車輛需求變化頻率的影響
4.4 本章小結(jié)
5 基于Q-Learning算法的智能信號燈系統(tǒng)實驗結(jié)果分析
5.1 車輛需求設(shè)置及驗證
5.2 Q-Learning算法相關(guān)參數(shù)優(yōu)化
5.3 仿真實驗結(jié)果與分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號:3451083
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3451083.html
最近更新
教材專著