基于Q-Learning算法的智能信號(hào)燈系統(tǒng)
發(fā)布時(shí)間:2021-10-22 12:18
隨著經(jīng)濟(jì)的飛速發(fā)展,科技的進(jìn)步,汽車已經(jīng)進(jìn)入了千家萬(wàn)戶,為人們的出行帶來(lái)了極大的方便。但隨之而來(lái)的是一系列不可避免的環(huán)境和社會(huì)問(wèn)題。例如,噪聲污染、汽車尾氣造成的環(huán)境污染、交通擁堵等。特別是交通擁堵,隨著汽車數(shù)量的快速增長(zhǎng)已經(jīng)是一個(gè)不可避免的問(wèn)題。為了解決交通擁堵的問(wèn)題,研究者們將人工智能引入交通控制系統(tǒng)中,通過(guò)智能算法來(lái)優(yōu)化交通資源的分配。在交通控制系統(tǒng)中,信號(hào)燈控制系統(tǒng)是最重要的一項(xiàng)。在現(xiàn)階段,投入實(shí)際應(yīng)用的信號(hào)燈控制系統(tǒng)中,固定時(shí)長(zhǎng)的信號(hào)燈控制策略仍舊占據(jù)主導(dǎo)地位。而在多變的交通模式下,固定時(shí)長(zhǎng)的信號(hào)燈策略已經(jīng)不能合理地分配交通資源,造成了交通資源的浪費(fèi)。本文中提出了一種基于Q-Learning算法的智能信號(hào)燈系統(tǒng)。在此系統(tǒng)中,參照蟻群算法,引入了數(shù)字信息素,將其作為車道上交通信息的載體。假設(shè)車輛在車道上留下數(shù)字信息素,系統(tǒng)根據(jù)車道上數(shù)字信息素的量來(lái)制定下周期的紅綠燈時(shí)長(zhǎng)策略。由于信息素會(huì)在車道上保留下來(lái),信息素不僅可以保留下實(shí)時(shí)的交通信息,而且會(huì)保存歷史的交通信息。故在分配下一周期的紅綠燈時(shí)長(zhǎng)時(shí),不僅考慮到了實(shí)時(shí)的交通信息,而且會(huì)受到歷史交通信息的影響。系統(tǒng)可以利用數(shù)字信息素的...
【文章來(lái)源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景和意義
1.2 智能交通系統(tǒng)研究現(xiàn)狀及發(fā)展趨勢(shì)
1.3 論文的主要研究?jī)?nèi)容
1.4 論文章節(jié)安排
2 相關(guān)基礎(chǔ)知識(shí)
2.1 基于智能體的建模方法簡(jiǎn)介
2.2 蟻群算法
2.2.1 經(jīng)典蟻群算法
2.2.2 信號(hào)燈系統(tǒng)中的蟻群算法
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)
2.3.2 Q-Learning算法
2.3.3 Q-Learning算法的實(shí)例
2.4 Q-Learning算法在交通控制中的優(yōu)勢(shì)
2.5 城市交通仿真軟件SUMO
2.6 本章小結(jié)
3 仿真模型設(shè)計(jì)
3.1 道路環(huán)境
3.2 車輛的相關(guān)參數(shù)
3.3 信號(hào)燈系統(tǒng)時(shí)長(zhǎng)設(shè)置策略
3.4 Q-Learning算法的相關(guān)定義
3.4.1 狀態(tài)空間
3.4.2 行為空間
3.4.3 獎(jiǎng)勵(lì)值函數(shù)
3.4.4 行為選擇策略
3.5 本章小結(jié)
4 模型驗(yàn)證
4.1 實(shí)驗(yàn)前準(zhǔn)備
4.2 交通需求恒定
4.2.1 車輛數(shù)恒定
4.2.2 交通需求比恒定
4.3 變化的交通需求
4.3.1 車輛需求變化幅度的影響
4.3.2 車輛需求變化頻率的影響
4.4 本章小結(jié)
5 基于Q-Learning算法的智能信號(hào)燈系統(tǒng)實(shí)驗(yàn)結(jié)果分析
5.1 車輛需求設(shè)置及驗(yàn)證
5.2 Q-Learning算法相關(guān)參數(shù)優(yōu)化
5.3 仿真實(shí)驗(yàn)結(jié)果與分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號(hào):3451083
【文章來(lái)源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景和意義
1.2 智能交通系統(tǒng)研究現(xiàn)狀及發(fā)展趨勢(shì)
1.3 論文的主要研究?jī)?nèi)容
1.4 論文章節(jié)安排
2 相關(guān)基礎(chǔ)知識(shí)
2.1 基于智能體的建模方法簡(jiǎn)介
2.2 蟻群算法
2.2.1 經(jīng)典蟻群算法
2.2.2 信號(hào)燈系統(tǒng)中的蟻群算法
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)
2.3.2 Q-Learning算法
2.3.3 Q-Learning算法的實(shí)例
2.4 Q-Learning算法在交通控制中的優(yōu)勢(shì)
2.5 城市交通仿真軟件SUMO
2.6 本章小結(jié)
3 仿真模型設(shè)計(jì)
3.1 道路環(huán)境
3.2 車輛的相關(guān)參數(shù)
3.3 信號(hào)燈系統(tǒng)時(shí)長(zhǎng)設(shè)置策略
3.4 Q-Learning算法的相關(guān)定義
3.4.1 狀態(tài)空間
3.4.2 行為空間
3.4.3 獎(jiǎng)勵(lì)值函數(shù)
3.4.4 行為選擇策略
3.5 本章小結(jié)
4 模型驗(yàn)證
4.1 實(shí)驗(yàn)前準(zhǔn)備
4.2 交通需求恒定
4.2.1 車輛數(shù)恒定
4.2.2 交通需求比恒定
4.3 變化的交通需求
4.3.1 車輛需求變化幅度的影響
4.3.2 車輛需求變化頻率的影響
4.4 本章小結(jié)
5 基于Q-Learning算法的智能信號(hào)燈系統(tǒng)實(shí)驗(yàn)結(jié)果分析
5.1 車輛需求設(shè)置及驗(yàn)證
5.2 Q-Learning算法相關(guān)參數(shù)優(yōu)化
5.3 仿真實(shí)驗(yàn)結(jié)果與分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號(hào):3451083
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3451083.html
最近更新
教材專著