基于深度強(qiáng)化學(xué)習(xí)的多智能體城市道路交叉口交通流優(yōu)化控制研究
【圖文】:
強(qiáng)化學(xué)習(xí)基本原理
圖 2-3 MDP 示例圖狀態(tài),狀態(tài)集表示為S { , , , ,, },動(dòng)作 },紅色標(biāo)注當(dāng)前狀態(tài)轉(zhuǎn)移到下一個(gè)狀態(tài)的立即回報(bào)。的某一回合中,當(dāng)給定初始狀態(tài)和策略 時(shí),我們定義
【學(xué)位授予單位】:福建工程學(xué)院
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:U491.54
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陸化普;孫智源;屈聞聰;;大數(shù)據(jù)及其在城市智能交通系統(tǒng)中的應(yīng)用綜述[J];交通運(yùn)輸系統(tǒng)工程與信息;2015年05期
2 閆飛;田福禮;史忠科;;城市區(qū)域交通信號迭代學(xué)習(xí)控制策略[J];控制與決策;2015年08期
3 張鄰;吳偉明;黃選偉;;基于動(dòng)態(tài)信號配時(shí)的非線性規(guī)劃模型[J];公路交通科技;2014年08期
4 龍瓊;胡列格;張謹(jǐn)帆;周昭明;彭爍;;考慮交通管理策略的交叉口信號控制多目標(biāo)優(yōu)化[J];中南大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年07期
5 朱銘琳;陳陽舟;;基于博弈的交叉口交通信號配時(shí)系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)仿真;2013年07期
6 首艷芳;徐建閩;;基于群體動(dòng)力學(xué)的協(xié)調(diào)控制子區(qū)劃分[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
7 聶建強(qiáng);徐大林;;基于模糊Q學(xué)習(xí)的分布式自適應(yīng)交通信號控制[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年03期
8 李建明;余春艷;;演化博弈下單點(diǎn)信號燈配時(shí)優(yōu)化研究[J];交通運(yùn)輸系統(tǒng)工程與信息;2012年04期
9 趙曉華;李振龍;于泉;榮建;;基于Q學(xué)習(xí)算法的兩交叉口信號燈博弈協(xié)調(diào)控制[J];系統(tǒng)仿真學(xué)報(bào);2007年18期
10 杜榮華;吳泉源;;城市區(qū)域交通協(xié)調(diào)控制中的多Agent博弈研究[J];計(jì)算機(jī)工程與科學(xué);2007年04期
相關(guān)碩士學(xué)位論文 前5條
1 倫立寶;基于強(qiáng)化學(xué)習(xí)的城市交通信號控制方法研究[D];西安電子科技大學(xué);2013年
2 韋欽平;基于Q學(xué)習(xí)的多路口交通信號協(xié)調(diào)控制研究[D];長沙理工大學(xué);2012年
3 王愷;實(shí)時(shí)反饋?zhàn)赃m應(yīng)信號控制系統(tǒng)研究[D];大連理工大學(xué);2011年
4 高麗穎;基于Agent的城市交通信號控制方法研究[D];北京工業(yè)大學(xué);2008年
5 王偉平;城市平面交叉口交通信號控制優(yōu)化方法的研究[D];山東科技大學(xué);2004年
本文編號:2639057
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2639057.html