MDP下基于特征表示強(qiáng)化學(xué)習(xí)的自適應(yīng)交通信號(hào)控制
[Abstract]:Applying the traditional reinforcement learning algorithm to the adaptive traffic signal control of intersections, there exists the problem of dimension disaster, that is, the state and the size of the action space increase exponentially with the increase of the intersection. Therefore, the intersection adaptive traffic signal control problem is regarded as the (MDP) problem of Markov decision process, and the computational complexity is reduced by using the eigen-based state representation and the idea of linear average function estimation. The convergence is guaranteed. In the environment of multi-intersection traffic, the simulation results show that the proposed algorithm is superior to the timing control and the traditional reinforcement learning algorithm under different traffic demand levels and the arrival distribution of vehicle flow, and the parameters 胃 and the number of learning steps are convergent.
【作者單位】: 廣州航海學(xué)院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61263024,51268017) 廣州市哲學(xué)社會(huì)科學(xué)發(fā)展“十二五”規(guī)劃課題項(xiàng)目(13G28)
【分類(lèi)號(hào)】:U491.54
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 承向軍;常歆識(shí);楊肇夏;;基于Q-學(xué)習(xí)的交通信號(hào)控制方法[J];系統(tǒng)工程理論與實(shí)踐;2006年08期
2 王學(xué)慧;;交通信號(hào)控制虛擬實(shí)驗(yàn)平臺(tái)設(shè)計(jì)[J];信息技術(shù);2006年10期
3 梁子君;張代勝;;交通信號(hào)控制輔助教學(xué)系統(tǒng)[J];計(jì)算機(jī)時(shí)代;2008年01期
4 王令群;陸小芳;鄭應(yīng)平;;一種智能交通信號(hào)控制模型[J];實(shí)驗(yàn)室研究與探索;2010年01期
5 胡治剛;;常熟道路交通信號(hào)控制的現(xiàn)狀及未來(lái)發(fā)展方向[J];山西建筑;2012年24期
6 王安生;程守謙;;單片機(jī)在交通信號(hào)控制中的應(yīng)用[J];交通與計(jì)算機(jī);1993年01期
7 姬建崗;;基于蟻群算法的交通信號(hào)控制[J];公路交通科技(應(yīng)用技術(shù)版);2014年02期
8 王長(zhǎng)君;袁建華;邱紅桐;苑雷;;交通信號(hào)控制技術(shù)及標(biāo)準(zhǔn)需求[J];中國(guó)交通信息產(chǎn)業(yè);2004年11期
9 承向軍,楊肇夏;一種分布式交通信號(hào)控制方法及仿真實(shí)現(xiàn)[J];系統(tǒng)仿真學(xué)報(bào);2005年08期
10 姚新勝;羅霞;杜進(jìn)有;;基于多目標(biāo)滿意優(yōu)化的交通信號(hào)控制[J];計(jì)算機(jī)工程與應(yīng)用;2006年35期
相關(guān)會(huì)議論文 前3條
1 劉淑華;程宇;李高權(quán);尹祿;;基于時(shí)序圖規(guī)劃的交通信號(hào)控制方法[A];2011年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第一分冊(cè))[C];2011年
2 鄭潔;陸化普;李志恒;;模糊控制在交通信號(hào)控制中的應(yīng)用研究與探討[A];第一屆中國(guó)智能交通年會(huì)論文集[C];2005年
3 孫洪運(yùn);陳東靜;肖琳;李林波;吳兵;;干線局部擁擠條件下紅波帶信控策略設(shè)計(jì)與實(shí)施研究[A];第七屆中國(guó)智能交通年會(huì)優(yōu)秀論文集——智能交通技術(shù)[C];2012年
相關(guān)重要報(bào)紙文章 前5條
1 胡啟涌;鳳岡縣規(guī)范縣城區(qū)交通秩序[N];貴州政協(xié)報(bào);2008年
2 趙明林邋實(shí)習(xí)生 毛小蕾;軌道交通信號(hào)控制將造“中國(guó)心”[N];中國(guó)交通報(bào);2008年
3 記者 謝莉葳;智能交通標(biāo)準(zhǔn)先行[N];中國(guó)消費(fèi)者報(bào);2010年
4 張佳麗;紅綠燈能否更加人性化[N];中國(guó)建設(shè)報(bào);2006年
5 肖遙;“潮汐式”擁堵將有所緩解[N];江陰日?qǐng)?bào);2011年
相關(guān)博士學(xué)位論文 前6條
1 夏新海;面向城市自適應(yīng)交通信號(hào)控制的強(qiáng)化學(xué)習(xí)方法研究[D];華南理工大學(xué);2013年
2 周申培;考慮排放因素的城市交叉口交通信號(hào)控制策略的研究[D];武漢理工大學(xué);2009年
3 牟海波;城市交通信號(hào)控制及其應(yīng)用研究[D];蘭州交通大學(xué);2012年
4 管青;區(qū)域交通信號(hào)控制與交通誘導(dǎo)協(xié)同理論與關(guān)鍵技術(shù)研究[D];吉林大學(xué);2009年
5 盧守峰;基于元胞自動(dòng)機(jī)的交通信號(hào)控制與路徑誘導(dǎo)的協(xié)同研究[D];吉林大學(xué);2006年
6 楊祖元;城市交通信號(hào)系統(tǒng)智能控制策略研究[D];重慶大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 唐建華;強(qiáng)化學(xué)習(xí)及其在城市交通信號(hào)控制中的應(yīng)用研究[D];西安電子科技大學(xué);2012年
2 李瑾;交通信號(hào)控制戰(zhàn)略方案選擇研究[D];天津大學(xué);2008年
3 魏勇;城市區(qū)域交通信號(hào)控制及交通狀態(tài)分析研究[D];浙江大學(xué);2013年
4 朱理;克隆選擇算法在城市道路交通信號(hào)控制中的應(yīng)用研究[D];湘潭大學(xué);2010年
5 劉喜敏;面向智能化與集成化的交通信號(hào)控制研究[D];吉林大學(xué);2006年
6 顧九春;城市交通信號(hào)控制系統(tǒng)數(shù)據(jù)交換標(biāo)準(zhǔn)研究[D];北京工業(yè)大學(xué);2005年
7 申亮;交通信號(hào)控制自適應(yīng)模型及相位同步方法研究[D];大連理工大學(xué);2013年
8 倫立寶;基于強(qiáng)化學(xué)習(xí)的城市交通信號(hào)控制方法研究[D];西安電子科技大學(xué);2013年
9 關(guān)金金;基于駕駛員個(gè)性氣質(zhì)特征的交通信號(hào)控制仿真分析[D];安徽農(nóng)業(yè)大學(xué);2011年
10 程婉燕;基于多智能體的城市交通信號(hào)控制的協(xié)調(diào)與優(yōu)化[D];福建農(nóng)林大學(xué);2009年
,本文編號(hào):2334093
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2334093.html