MDP下基于特征表示強化學習的自適應交通信號控制
[Abstract]:Applying the traditional reinforcement learning algorithm to the adaptive traffic signal control of intersections, there exists the problem of dimension disaster, that is, the state and the size of the action space increase exponentially with the increase of the intersection. Therefore, the intersection adaptive traffic signal control problem is regarded as the (MDP) problem of Markov decision process, and the computational complexity is reduced by using the eigen-based state representation and the idea of linear average function estimation. The convergence is guaranteed. In the environment of multi-intersection traffic, the simulation results show that the proposed algorithm is superior to the timing control and the traditional reinforcement learning algorithm under different traffic demand levels and the arrival distribution of vehicle flow, and the parameters 胃 and the number of learning steps are convergent.
【作者單位】: 廣州航海學院;
【基金】:國家自然科學基金項目(61263024,51268017) 廣州市哲學社會科學發(fā)展“十二五”規(guī)劃課題項目(13G28)
【分類號】:U491.54
【相似文獻】
相關(guān)期刊論文 前10條
1 承向軍;常歆識;楊肇夏;;基于Q-學習的交通信號控制方法[J];系統(tǒng)工程理論與實踐;2006年08期
2 王學慧;;交通信號控制虛擬實驗平臺設計[J];信息技術(shù);2006年10期
3 梁子君;張代勝;;交通信號控制輔助教學系統(tǒng)[J];計算機時代;2008年01期
4 王令群;陸小芳;鄭應平;;一種智能交通信號控制模型[J];實驗室研究與探索;2010年01期
5 胡治剛;;常熟道路交通信號控制的現(xiàn)狀及未來發(fā)展方向[J];山西建筑;2012年24期
6 王安生;程守謙;;單片機在交通信號控制中的應用[J];交通與計算機;1993年01期
7 姬建崗;;基于蟻群算法的交通信號控制[J];公路交通科技(應用技術(shù)版);2014年02期
8 王長君;袁建華;邱紅桐;苑雷;;交通信號控制技術(shù)及標準需求[J];中國交通信息產(chǎn)業(yè);2004年11期
9 承向軍,楊肇夏;一種分布式交通信號控制方法及仿真實現(xiàn)[J];系統(tǒng)仿真學報;2005年08期
10 姚新勝;羅霞;杜進有;;基于多目標滿意優(yōu)化的交通信號控制[J];計算機工程與應用;2006年35期
相關(guān)會議論文 前3條
1 劉淑華;程宇;李高權(quán);尹祿;;基于時序圖規(guī)劃的交通信號控制方法[A];2011年中國智能自動化學術(shù)會議論文集(第一分冊)[C];2011年
2 鄭潔;陸化普;李志恒;;模糊控制在交通信號控制中的應用研究與探討[A];第一屆中國智能交通年會論文集[C];2005年
3 孫洪運;陳東靜;肖琳;李林波;吳兵;;干線局部擁擠條件下紅波帶信控策略設計與實施研究[A];第七屆中國智能交通年會優(yōu)秀論文集——智能交通技術(shù)[C];2012年
相關(guān)重要報紙文章 前5條
1 胡啟涌;鳳岡縣規(guī)范縣城區(qū)交通秩序[N];貴州政協(xié)報;2008年
2 趙明林邋實習生 毛小蕾;軌道交通信號控制將造“中國心”[N];中國交通報;2008年
3 記者 謝莉葳;智能交通標準先行[N];中國消費者報;2010年
4 張佳麗;紅綠燈能否更加人性化[N];中國建設報;2006年
5 肖遙;“潮汐式”擁堵將有所緩解[N];江陰日報;2011年
相關(guān)博士學位論文 前6條
1 夏新海;面向城市自適應交通信號控制的強化學習方法研究[D];華南理工大學;2013年
2 周申培;考慮排放因素的城市交叉口交通信號控制策略的研究[D];武漢理工大學;2009年
3 牟海波;城市交通信號控制及其應用研究[D];蘭州交通大學;2012年
4 管青;區(qū)域交通信號控制與交通誘導協(xié)同理論與關(guān)鍵技術(shù)研究[D];吉林大學;2009年
5 盧守峰;基于元胞自動機的交通信號控制與路徑誘導的協(xié)同研究[D];吉林大學;2006年
6 楊祖元;城市交通信號系統(tǒng)智能控制策略研究[D];重慶大學;2008年
相關(guān)碩士學位論文 前10條
1 唐建華;強化學習及其在城市交通信號控制中的應用研究[D];西安電子科技大學;2012年
2 李瑾;交通信號控制戰(zhàn)略方案選擇研究[D];天津大學;2008年
3 魏勇;城市區(qū)域交通信號控制及交通狀態(tài)分析研究[D];浙江大學;2013年
4 朱理;克隆選擇算法在城市道路交通信號控制中的應用研究[D];湘潭大學;2010年
5 劉喜敏;面向智能化與集成化的交通信號控制研究[D];吉林大學;2006年
6 顧九春;城市交通信號控制系統(tǒng)數(shù)據(jù)交換標準研究[D];北京工業(yè)大學;2005年
7 申亮;交通信號控制自適應模型及相位同步方法研究[D];大連理工大學;2013年
8 倫立寶;基于強化學習的城市交通信號控制方法研究[D];西安電子科技大學;2013年
9 關(guān)金金;基于駕駛員個性氣質(zhì)特征的交通信號控制仿真分析[D];安徽農(nóng)業(yè)大學;2011年
10 程婉燕;基于多智能體的城市交通信號控制的協(xié)調(diào)與優(yōu)化[D];福建農(nóng)林大學;2009年
,本文編號:2334093
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2334093.html