基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究
本文關(guān)鍵詞:基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:近幾十年來(lái),隨著我國(guó)城市機(jī)動(dòng)化和城鎮(zhèn)化的加快,城市遭遇了許多交通問(wèn)題,如交通擁堵、交通安全、交通污染等。在城市地區(qū),交通擁堵是最為普遍的交通問(wèn)題,許多學(xué)者對(duì)解決城市交通擁堵問(wèn)題作出了努力并提出了多種解決方案。其中,智能交通系統(tǒng)(ITS)是一種有效的解決交通問(wèn)題的系統(tǒng)。作為智能交通系統(tǒng)的重要研究方面,中心式動(dòng)態(tài)路徑誘導(dǎo)系統(tǒng)是目前公認(rèn)的提高交通效率、緩解交通擁堵的最佳途徑。由于交通系統(tǒng)復(fù)雜多變、影響因素眾多、路網(wǎng)規(guī)模龐大,基于精密交通流數(shù)學(xué)模型的路徑誘導(dǎo)的實(shí)施困難極大,對(duì)于數(shù)學(xué)模型要求較低的智能技術(shù)是目前行之有效的方法。為此,本文利用人工智能手段中的強(qiáng)化學(xué)習(xí)策略來(lái)建立中心式動(dòng)態(tài)路徑誘導(dǎo)策略。首先,我們?cè)O(shè)計(jì)基于Sarsa學(xué)習(xí)的在線(xiàn)的動(dòng)態(tài)路徑誘導(dǎo)模式來(lái)優(yōu)化路網(wǎng)的整體使用效率。其次,從整個(gè)交通系統(tǒng)的角度出發(fā),并考慮到交通系統(tǒng)的中各個(gè)局部交通環(huán)境的區(qū)別提出了基于全局和局部聯(lián)合控制策略作為Sarsa學(xué)習(xí)的行為選擇函數(shù)。最后,為了解決大規(guī)模路網(wǎng)中Sarsa學(xué)習(xí)尋優(yōu)困難的問(wèn)題,采用基于進(jìn)化的聚類(lèi)技術(shù)劃分原始交通網(wǎng)來(lái)建立多層次網(wǎng)絡(luò),使得基于多層網(wǎng)絡(luò)的動(dòng)態(tài)路徑誘導(dǎo)算法可以很快的收斂。本文在研究路徑誘導(dǎo)算法的基礎(chǔ)上,將中心式路徑誘導(dǎo)系統(tǒng)、強(qiáng)化學(xué)習(xí)、全局和局部聯(lián)合控制策略以及多目標(biāo)遺傳算法聚類(lèi)生成多層網(wǎng)的研究特色融合在路徑誘導(dǎo)算法中,尤其是應(yīng)用了強(qiáng)化學(xué)習(xí)中的適合在動(dòng)態(tài)系統(tǒng)中在線(xiàn)學(xué)習(xí)的Sarsa學(xué)習(xí)算法。實(shí)驗(yàn)結(jié)果顯示,本文提出的基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法不但可以減少交通系統(tǒng)中車(chē)輛的平均行駛時(shí)間,還能減少系統(tǒng)中的擁堵現(xiàn)象,提高了交通系統(tǒng)的效率。并且,本文在該算法的基礎(chǔ)上,分別從強(qiáng)化學(xué)習(xí)的行為選擇函數(shù)和“狀態(tài) 行為”搜索空間的角度進(jìn)行了改進(jìn),實(shí)驗(yàn)結(jié)果顯示,這些算法進(jìn)一步的提高了交通系統(tǒng)的效率。
【關(guān)鍵詞】:路徑誘導(dǎo)系統(tǒng) 強(qiáng)化學(xué)習(xí) Sarsa學(xué)習(xí) 遺傳算法 多層網(wǎng)方法
【學(xué)位授予單位】:沈陽(yáng)理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:U495;TP18
【目錄】:
- 摘要7-8
- Abstract8-13
- 第1章 緒論13-19
- 1.1 研究的背景和意義13-14
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀14-17
- 1.3 研究的目標(biāo)和內(nèi)容17-18
- 1.4 本文組織結(jié)構(gòu)18-19
- 第2章 相關(guān)研究工作19-27
- 2.1 引言19
- 2.2 強(qiáng)化學(xué)習(xí)19-24
- 2.2.1 基于強(qiáng)化學(xué)習(xí)的智能控制方法20-21
- 2.2.2 強(qiáng)化學(xué)習(xí)的MDP模型21
- 2.2.3 強(qiáng)化學(xué)習(xí)的最優(yōu)策略21-22
- 2.2.4 行為選擇策略22-23
- 2.2.5 TD算法23
- 2.2.6 Sarsa學(xué)習(xí)算法23-24
- 2.3 中心式路徑誘導(dǎo)系統(tǒng)24-25
- 2.4 本章小結(jié)25-27
- 第3章 基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法27-35
- 3.1 引言27
- 3.2 傳統(tǒng)路徑誘導(dǎo)算法27-29
- 3.2.1 Dijkstra算法28
- 3.2.2 A*算法28-29
- 3.3 基于Sarsa學(xué)習(xí)路徑誘導(dǎo)系統(tǒng)的強(qiáng)化學(xué)習(xí)模型29-31
- 3.3.1 路徑誘導(dǎo)算法的強(qiáng)化學(xué)習(xí)模型29
- 3.3.2 Q值表29-30
- 3.3.3 基于Q值的動(dòng)態(tài)規(guī)劃算法30-31
- 3.4 基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法31-34
- 3.5 本章小結(jié)34-35
- 第4章 基于全局和局部聯(lián)合控制策略的動(dòng)態(tài)路徑誘導(dǎo)算法35-44
- 4.1 引言35-36
- 4.2 基于全局和局部聯(lián)合控制策略的波茲曼概率分布36-38
- 4.2.1 改進(jìn)的波茲曼概率分布36-37
- 4.2.2 全局控制策略37
- 4.2.3 局部控制策略37-38
- 4.3 基于全局和局部聯(lián)合控制策略的動(dòng)態(tài)路徑誘導(dǎo)算法38-40
- 4.4 全局和局部控制參數(shù)分析40-43
- 4.5 本章小結(jié)43-44
- 第5章 基于多層網(wǎng)絡(luò)的Sarsa學(xué)習(xí)路徑誘導(dǎo)算法44-56
- 5.1 引言44-45
- 5.2 多層網(wǎng)45-48
- 5.3 遺傳算法聚類(lèi)48-49
- 5.3.1 遺傳算法48-49
- 5.3.2 基于遺傳算法的聚類(lèi)分析49
- 5.4 基于遺傳算法的多層網(wǎng)方法49-51
- 5.5 基于多層網(wǎng)的路徑誘導(dǎo)算法51-55
- 5.6 本章小結(jié)55-56
- 第6章 仿真與實(shí)驗(yàn)結(jié)果分析56-69
- 6.1 SUMO仿真器56-58
- 6.1.1 SUMO仿真器介紹56-57
- 6.1.2 SUMO仿真器界面57-58
- 6.2 路徑誘導(dǎo)算法算法仿真實(shí)驗(yàn)58-68
- 6.2.1 仿真設(shè)置58-59
- 6.2.2 基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法59-64
- 6.2.3 基于全局和局部聯(lián)合控制策略的動(dòng)態(tài)路徑誘導(dǎo)算法64-67
- 6.2.4 基于多層網(wǎng)絡(luò)的Sarsa學(xué)習(xí)路徑誘導(dǎo)算法67-68
- 6.3 本章小結(jié)68-69
- 結(jié)論69-71
- 參考文獻(xiàn)71-77
- 攻讀碩士學(xué)位期間發(fā)表的論文和獲得的科研成果77-78
- 致謝78-79
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 蘇海濱;王繼東;侯朝楨;;道路網(wǎng)絡(luò)分層的快速路徑誘導(dǎo)算法[J];火力與指揮控制;2008年07期
2 陸陽(yáng);胡堅(jiān)明;張佐;王順智;高逸涵;;面向北京市路網(wǎng)特點(diǎn)的新型路徑誘導(dǎo)算法及實(shí)現(xiàn)[J];交通信息與安全;2009年02期
3 文孟飛;彭軍;劉偉榮;李沖;張曉勇;;一種增量式多目標(biāo)優(yōu)化的智能交通路徑誘導(dǎo)方法[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期
4 朱權(quán);安實(shí);謝秉磊;;雙目標(biāo)路徑誘導(dǎo)下的交通信息定價(jià)策略[J];交通運(yùn)輸工程學(xué)報(bào);2007年01期
5 金照;徐建閩;;數(shù)據(jù)融合技術(shù)在路徑誘導(dǎo)中的應(yīng)用研究[J];交通與計(jì)算機(jī);2008年04期
6 何鵬;潘君;薛倩;;基于遺傳算法的駕駛員動(dòng)態(tài)路徑誘導(dǎo)研究[J];現(xiàn)代電子技術(shù);2009年15期
7 潘海珠;杜曉昕;王波;;交通路徑誘導(dǎo)系統(tǒng)中最優(yōu)路徑選取研究與仿真[J];計(jì)算機(jī)仿真;2012年07期
8 李志純,黃海軍;多目標(biāo)路徑誘導(dǎo)下平衡市場(chǎng)滲透率的確定[J];系統(tǒng)工程理論與實(shí)踐;2004年09期
9 杜長(zhǎng)海;黃席樾;楊祖元;唐明霞;楊芳勛;;改進(jìn)的蟻群算法在動(dòng)態(tài)路徑誘導(dǎo)中的應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年27期
10 董永峰;劉艷柳;張娜;顧軍華;;基于改進(jìn)蟻群算法的動(dòng)態(tài)多路徑誘導(dǎo)系統(tǒng)研究[J];河北工業(yè)大學(xué)學(xué)報(bào);2010年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前8條
1 秦進(jìn);侯桂榮;;基于車(chē)輛的混合式路徑誘導(dǎo)系統(tǒng)分析[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年
2 秦進(jìn);史峰;侯桂榮;;基于車(chē)輛的混合式路徑誘導(dǎo)系統(tǒng)[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
3 毛永明;張東偉;;智能交通動(dòng)態(tài)路徑誘導(dǎo)算法研究[A];第十屆沈陽(yáng)科學(xué)學(xué)術(shù)年會(huì)論文集(信息科學(xué)與工程技術(shù)分冊(cè))[C];2013年
4 倪玲霖;秦進(jìn);;基于車(chē)輛的混合式路徑誘導(dǎo)系統(tǒng)框架研究[A];2011年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第一分冊(cè))[C];2011年
5 楊立才;賈磊;孔慶杰;;基于人工免疫系統(tǒng)的動(dòng)態(tài)路徑誘導(dǎo)算法研究[A];可持續(xù)發(fā)展的中國(guó)交通——2005全國(guó)博士生學(xué)術(shù)論壇(交通運(yùn)輸工程學(xué)科)論文集(下冊(cè))[C];2005年
6 梅振宇;項(xiàng)貽強(qiáng);陳峻;王煒;;非完全動(dòng)態(tài)信息下基于風(fēng)險(xiǎn)估計(jì)的路徑誘導(dǎo)方法[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年
7 王冠生;鄭江華;瓦哈甫·哈力克;李榮立;;基于Haptic技術(shù)的盲人輔助路徑誘導(dǎo)服務(wù)研制[A];地理學(xué)核心問(wèn)題與主線(xiàn)——中國(guó)地理學(xué)會(huì)2011年學(xué)術(shù)年會(huì)暨中國(guó)科學(xué)院新疆生態(tài)與地理研究所建所五十年慶典論文摘要集[C];2011年
8 王英杰;程琳;王煒;;交通網(wǎng)絡(luò)不確定性分析及路徑誘導(dǎo)信息提供[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 李卉;智能交通產(chǎn)業(yè)風(fēng)光無(wú)限[N];中國(guó)機(jī)電日?qǐng)?bào);2002年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張鍇;基于自適應(yīng)量子人工魚(yú)群算法的動(dòng)態(tài)路徑誘導(dǎo)研究[D];東北大學(xué);2014年
2 王藝凱;基于路徑誘導(dǎo)折線(xiàn)蟻群算法的路徑優(yōu)化研究[D];遼寧大學(xué);2016年
3 王星喬;基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究[D];沈陽(yáng)理工大學(xué);2016年
4 范東凱;城市動(dòng)態(tài)路徑誘導(dǎo)算法研究[D];長(zhǎng)安大學(xué);2006年
5 孫霞;基于改進(jìn)遺傳算法的城市交通路徑誘導(dǎo)系統(tǒng)的研究[D];重慶大學(xué);2007年
6 梁晶;哈爾濱市交通路徑誘導(dǎo)系統(tǒng)研究[D];哈爾濱工程大學(xué);2011年
7 趙丹;城市交通路徑誘導(dǎo)算法研究[D];長(zhǎng)安大學(xué);2009年
8 趙俊軍;基于演化博弈與人工免疫的路徑誘導(dǎo)算法研究[D];昆明理工大學(xué);2013年
9 韓星;災(zāi)變條件下公路網(wǎng)動(dòng)態(tài)路徑誘導(dǎo)決策模型與算法設(shè)計(jì)[D];北京交通大學(xué);2010年
10 郝新剛;車(chē)輛導(dǎo)航系統(tǒng)路徑誘導(dǎo)算法研究[D];山東科技大學(xué);2011年
本文關(guān)鍵詞:基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):361306
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/361306.html