天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究

發(fā)布時(shí)間:2017-05-13 02:02

  本文關(guān)鍵詞:基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:近幾十年來(lái),隨著我國(guó)城市機(jī)動(dòng)化和城鎮(zhèn)化的加快,城市遭遇了許多交通問(wèn)題,如交通擁堵、交通安全、交通污染等。在城市地區(qū),交通擁堵是最為普遍的交通問(wèn)題,許多學(xué)者對(duì)解決城市交通擁堵問(wèn)題作出了努力并提出了多種解決方案。其中,智能交通系統(tǒng)(ITS)是一種有效的解決交通問(wèn)題的系統(tǒng)。作為智能交通系統(tǒng)的重要研究方面,中心式動(dòng)態(tài)路徑誘導(dǎo)系統(tǒng)是目前公認(rèn)的提高交通效率、緩解交通擁堵的最佳途徑。由于交通系統(tǒng)復(fù)雜多變、影響因素眾多、路網(wǎng)規(guī)模龐大,基于精密交通流數(shù)學(xué)模型的路徑誘導(dǎo)的實(shí)施困難極大,對(duì)于數(shù)學(xué)模型要求較低的智能技術(shù)是目前行之有效的方法。為此,本文利用人工智能手段中的強(qiáng)化學(xué)習(xí)策略來(lái)建立中心式動(dòng)態(tài)路徑誘導(dǎo)策略。首先,我們?cè)O(shè)計(jì)基于Sarsa學(xué)習(xí)的在線(xiàn)的動(dòng)態(tài)路徑誘導(dǎo)模式來(lái)優(yōu)化路網(wǎng)的整體使用效率。其次,從整個(gè)交通系統(tǒng)的角度出發(fā),并考慮到交通系統(tǒng)的中各個(gè)局部交通環(huán)境的區(qū)別提出了基于全局和局部聯(lián)合控制策略作為Sarsa學(xué)習(xí)的行為選擇函數(shù)。最后,為了解決大規(guī)模路網(wǎng)中Sarsa學(xué)習(xí)尋優(yōu)困難的問(wèn)題,采用基于進(jìn)化的聚類(lèi)技術(shù)劃分原始交通網(wǎng)來(lái)建立多層次網(wǎng)絡(luò),使得基于多層網(wǎng)絡(luò)的動(dòng)態(tài)路徑誘導(dǎo)算法可以很快的收斂。本文在研究路徑誘導(dǎo)算法的基礎(chǔ)上,將中心式路徑誘導(dǎo)系統(tǒng)、強(qiáng)化學(xué)習(xí)、全局和局部聯(lián)合控制策略以及多目標(biāo)遺傳算法聚類(lèi)生成多層網(wǎng)的研究特色融合在路徑誘導(dǎo)算法中,尤其是應(yīng)用了強(qiáng)化學(xué)習(xí)中的適合在動(dòng)態(tài)系統(tǒng)中在線(xiàn)學(xué)習(xí)的Sarsa學(xué)習(xí)算法。實(shí)驗(yàn)結(jié)果顯示,本文提出的基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法不但可以減少交通系統(tǒng)中車(chē)輛的平均行駛時(shí)間,還能減少系統(tǒng)中的擁堵現(xiàn)象,提高了交通系統(tǒng)的效率。并且,本文在該算法的基礎(chǔ)上,分別從強(qiáng)化學(xué)習(xí)的行為選擇函數(shù)和“狀態(tài) 行為”搜索空間的角度進(jìn)行了改進(jìn),實(shí)驗(yàn)結(jié)果顯示,這些算法進(jìn)一步的提高了交通系統(tǒng)的效率。
【關(guān)鍵詞】:路徑誘導(dǎo)系統(tǒng) 強(qiáng)化學(xué)習(xí) Sarsa學(xué)習(xí) 遺傳算法 多層網(wǎng)方法
【學(xué)位授予單位】:沈陽(yáng)理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:U495;TP18
【目錄】:
  • 摘要7-8
  • Abstract8-13
  • 第1章 緒論13-19
  • 1.1 研究的背景和意義13-14
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀14-17
  • 1.3 研究的目標(biāo)和內(nèi)容17-18
  • 1.4 本文組織結(jié)構(gòu)18-19
  • 第2章 相關(guān)研究工作19-27
  • 2.1 引言19
  • 2.2 強(qiáng)化學(xué)習(xí)19-24
  • 2.2.1 基于強(qiáng)化學(xué)習(xí)的智能控制方法20-21
  • 2.2.2 強(qiáng)化學(xué)習(xí)的MDP模型21
  • 2.2.3 強(qiáng)化學(xué)習(xí)的最優(yōu)策略21-22
  • 2.2.4 行為選擇策略22-23
  • 2.2.5 TD算法23
  • 2.2.6 Sarsa學(xué)習(xí)算法23-24
  • 2.3 中心式路徑誘導(dǎo)系統(tǒng)24-25
  • 2.4 本章小結(jié)25-27
  • 第3章 基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法27-35
  • 3.1 引言27
  • 3.2 傳統(tǒng)路徑誘導(dǎo)算法27-29
  • 3.2.1 Dijkstra算法28
  • 3.2.2 A*算法28-29
  • 3.3 基于Sarsa學(xué)習(xí)路徑誘導(dǎo)系統(tǒng)的強(qiáng)化學(xué)習(xí)模型29-31
  • 3.3.1 路徑誘導(dǎo)算法的強(qiáng)化學(xué)習(xí)模型29
  • 3.3.2 Q值表29-30
  • 3.3.3 基于Q值的動(dòng)態(tài)規(guī)劃算法30-31
  • 3.4 基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法31-34
  • 3.5 本章小結(jié)34-35
  • 第4章 基于全局和局部聯(lián)合控制策略的動(dòng)態(tài)路徑誘導(dǎo)算法35-44
  • 4.1 引言35-36
  • 4.2 基于全局和局部聯(lián)合控制策略的波茲曼概率分布36-38
  • 4.2.1 改進(jìn)的波茲曼概率分布36-37
  • 4.2.2 全局控制策略37
  • 4.2.3 局部控制策略37-38
  • 4.3 基于全局和局部聯(lián)合控制策略的動(dòng)態(tài)路徑誘導(dǎo)算法38-40
  • 4.4 全局和局部控制參數(shù)分析40-43
  • 4.5 本章小結(jié)43-44
  • 第5章 基于多層網(wǎng)絡(luò)的Sarsa學(xué)習(xí)路徑誘導(dǎo)算法44-56
  • 5.1 引言44-45
  • 5.2 多層網(wǎng)45-48
  • 5.3 遺傳算法聚類(lèi)48-49
  • 5.3.1 遺傳算法48-49
  • 5.3.2 基于遺傳算法的聚類(lèi)分析49
  • 5.4 基于遺傳算法的多層網(wǎng)方法49-51
  • 5.5 基于多層網(wǎng)的路徑誘導(dǎo)算法51-55
  • 5.6 本章小結(jié)55-56
  • 第6章 仿真與實(shí)驗(yàn)結(jié)果分析56-69
  • 6.1 SUMO仿真器56-58
  • 6.1.1 SUMO仿真器介紹56-57
  • 6.1.2 SUMO仿真器界面57-58
  • 6.2 路徑誘導(dǎo)算法算法仿真實(shí)驗(yàn)58-68
  • 6.2.1 仿真設(shè)置58-59
  • 6.2.2 基于Sarsa學(xué)習(xí)的路徑誘導(dǎo)算法59-64
  • 6.2.3 基于全局和局部聯(lián)合控制策略的動(dòng)態(tài)路徑誘導(dǎo)算法64-67
  • 6.2.4 基于多層網(wǎng)絡(luò)的Sarsa學(xué)習(xí)路徑誘導(dǎo)算法67-68
  • 6.3 本章小結(jié)68-69
  • 結(jié)論69-71
  • 參考文獻(xiàn)71-77
  • 攻讀碩士學(xué)位期間發(fā)表的論文和獲得的科研成果77-78
  • 致謝78-79

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 蘇海濱;王繼東;侯朝楨;;道路網(wǎng)絡(luò)分層的快速路徑誘導(dǎo)算法[J];火力與指揮控制;2008年07期

2 陸陽(yáng);胡堅(jiān)明;張佐;王順智;高逸涵;;面向北京市路網(wǎng)特點(diǎn)的新型路徑誘導(dǎo)算法及實(shí)現(xiàn)[J];交通信息與安全;2009年02期

3 文孟飛;彭軍;劉偉榮;李沖;張曉勇;;一種增量式多目標(biāo)優(yōu)化的智能交通路徑誘導(dǎo)方法[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期

4 朱權(quán);安實(shí);謝秉磊;;雙目標(biāo)路徑誘導(dǎo)下的交通信息定價(jià)策略[J];交通運(yùn)輸工程學(xué)報(bào);2007年01期

5 金照;徐建閩;;數(shù)據(jù)融合技術(shù)在路徑誘導(dǎo)中的應(yīng)用研究[J];交通與計(jì)算機(jī);2008年04期

6 何鵬;潘君;薛倩;;基于遺傳算法的駕駛員動(dòng)態(tài)路徑誘導(dǎo)研究[J];現(xiàn)代電子技術(shù);2009年15期

7 潘海珠;杜曉昕;王波;;交通路徑誘導(dǎo)系統(tǒng)中最優(yōu)路徑選取研究與仿真[J];計(jì)算機(jī)仿真;2012年07期

8 李志純,黃海軍;多目標(biāo)路徑誘導(dǎo)下平衡市場(chǎng)滲透率的確定[J];系統(tǒng)工程理論與實(shí)踐;2004年09期

9 杜長(zhǎng)海;黃席樾;楊祖元;唐明霞;楊芳勛;;改進(jìn)的蟻群算法在動(dòng)態(tài)路徑誘導(dǎo)中的應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年27期

10 董永峰;劉艷柳;張娜;顧軍華;;基于改進(jìn)蟻群算法的動(dòng)態(tài)多路徑誘導(dǎo)系統(tǒng)研究[J];河北工業(yè)大學(xué)學(xué)報(bào);2010年03期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前8條

1 秦進(jìn);侯桂榮;;基于車(chē)輛的混合式路徑誘導(dǎo)系統(tǒng)分析[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年

2 秦進(jìn);史峰;侯桂榮;;基于車(chē)輛的混合式路徑誘導(dǎo)系統(tǒng)[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年

3 毛永明;張東偉;;智能交通動(dòng)態(tài)路徑誘導(dǎo)算法研究[A];第十屆沈陽(yáng)科學(xué)學(xué)術(shù)年會(huì)論文集(信息科學(xué)與工程技術(shù)分冊(cè))[C];2013年

4 倪玲霖;秦進(jìn);;基于車(chē)輛的混合式路徑誘導(dǎo)系統(tǒng)框架研究[A];2011年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第一分冊(cè))[C];2011年

5 楊立才;賈磊;孔慶杰;;基于人工免疫系統(tǒng)的動(dòng)態(tài)路徑誘導(dǎo)算法研究[A];可持續(xù)發(fā)展的中國(guó)交通——2005全國(guó)博士生學(xué)術(shù)論壇(交通運(yùn)輸工程學(xué)科)論文集(下冊(cè))[C];2005年

6 梅振宇;項(xiàng)貽強(qiáng);陳峻;王煒;;非完全動(dòng)態(tài)信息下基于風(fēng)險(xiǎn)估計(jì)的路徑誘導(dǎo)方法[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年

7 王冠生;鄭江華;瓦哈甫·哈力克;李榮立;;基于Haptic技術(shù)的盲人輔助路徑誘導(dǎo)服務(wù)研制[A];地理學(xué)核心問(wèn)題與主線(xiàn)——中國(guó)地理學(xué)會(huì)2011年學(xué)術(shù)年會(huì)暨中國(guó)科學(xué)院新疆生態(tài)與地理研究所建所五十年慶典論文摘要集[C];2011年

8 王英杰;程琳;王煒;;交通網(wǎng)絡(luò)不確定性分析及路徑誘導(dǎo)信息提供[A];2007第三屆中國(guó)智能交通年會(huì)論文集[C];2007年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條

1 李卉;智能交通產(chǎn)業(yè)風(fēng)光無(wú)限[N];中國(guó)機(jī)電日?qǐng)?bào);2002年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 張鍇;基于自適應(yīng)量子人工魚(yú)群算法的動(dòng)態(tài)路徑誘導(dǎo)研究[D];東北大學(xué);2014年

2 王藝凱;基于路徑誘導(dǎo)折線(xiàn)蟻群算法的路徑優(yōu)化研究[D];遼寧大學(xué);2016年

3 王星喬;基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究[D];沈陽(yáng)理工大學(xué);2016年

4 范東凱;城市動(dòng)態(tài)路徑誘導(dǎo)算法研究[D];長(zhǎng)安大學(xué);2006年

5 孫霞;基于改進(jìn)遺傳算法的城市交通路徑誘導(dǎo)系統(tǒng)的研究[D];重慶大學(xué);2007年

6 梁晶;哈爾濱市交通路徑誘導(dǎo)系統(tǒng)研究[D];哈爾濱工程大學(xué);2011年

7 趙丹;城市交通路徑誘導(dǎo)算法研究[D];長(zhǎng)安大學(xué);2009年

8 趙俊軍;基于演化博弈與人工免疫的路徑誘導(dǎo)算法研究[D];昆明理工大學(xué);2013年

9 韓星;災(zāi)變條件下公路網(wǎng)動(dòng)態(tài)路徑誘導(dǎo)決策模型與算法設(shè)計(jì)[D];北京交通大學(xué);2010年

10 郝新剛;車(chē)輛導(dǎo)航系統(tǒng)路徑誘導(dǎo)算法研究[D];山東科技大學(xué);2011年


  本文關(guān)鍵詞:基于Sarsa學(xué)習(xí)算法的路徑誘導(dǎo)算法研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):361306

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/361306.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)3094a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com