基于強(qiáng)化學(xué)習(xí)的軌道交通ATO控制算法研究
發(fā)布時間:2021-08-14 19:16
列車自動駕駛系統(tǒng)(ATO)是列車運行控制的關(guān)鍵系統(tǒng),在不同運行環(huán)境下,可以實時控制列車牽引力和制動力的輸出,使列車按照目標(biāo)曲線平穩(wěn)、安全運行。論文針對列車系統(tǒng)的非線性、多變量等復(fù)雜特性,綜合考慮列車運行環(huán)境、列車控制特征,基于強(qiáng)化學(xué)習(xí)的無參學(xué)習(xí)、動態(tài)優(yōu)化、端到端學(xué)習(xí)、自適應(yīng)性等特點,提出了一種提升模糊控制方法泛化能力的列車自動駕駛控制系統(tǒng)算法。通過深度強(qiáng)化學(xué)習(xí),系統(tǒng)自動對已有的列車模型、需求的目標(biāo)速度曲線以及需求的控制策略,生成一套模糊控制方案,取代了傳統(tǒng)專家經(jīng)驗的設(shè)計,并且提升了模糊控制的普適性。論文的主要研究內(nèi)容包括以下幾點:1、對列車自動駕駛系統(tǒng)的功能、基本結(jié)構(gòu)、傳統(tǒng)控制算法進(jìn)行相關(guān)的研究,對列車控制問題進(jìn)行了問題抽象,并建立了列車運行過程的簡化模型。2、研究了強(qiáng)化學(xué)習(xí)在控制算法中的相關(guān)應(yīng)用、DQN算法的原理及結(jié)構(gòu),并完成了基于強(qiáng)化學(xué)習(xí)的列車自動運行控制算法的設(shè)計,包括了列車模擬環(huán)境仿真、目標(biāo)曲線設(shè)計、列車輸入狀態(tài)圖像化設(shè)計、卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計、狀態(tài)輸出控制、獎勵策略設(shè)計、動作策略設(shè)計、DQN訓(xùn)練參數(shù)設(shè)計等。針對傳統(tǒng)列車ATO控制算法的不足以及對杭州地鐵4號線運行過程數(shù)據(jù)的統(tǒng)計...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
人了C系統(tǒng)構(gòu)成圈
1.3?ATO系統(tǒng)控制算法的國內(nèi)外研究現(xiàn)狀??隨著城市軌道交通的廣泛應(yīng)用,ATO控制算法的研究也越來越多,從20世紀(jì)60年??代開始,歐美及日本等一些發(fā)達(dá)國家就已經(jīng)開始在列車的自動運行技術(shù)上進(jìn)行了大量的??試驗與研究工作,一些著名的公司如Siemens、Westing?House、Hitachi等均推出了列車??速度控制系統(tǒng)。20世紀(jì)80年代,德國、日本、澳大利亞、前蘇聯(lián)等國家針對列車自動??運行系統(tǒng)的研究也都開展了很多探索[15-16]。國內(nèi)的ATO系統(tǒng)控制算法研究起步較晚,??早期的列車自動駕駛系統(tǒng)很大部分是從國外引入的。20世紀(jì)90年代,北京地鐵1號線??部分列車自動駕駛使用了西屋公司的設(shè)備,廣州地鐵1號線和北京地鐵10號線的部分??列車自動駕駛系統(tǒng)使用了西門子公司的設(shè)備[17]。從列車自動駕駛的現(xiàn)狀看,雖然國內(nèi)自??動駕駛技術(shù)研究較晚,但中國軌道交通自動控制技術(shù)已經(jīng)走在全球前列。2016年12月??19日,中國第一條正式運營的GOA4?(GradesofAutomation4)等級的全自動無人駕駛??
aureuman-eveconrorougeep[67],文中提出了改進(jìn)版的DQN算法。2017年10月,Goog能圍棋團(tuán)隊在《Nature》上發(fā)表了題為“Mastering?the?Gamege”的文章AlphaGo最強(qiáng)最新的版本AlphaGo?Zero天訓(xùn)練后就以100比0擊敗了上一版本的AlphaGo,?21天ster?水平。??的原理與結(jié)構(gòu)??強(qiáng)化學(xué)習(xí)為:通過試錯學(xué)習(xí)最佳地匹配狀態(tài)(States)和動回報(Rewards),當(dāng)智能體Agent的某個行為策略ActionReward,智能體產(chǎn)生該行為策略的趦勢會加強(qiáng)[691。在給定“強(qiáng)化”而受到懲罰的行為會被“弱化”。這樣一種生物智能嘗試獲得的獎勵或懲罰學(xué)會在該情境下選擇訓(xùn)練者最期望化學(xué)習(xí)模型圖。??????????
【參考文獻(xiàn)】:
期刊論文
[1]基于PID算法ATO系統(tǒng)的仿真研究[J]. 王先明,陳榮武,蔡哲揚. 鐵路計算機(jī)應(yīng)用. 2015(04)
[2]大數(shù)據(jù)下的基于深度神經(jīng)網(wǎng)的相似漢字識別[J]. 楊釗,陶大鵬,張樹業(yè),金連文. 通信學(xué)報. 2014(09)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅強(qiáng),潘登,胡憚. 計算機(jī)研究與發(fā)展. 2014(09)
[4]列車ATO精確停車問題的研究[J]. 蔣圣超,張新,胡文宇. 電子世界. 2013(23)
[5]中國大陸城市軌道交通的現(xiàn)狀與展望[J]. 顧岷. 現(xiàn)代城市軌道交通. 2011(06)
[6]城市軌道交通ATO系統(tǒng)性能指標(biāo)評價[J]. 張強(qiáng),陳德旺,于振宇. 都市快軌交通. 2011(04)
[7]完善城市軌道交通國產(chǎn)化政策體系的思考[J]. 任紅波. 上海建設(shè)科技. 2011(03)
[8]模糊預(yù)測-PID復(fù)合控制在高速列車制動中的應(yīng)用[J]. 師黎,王江濤. 計算機(jī)工程與應(yīng)用. 2010(31)
[9]列車自動控制系統(tǒng)的分析與研究[J]. 柴貴蘭. 科技信息. 2010(17)
[10]淺談列車自動控制系統(tǒng)ATC[J]. 瞿莉麗. 科技信息(學(xué)術(shù)研究). 2008(36)
碩士論文
[1]列車在線辨識與預(yù)測控制研究[D]. 袁佳希.浙江大學(xué) 2017
[2]基于模糊-PID的ATO系統(tǒng)速度控制算法的研究[D]. 陳優(yōu).湘潭大學(xué) 2015
[3]高速動車組多模型建模與預(yù)測控制方法[D]. 張坤鵬.華東交通大學(xué) 2012
[4]基于模糊神經(jīng)網(wǎng)絡(luò)的ATO系統(tǒng)開發(fā)[D]. 許展瑛.西南交通大學(xué) 2010
[5]基于智能控制算法的列車自動駕駛系統(tǒng)的優(yōu)化研究[D]. 姚理.北京交通大學(xué) 2009
[6]模糊預(yù)測控制及其在列車自動駕駛中的應(yīng)用[D]. 周家猷.北京交通大學(xué) 2008
[7]城市軌道交通ATO測試系統(tǒng)設(shè)計與實現(xiàn)[D]. 梁曉鈺.北京交通大學(xué) 2008
[8]城市軌道交通自動駕駛(ATO)測試系統(tǒng)中信號模擬的研究[D]. 支柱.北京交通大學(xué) 2008
[9]基于模糊預(yù)測控制的列車自動駕駛系統(tǒng)研究[D]. 康太平.西南交通大學(xué) 2006
本文編號:3343031
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:89 頁
【學(xué)位級別】:碩士
【部分圖文】:
人了C系統(tǒng)構(gòu)成圈
1.3?ATO系統(tǒng)控制算法的國內(nèi)外研究現(xiàn)狀??隨著城市軌道交通的廣泛應(yīng)用,ATO控制算法的研究也越來越多,從20世紀(jì)60年??代開始,歐美及日本等一些發(fā)達(dá)國家就已經(jīng)開始在列車的自動運行技術(shù)上進(jìn)行了大量的??試驗與研究工作,一些著名的公司如Siemens、Westing?House、Hitachi等均推出了列車??速度控制系統(tǒng)。20世紀(jì)80年代,德國、日本、澳大利亞、前蘇聯(lián)等國家針對列車自動??運行系統(tǒng)的研究也都開展了很多探索[15-16]。國內(nèi)的ATO系統(tǒng)控制算法研究起步較晚,??早期的列車自動駕駛系統(tǒng)很大部分是從國外引入的。20世紀(jì)90年代,北京地鐵1號線??部分列車自動駕駛使用了西屋公司的設(shè)備,廣州地鐵1號線和北京地鐵10號線的部分??列車自動駕駛系統(tǒng)使用了西門子公司的設(shè)備[17]。從列車自動駕駛的現(xiàn)狀看,雖然國內(nèi)自??動駕駛技術(shù)研究較晚,但中國軌道交通自動控制技術(shù)已經(jīng)走在全球前列。2016年12月??19日,中國第一條正式運營的GOA4?(GradesofAutomation4)等級的全自動無人駕駛??
aureuman-eveconrorougeep[67],文中提出了改進(jìn)版的DQN算法。2017年10月,Goog能圍棋團(tuán)隊在《Nature》上發(fā)表了題為“Mastering?the?Gamege”的文章AlphaGo最強(qiáng)最新的版本AlphaGo?Zero天訓(xùn)練后就以100比0擊敗了上一版本的AlphaGo,?21天ster?水平。??的原理與結(jié)構(gòu)??強(qiáng)化學(xué)習(xí)為:通過試錯學(xué)習(xí)最佳地匹配狀態(tài)(States)和動回報(Rewards),當(dāng)智能體Agent的某個行為策略ActionReward,智能體產(chǎn)生該行為策略的趦勢會加強(qiáng)[691。在給定“強(qiáng)化”而受到懲罰的行為會被“弱化”。這樣一種生物智能嘗試獲得的獎勵或懲罰學(xué)會在該情境下選擇訓(xùn)練者最期望化學(xué)習(xí)模型圖。??????????
【參考文獻(xiàn)】:
期刊論文
[1]基于PID算法ATO系統(tǒng)的仿真研究[J]. 王先明,陳榮武,蔡哲揚. 鐵路計算機(jī)應(yīng)用. 2015(04)
[2]大數(shù)據(jù)下的基于深度神經(jīng)網(wǎng)的相似漢字識別[J]. 楊釗,陶大鵬,張樹業(yè),金連文. 通信學(xué)報. 2014(09)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅強(qiáng),潘登,胡憚. 計算機(jī)研究與發(fā)展. 2014(09)
[4]列車ATO精確停車問題的研究[J]. 蔣圣超,張新,胡文宇. 電子世界. 2013(23)
[5]中國大陸城市軌道交通的現(xiàn)狀與展望[J]. 顧岷. 現(xiàn)代城市軌道交通. 2011(06)
[6]城市軌道交通ATO系統(tǒng)性能指標(biāo)評價[J]. 張強(qiáng),陳德旺,于振宇. 都市快軌交通. 2011(04)
[7]完善城市軌道交通國產(chǎn)化政策體系的思考[J]. 任紅波. 上海建設(shè)科技. 2011(03)
[8]模糊預(yù)測-PID復(fù)合控制在高速列車制動中的應(yīng)用[J]. 師黎,王江濤. 計算機(jī)工程與應(yīng)用. 2010(31)
[9]列車自動控制系統(tǒng)的分析與研究[J]. 柴貴蘭. 科技信息. 2010(17)
[10]淺談列車自動控制系統(tǒng)ATC[J]. 瞿莉麗. 科技信息(學(xué)術(shù)研究). 2008(36)
碩士論文
[1]列車在線辨識與預(yù)測控制研究[D]. 袁佳希.浙江大學(xué) 2017
[2]基于模糊-PID的ATO系統(tǒng)速度控制算法的研究[D]. 陳優(yōu).湘潭大學(xué) 2015
[3]高速動車組多模型建模與預(yù)測控制方法[D]. 張坤鵬.華東交通大學(xué) 2012
[4]基于模糊神經(jīng)網(wǎng)絡(luò)的ATO系統(tǒng)開發(fā)[D]. 許展瑛.西南交通大學(xué) 2010
[5]基于智能控制算法的列車自動駕駛系統(tǒng)的優(yōu)化研究[D]. 姚理.北京交通大學(xué) 2009
[6]模糊預(yù)測控制及其在列車自動駕駛中的應(yīng)用[D]. 周家猷.北京交通大學(xué) 2008
[7]城市軌道交通ATO測試系統(tǒng)設(shè)計與實現(xiàn)[D]. 梁曉鈺.北京交通大學(xué) 2008
[8]城市軌道交通自動駕駛(ATO)測試系統(tǒng)中信號模擬的研究[D]. 支柱.北京交通大學(xué) 2008
[9]基于模糊預(yù)測控制的列車自動駕駛系統(tǒng)研究[D]. 康太平.西南交通大學(xué) 2006
本文編號:3343031
本文鏈接:http://sikaile.net/kejilunwen/jiaotonggongchenglunwen/3343031.html
最近更新
教材專著