天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 數(shù)學論文 >

基于近似動態(tài)規(guī)劃的優(yōu)化控制方法及在自主駕駛車輛中的應用

發(fā)布時間:2018-02-05 02:30

  本文關(guān)鍵詞: 自主駕駛 運動控制 增強學習 近似動態(tài)規(guī)劃 流形學習 滾動優(yōu)化 出處:《國防科學技術(shù)大學》2016年博士論文 論文類型:學位論文


【摘要】:近年來,隨著工程應用范圍的擴大,近似動態(tài)規(guī)劃(Approximate dynamic programming,ADP)方法越來越多的被用于求解各種復雜的優(yōu)化決策問題。如何提高近似動態(tài)規(guī)劃方法的泛化能力和實時優(yōu)化能力是本文的基礎理論研究。另一方面,在國家自然科學基金重大研究計劃重點資助項目的支持下,重點研究了自主車在不同道路形狀和車速下基于近似動態(tài)規(guī)劃的側(cè)向控制方法。論文的主要工作成果和創(chuàng)新點如下:(1)針對傳統(tǒng)近似動態(tài)規(guī)劃方法存在學習效率低、特征選擇困難的問題,提出了基于核的近似動態(tài)規(guī)劃(Kernel-based ADP,KADP)方法。該方法采用稀疏核方法來構(gòu)建基函數(shù),并使用遞推最小二乘時域差分算法來進行評價器的學習。理論分析表明由于稀疏核方法具有良好的表示學習和泛化能力,新方法中的評價器能夠獲得更小的逼近誤差以及更快的收斂速度。對倒立擺系統(tǒng)的仿真與實驗結(jié)果表明相對于傳統(tǒng)的近似動態(tài)規(guī)劃方法,新方法能夠獲得更優(yōu)的控制性能和約30%的收斂速度提升。(2)提出了基于圖拉普拉斯的近似動態(tài)規(guī)劃(Graph Laplacian-based ADP,GL-ADP)方法。該方法將流形學習與近似動態(tài)規(guī)劃相結(jié)合,利用圖拉普拉斯算子進行基函數(shù)的構(gòu)建,并采用遞推最小二乘時域差分算法訓練評價器。理論分析表明雖然GL-ADP的計算復雜性通常要高于KADP,但是避免了人工經(jīng)驗選取核函數(shù)類型與參數(shù)的問題。對連續(xù)攪拌釜式反應器和板球系統(tǒng)的仿真結(jié)果表明新方法能夠獲得優(yōu)于傳統(tǒng)近似動態(tài)規(guī)劃方法的控制性能;此外相比于KADP方法,雖然計算代價有所提高,但是收斂速度和控制性能分別提升了約18%和2%。(3)提出了針對離散時間系統(tǒng)的滾動時域近似動態(tài)規(guī)劃(Receding horizon ADP,RHADP)優(yōu)化控制方法。該方法在每個預測時域內(nèi)均采用有限時域的近似動態(tài)規(guī)劃方法求解閉環(huán)的最優(yōu)控制策略,并且其收斂性和受控系統(tǒng)的穩(wěn)定性均得到證明。此外,分析結(jié)果表明新方法的計算復雜性為O(N2),而采用內(nèi)點法作為優(yōu)化方法的非線性模型預測控制方法的計算復雜性為O(N3L)。對移動機器人的軌跡跟蹤問題和Van der pol振蕩器控制問題的仿真研究結(jié)果表明,新方法能夠獲得優(yōu)于采用內(nèi)點法作為優(yōu)化方法的非線性模型預測控制方法的控制性能,并且計算代價也明顯降低。(4)提出了一種自適應的自主車側(cè)向控制方法。首先建立了自主車側(cè)向控制問題的馬爾可夫決策過程模型,然后采用基于核的對偶啟發(fā)式規(guī)劃(Kernel-based dual heuristic programming,KDHP)算法來求取該控制問題的閉環(huán)最優(yōu)策略。由于KDHP算法具有良好的自優(yōu)化和泛化能力,因此有利于控制器在不同的道路形狀及車速條件下獲得較高的控制精度。在總里程約為200km的實車實驗中(包括大曲率路徑,校園道路,城市道路和高速公路),平均側(cè)向誤差約為0.18m,并且在某些條件下能夠獲得比已在車上使用的基于預瞄和運動學模型的反饋控制方法更高的控制精度,同時也避免了在拐大彎時誤“抄近道”的問題。本文的研究成果已用于項目的自主駕駛測試車上。
[Abstract]:In recent years , with the expansion of engineering application range , the approximate dynamic programming ( ADP ) method is more and more used to solve complex optimization decision - making problems . ( 4 ) An adaptive autonomous vehicle lateral control method is proposed . The Markov decision process model of autonomous vehicle lateral control is established firstly , and then a kernel - based dual heuristic programming ( KDHP ) algorithm is adopted to obtain the closed - loop optimal strategy of the control problem .

【學位授予單位】:國防科學技術(shù)大學
【學位級別】:博士
【學位授予年份】:2016
【分類號】:O221.3;U463.6

【相似文獻】

相關(guān)期刊論文 前10條

1 董洪波;談動態(tài)規(guī)劃原理的應用[J];水利天地;1994年04期

2 程吉林,金兆森,,沈潔,劉正祥,陳平;高維動態(tài)規(guī)劃的試驗選優(yōu)方法[J];系統(tǒng)工程理論與實踐;1996年02期

3 程吉林,金兆森,沈潔,劉正祥,陳平;多維動態(tài)規(guī)劃的廣義拉氏方法[J];江蘇農(nóng)學院學報;1996年02期

4 王俊,張光宇;多約束動態(tài)規(guī)劃問題求解方法的探討[J];經(jīng)濟師;2001年09期

5 馬衛(wèi)民,徐青川;局外k-出租車問題及其動態(tài)規(guī)劃求法[J];系統(tǒng)工程學報;2001年06期

6 王剛;動態(tài)規(guī)劃的應用實例[J];云南財貿(mào)學院學報;2001年S1期

7 儲錦林;談動態(tài)規(guī)劃階段狀態(tài)的確定問題[J];安徽教育學院學報;2003年03期

8 孫晚華;關(guān)于動態(tài)規(guī)劃順序求解法的教學探討[J];北京交通大學學報(社會科學版);2004年01期

9 羅黨,劉思峰;灰色動態(tài)規(guī)劃研究[J];系統(tǒng)工程理論與實踐;2004年04期

10 段紅玉;李芳菊;;動態(tài)規(guī)劃在程序設計中的應用[J];中國科技信息;2006年07期

相關(guān)會議論文 前10條

1 蔣科林;遲寶山;許云華;刑俊文;;動態(tài)規(guī)劃在裝備計劃生產(chǎn)中的運用[A];2006全國復雜網(wǎng)絡學術(shù)會議論文集[C];2006年

2 張釗;裴燕玲;;動態(tài)規(guī)劃的正向遞推方法[A];2005年度山東建筑學會優(yōu)秀論文集[C];2005年

3 玄一民;趙煥叢;劉宏;;動態(tài)規(guī)劃在多重約束下可靠性選優(yōu)應用研究[A];質(zhì)量——持續(xù)發(fā)展的源動力:中國質(zhì)量學術(shù)與創(chuàng)新論壇論文集(下)[C];2010年

4 曹平;范萌萌;劉克;陳建州;;衛(wèi)星系統(tǒng)通訊路由問題的動態(tài)規(guī)劃建模[A];第十屆中國不確定系統(tǒng)年會、第十四屆中國青年信息與管理學者大會論文集[C];2012年

5 胡樂群;吳滄浦;;矢量指標動態(tài)規(guī)劃的滿意解方法[A];全國青年管理科學與系統(tǒng)科學論文集(第1卷)[C];1991年

6 宋紹劍;李勁芝;林小峰;;基于執(zhí)行依賴啟發(fā)式動態(tài)規(guī)劃的三容水槽液位控制[A];第二十七屆中國控制會議論文集[C];2008年

7 海心;;使用Excel求解動態(tài)規(guī)劃問題方法探討[A];2005年中國機械工程學會年會論文集[C];2005年

8 宋丹丹;鄧志東;;基于模糊動態(tài)規(guī)劃的RNA折疊算法的研究與實現(xiàn)[A];2005年中國智能自動化會議論文集[C];2005年

9 張祥;王曉蕾;楊子賓;王劍;;動態(tài)規(guī)劃理論在雷達可靠性評估中的應用[A];2009第五屆蘇皖兩省大氣探測、環(huán)境遙感與電子技術(shù)學術(shù)研討會專輯[C];2009年

10 胡鐵松;段國圣;萬永華;馮尚友;;多目標動態(tài)規(guī)劃的攝動權(quán)重法[A];1993中國控制與決策學術(shù)年會論文集[C];1993年

相關(guān)重要報紙文章 前1條

1 彭舒佳;專家吁建動態(tài)規(guī)劃機制“糾編”用地[N];中國房地產(chǎn)報;2008年

相關(guān)博士學位論文 前5條

1 連傳強;基于近似動態(tài)規(guī)劃的優(yōu)化控制方法及在自主駕駛車輛中的應用[D];國防科學技術(shù)大學;2016年

2 王穎;基于仿真的可重入生產(chǎn)系統(tǒng)的神經(jīng)元動態(tài)規(guī)劃調(diào)度研究[D];廈門大學;2007年

3 費蓉;動態(tài)規(guī)劃研究及其在電力市場動態(tài)分區(qū)定價問題中的應用[D];西安理工大學;2009年

4 王怡慧;動態(tài)規(guī)劃加速算法和輪廓探測算法[D];復旦大學;2012年

5 姜琳;過程控制優(yōu)化中的智能方法研究[D];吉林大學;2010年

相關(guān)碩士學位論文 前10條

1 陳銘;基于動態(tài)規(guī)劃的弱小目標檢測前跟蹤(DP-TBD)算法研究[D];電子科技大學;2014年

2 安政帥;基于動態(tài)規(guī)劃的微弱目標檢測前跟蹤算法研究[D];西安電子科技大學;2014年

3 程亮;自適應動態(tài)規(guī)劃在電力系統(tǒng)中的應用研究[D];華中科技大學;2014年

4 喬東欽;基于動態(tài)規(guī)劃技術(shù)的MFI理論在板橋中的應用研究[D];湖南大學;2016年

5 蒙寧佳;基于近似動態(tài)規(guī)劃的迭代控制研究及應用[D];北京化工大學;2016年

6 任華茜;基于動態(tài)規(guī)劃的房地產(chǎn)多項目多階段資金分配研究[D];西南科技大學;2016年

7 尹文杰;空域靈活使用中空域動態(tài)規(guī)劃及流量動態(tài)分配技術(shù)研究[D];中國民航大學;2014年

8 趙尚宇;基于動態(tài)規(guī)劃的弱目標檢測前跟蹤算法[D];杭州電子科技大學;2016年

9 董建雙;基于動態(tài)規(guī)劃的檢測前跟蹤(DP-TBD)算法研究[D];大連海事大學;2017年

10 張宏偉;數(shù)學建模中的動態(tài)規(guī)劃問題[D];東北師范大學;2008年



本文編號:1491859

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/1491859.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ba673***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com