基于近似動態(tài)規(guī)劃的優(yōu)化控制方法及在自主駕駛車輛中的應(yīng)用

發(fā)布時(shí)間：2018-02-05 02:30

本文關(guān)鍵詞： 自主駕駛運(yùn)動控制增強(qiáng)學(xué)習(xí) 近似動態(tài)規(guī)劃流形學(xué)習(xí) 滾動優(yōu)化　出處：《國防科學(xué)技術(shù)大學(xué)》2016年博士論文　論文類型：學(xué)位論文

【摘要】：近年來,隨著工程應(yīng)用范圍的擴(kuò)大,近似動態(tài)規(guī)劃(Approximate dynamic programming,ADP)方法越來越多的被用于求解各種復(fù)雜的優(yōu)化決策問題。如何提高近似動態(tài)規(guī)劃方法的泛化能力和實(shí)時(shí)優(yōu)化能力是本文的基礎(chǔ)理論研究。另一方面,在國家自然科學(xué)基金重大研究計(jì)劃重點(diǎn)資助項(xiàng)目的支持下,重點(diǎn)研究了自主車在不同道路形狀和車速下基于近似動態(tài)規(guī)劃的側(cè)向控制方法。論文的主要工作成果和創(chuàng)新點(diǎn)如下:(1)針對傳統(tǒng)近似動態(tài)規(guī)劃方法存在學(xué)習(xí)效率低、特征選擇困難的問題,提出了基于核的近似動態(tài)規(guī)劃(Kernel-based ADP,KADP)方法。該方法采用稀疏核方法來構(gòu)建基函數(shù),并使用遞推最小二乘時(shí)域差分算法來進(jìn)行評價(jià)器的學(xué)習(xí)。理論分析表明由于稀疏核方法具有良好的表示學(xué)習(xí)和泛化能力,新方法中的評價(jià)器能夠獲得更小的逼近誤差以及更快的收斂速度。對倒立擺系統(tǒng)的仿真與實(shí)驗(yàn)結(jié)果表明相對于傳統(tǒng)的近似動態(tài)規(guī)劃方法,新方法能夠獲得更優(yōu)的控制性能和約30%的收斂速度提升。(2)提出了基于圖拉普拉斯的近似動態(tài)規(guī)劃(Graph Laplacian-based ADP,GL-ADP)方法。該方法將流形學(xué)習(xí)與近似動態(tài)規(guī)劃相結(jié)合,利用圖拉普拉斯算子進(jìn)行基函數(shù)的構(gòu)建,并采用遞推最小二乘時(shí)域差分算法訓(xùn)練評價(jià)器。理論分析表明雖然GL-ADP的計(jì)算復(fù)雜性通常要高于KADP,但是避免了人工經(jīng)驗(yàn)選取核函數(shù)類型與參數(shù)的問題。對連續(xù)攪拌釜式反應(yīng)器和板球系統(tǒng)的仿真結(jié)果表明新方法能夠獲得優(yōu)于傳統(tǒng)近似動態(tài)規(guī)劃方法的控制性能;此外相比于KADP方法,雖然計(jì)算代價(jià)有所提高,但是收斂速度和控制性能分別提升了約18%和2%。(3)提出了針對離散時(shí)間系統(tǒng)的滾動時(shí)域近似動態(tài)規(guī)劃(Receding horizon ADP,RHADP)優(yōu)化控制方法。該方法在每個預(yù)測時(shí)域內(nèi)均采用有限時(shí)域的近似動態(tài)規(guī)劃方法求解閉環(huán)的最優(yōu)控制策略,并且其收斂性和受控系統(tǒng)的穩(wěn)定性均得到證明。此外,分析結(jié)果表明新方法的計(jì)算復(fù)雜性為O(N2),而采用內(nèi)點(diǎn)法作為優(yōu)化方法的非線性模型預(yù)測控制方法的計(jì)算復(fù)雜性為O(N3L)。對移動機(jī)器人的軌跡跟蹤問題和Van der pol振蕩器控制問題的仿真研究結(jié)果表明,新方法能夠獲得優(yōu)于采用內(nèi)點(diǎn)法作為優(yōu)化方法的非線性模型預(yù)測控制方法的控制性能,并且計(jì)算代價(jià)也明顯降低。(4)提出了一種自適應(yīng)的自主車側(cè)向控制方法。首先建立了自主車側(cè)向控制問題的馬爾可夫決策過程模型,然后采用基于核的對偶啟發(fā)式規(guī)劃(Kernel-based dual heuristic programming,KDHP)算法來求取該控制問題的閉環(huán)最優(yōu)策略。由于KDHP算法具有良好的自優(yōu)化和泛化能力,因此有利于控制器在不同的道路形狀及車速條件下獲得較高的控制精度。在總里程約為200km的實(shí)車實(shí)驗(yàn)中(包括大曲率路徑,校園道路,城市道路和高速公路),平均側(cè)向誤差約為0.18m,并且在某些條件下能夠獲得比已在車上使用的基于預(yù)瞄和運(yùn)動學(xué)模型的反饋控制方法更高的控制精度,同時(shí)也避免了在拐大彎時(shí)誤“抄近道”的問題。本文的研究成果已用于項(xiàng)目的自主駕駛測試車上。
[Abstract]:In recent years , with the expansion of engineering application range , the approximate dynamic programming ( ADP ) method is more and more used to solve complex optimization decision - making problems . ( 4 ) An adaptive autonomous vehicle lateral control method is proposed . The Markov decision process model of autonomous vehicle lateral control is established firstly , and then a kernel - based dual heuristic programming ( KDHP ) algorithm is adopted to obtain the closed - loop optimal strategy of the control problem .

【學(xué)位授予單位】：國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】：博士
【學(xué)位授予年份】：2016
【分類號】：O221.3;U463.6

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 董洪波;談動態(tài)規(guī)劃原理的應(yīng)用[J];水利天地;1994年04期

2 程吉林，金兆森，，沈潔，劉正祥，陳平;高維動態(tài)規(guī)劃的試驗(yàn)選優(yōu)方法[J];系統(tǒng)工程理論與實(shí)踐;1996年02期

3 程吉林，金兆森，沈潔，劉正祥，陳平;多維動態(tài)規(guī)劃的廣義拉氏方法[J];江蘇農(nóng)學(xué)院學(xué)報(bào);1996年02期

4 王俊,張光宇;多約束動態(tài)規(guī)劃問題求解方法的探討[J];經(jīng)濟(jì)師;2001年09期

5 馬衛(wèi)民,徐青川;局外k-出租車問題及其動態(tài)規(guī)劃求法[J];系統(tǒng)工程學(xué)報(bào);2001年06期

6 王剛;動態(tài)規(guī)劃的應(yīng)用實(shí)例[J];云南財(cái)貿(mào)學(xué)院學(xué)報(bào);2001年S1期

7 儲錦林;談動態(tài)規(guī)劃階段狀態(tài)的確定問題[J];安徽教育學(xué)院學(xué)報(bào);2003年03期

8 孫晚華;關(guān)于動態(tài)規(guī)劃順序求解法的教學(xué)探討[J];北京交通大學(xué)學(xué)報(bào)(社會科學(xué)版);2004年01期

9 羅黨,劉思峰;灰色動態(tài)規(guī)劃研究[J];系統(tǒng)工程理論與實(shí)踐;2004年04期

10 段紅玉;李芳菊;;動態(tài)規(guī)劃在程序設(shè)計(jì)中的應(yīng)用[J];中國科技信息;2006年07期

相關(guān)會議論文前10條

1 蔣科林;遲寶山;許云華;刑俊文;;動態(tài)規(guī)劃在裝備計(jì)劃生產(chǎn)中的運(yùn)用[A];2006全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會議論文集[C];2006年

2 張釗;裴燕玲;;動態(tài)規(guī)劃的正向遞推方法[A];2005年度山東建筑學(xué)會優(yōu)秀論文集[C];2005年

3 玄一民;趙煥叢;劉宏;;動態(tài)規(guī)劃在多重約束下可靠性選優(yōu)應(yīng)用研究[A];質(zhì)量——持續(xù)發(fā)展的源動力：中國質(zhì)量學(xué)術(shù)與創(chuàng)新論壇論文集（下）[C];2010年

4 曹平;范萌萌;劉克;陳建州;;衛(wèi)星系統(tǒng)通訊路由問題的動態(tài)規(guī)劃建模[A];第十屆中國不確定系統(tǒng)年會、第十四屆中國青年信息與管理學(xué)者大會論文集[C];2012年

5 胡樂群;吳滄浦;;矢量指標(biāo)動態(tài)規(guī)劃的滿意解方法[A];全國青年管理科學(xué)與系統(tǒng)科學(xué)論文集（第1卷）[C];1991年

6 宋紹劍;李勁芝;林小峰;;基于執(zhí)行依賴啟發(fā)式動態(tài)規(guī)劃的三容水槽液位控制[A];第二十七屆中國控制會議論文集[C];2008年

7 海心;;使用Excel求解動態(tài)規(guī)劃問題方法探討[A];2005年中國機(jī)械工程學(xué)會年會論文集[C];2005年

8 宋丹丹;鄧志東;;基于模糊動態(tài)規(guī)劃的RNA折疊算法的研究與實(shí)現(xiàn)[A];2005年中國智能自動化會議論文集[C];2005年

9 張祥;王曉蕾;楊子賓;王劍;;動態(tài)規(guī)劃理論在雷達(dá)可靠性評估中的應(yīng)用[A];2009第五屆蘇皖兩省大氣探測、環(huán)境遙感與電子技術(shù)學(xué)術(shù)研討會專輯[C];2009年

10 胡鐵松;段國圣;萬永華;馮尚友;;多目標(biāo)動態(tài)規(guī)劃的攝動權(quán)重法[A];1993中國控制與決策學(xué)術(shù)年會論文集[C];1993年

相關(guān)重要報(bào)紙文章前1條

1 彭舒佳;專家吁建動態(tài)規(guī)劃機(jī)制“糾編”用地[N];中國房地產(chǎn)報(bào);2008年

相關(guān)博士學(xué)位論文前5條

1 連傳強(qiáng);基于近似動態(tài)規(guī)劃的優(yōu)化控制方法及在自主駕駛車輛中的應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2016年

2 王穎;基于仿真的可重入生產(chǎn)系統(tǒng)的神經(jīng)元動態(tài)規(guī)劃調(diào)度研究[D];廈門大學(xué);2007年

3 費(fèi)蓉;動態(tài)規(guī)劃研究及其在電力市場動態(tài)分區(qū)定價(jià)問題中的應(yīng)用[D];西安理工大學(xué);2009年

4 王怡慧;動態(tài)規(guī)劃加速算法和輪廓探測算法[D];復(fù)旦大學(xué);2012年

5 姜琳;過程控制優(yōu)化中的智能方法研究[D];吉林大學(xué);2010年

相關(guān)碩士學(xué)位論文前10條

1 陳銘;基于動態(tài)規(guī)劃的弱小目標(biāo)檢測前跟蹤（DP-TBD）算法研究[D];電子科技大學(xué);2014年

2 安政帥;基于動態(tài)規(guī)劃的微弱目標(biāo)檢測前跟蹤算法研究[D];西安電子科技大學(xué);2014年

3 程亮;自適應(yīng)動態(tài)規(guī)劃在電力系統(tǒng)中的應(yīng)用研究[D];華中科技大學(xué);2014年

4 喬東欽;基于動態(tài)規(guī)劃技術(shù)的MFI理論在板橋中的應(yīng)用研究[D];湖南大學(xué);2016年

5 蒙寧佳;基于近似動態(tài)規(guī)劃的迭代控制研究及應(yīng)用[D];北京化工大學(xué);2016年

6 任華茜;基于動態(tài)規(guī)劃的房地產(chǎn)多項(xiàng)目多階段資金分配研究[D];西南科技大學(xué);2016年

7 尹文杰;空域靈活使用中空域動態(tài)規(guī)劃及流量動態(tài)分配技術(shù)研究[D];中國民航大學(xué);2014年

8 趙尚宇;基于動態(tài)規(guī)劃的弱目標(biāo)檢測前跟蹤算法[D];杭州電子科技大學(xué);2016年

9 董建雙;基于動態(tài)規(guī)劃的檢測前跟蹤（DP-TBD）算法研究[D];大連海事大學(xué);2017年

10 張宏偉;數(shù)學(xué)建模中的動態(tài)規(guī)劃問題[D];東北師范大學(xué);2008年

本文編號：1491859

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/yysx/1491859.html

上一篇：醫(yī)療決策與數(shù)學(xué)運(yùn)算能力研究
下一篇：時(shí)間序列經(jīng)濟(jì)計(jì)量分析中的小波技術(shù)及其應(yīng)用

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于近似動態(tài)規(guī)劃的優(yōu)化控制方法及在自主駕駛車輛中的應(yīng)用