天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于增強(qiáng)學(xué)習(xí)的智能車輛自主決策方法研究

發(fā)布時間:2022-04-25 21:54
  智能駕駛車輛技術(shù)的發(fā)展對于保證車輛行駛安全性和緩解城市的交通壓力具有重要的意義。智能駕駛車輛是人工智能的一個重要應(yīng)用領(lǐng)域,智能車輛自主決策能力的高低在一定程度上可以代表其智能化水平的高低。增強(qiáng)學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個重要的分支,充分發(fā)揮增強(qiáng)學(xué)習(xí)的優(yōu)點(diǎn),利用增強(qiáng)學(xué)習(xí)算法解決智能車自主決策問題,提高智能車對動態(tài)復(fù)雜環(huán)境的自適應(yīng)性,是智能車領(lǐng)域的一個研究重點(diǎn)。本文在現(xiàn)有的智能車輛駕駛技術(shù)研究的基礎(chǔ)上,對智能駕駛車輛在結(jié)構(gòu)化道路環(huán)境中換道決策行為展開深入研究。目前基于規(guī)則決策方法的認(rèn)知規(guī)則庫存在設(shè)計不全面的缺陷和基于統(tǒng)計決策方法需求數(shù)據(jù)大的缺陷,難以適應(yīng)形式復(fù)雜多變的動態(tài)結(jié)構(gòu)化道路環(huán)境,針對結(jié)構(gòu)化道路環(huán)境中換道決策問題,本文提出基于增強(qiáng)學(xué)習(xí)的智能車輛駕駛換道決策模型,提高車輛的智能化水平。本文主要研究成果和創(chuàng)新點(diǎn)包括:(1)針對大規(guī);蜻B續(xù)狀態(tài)空間問題,本文提出基于多核的最小二乘策略迭代算法(MKLSPI,Multi-Kernel Least Squares Policy Iteration),該算法利用核函數(shù)自動構(gòu)建特征以及多個核函數(shù)線性加權(quán)實(shí)現(xiàn)自動調(diào)整學(xué)習(xí)參數(shù),以精確地逼近策略迭代過程中的值函... 

【文章頁數(shù)】:87 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 本文研究背景
    1.2 智能駕駛車輛研究現(xiàn)狀
        1.2.1 國外研究現(xiàn)狀
        1.2.2 國內(nèi)研究現(xiàn)狀
    1.3 駕駛行為決策研究現(xiàn)狀及問題分析
        1.3.1 駕駛行為決策研究現(xiàn)狀
        1.3.2 駕駛行為決策問題分析
    1.4 增強(qiáng)學(xué)習(xí)研究現(xiàn)狀
        1.4.1 基于值函數(shù)逼近的方法
        1.4.2 近似動態(tài)規(guī)劃算法
        1.4.3 基于策略搜索的方法
        1.4.4 結(jié)構(gòu)化增強(qiáng)學(xué)習(xí)方法
        1.4.5 增強(qiáng)學(xué)習(xí)方法應(yīng)用現(xiàn)狀
    1.5 論文的組織結(jié)構(gòu)和主要貢獻(xiàn)
        1.5.1 本文的組織結(jié)構(gòu)
        1.5.2 本文的主要貢獻(xiàn)
第二章 增強(qiáng)學(xué)習(xí)理論基礎(chǔ)與最小二乘策略迭代算法
    2.1 增強(qiáng)學(xué)習(xí)理論基礎(chǔ)
        2.1.1 增強(qiáng)學(xué)習(xí)的相關(guān)概念
        2.1.2 馬爾可夫決策過程
        2.1.3 TD學(xué)習(xí)理論
    2.2 近似策略迭代算法及其特征表示方法
        2.2.1 近似策略迭代方法概述
        2.2.2 常用的特征表示方法
    2.3 基于核的最小二乘策略迭代算法概述
        2.3.1 最小二乘策略迭代算法概述
        2.3.2 基于核的最小二乘策略迭代算法
    2.4 本章小結(jié)
第三章 基于多核的最小二乘策略迭代算法
    3.1 近似策略迭代算法的基本框架
    3.2 基于多核的最小二乘策略迭代MKLSPI算法
        3.2.1 核函數(shù)的引入與核稀疏化方法
        3.2.2 基于核稀疏方法的MKLSPI算法
    3.3 仿真研究
        3.3.1 Mountain-car實(shí)驗(yàn)仿真研究
        3.3.2 Pendulum學(xué)習(xí)控制問題仿真研究
    3.4 本章小結(jié)
第四章 高速公路環(huán)境下智能車換道決策的增強(qiáng)學(xué)習(xí)方法
    4.1 高速公路環(huán)境下智能車換道決策問題
        4.1.1 高速公路環(huán)境簡述
        4.1.2 動態(tài)車流條件下的自主換道決策問題
        4.1.3 智能車換道決策研究現(xiàn)狀
    4.2 仿真環(huán)境概述及智能車自主換道決策問題MDP建模
        4.2.1 仿真環(huán)境概述
        4.2.2 動態(tài)車流環(huán)境中智能車自主換道決策問題MDP建模
    4.3 基于增強(qiáng)學(xué)習(xí)的動態(tài)車流條件下智能車輛自主換道決策方法
        4.3.1 基于增強(qiáng)學(xué)習(xí)的智能車自主換道決策方法
        4.3.2 基于增強(qiáng)學(xué)習(xí)的智能車輛駕駛決策系統(tǒng)
    4.4 動態(tài)車流環(huán)境中智能車駕駛自主換道決策仿真研究
        4.4.1 仿真環(huán)境下離線采樣
        4.4.2 基于MKLSPI算法的自主換道決策仿真研究
        4.4.3 MKLSPI算法與KLSPI算法仿真結(jié)果對比
        4.4.4 基于不同駕駛風(fēng)格的駕駛決策策略仿真
    4.5 本章小結(jié)
第五章 基于實(shí)時感知數(shù)據(jù)的智能車自主換道決策性能測試
    5.1 實(shí)驗(yàn)平臺簡述
        5.1.1 硬件配置
        5.1.2 軟件系統(tǒng)
    5.2 高速公路自主駕駛決策性能測試
        5.2.1 實(shí)驗(yàn)場景介紹
        5.2.2 實(shí)驗(yàn)結(jié)果與分析討論
    5.3 本章小結(jié)
第六章 總結(jié)與展望
    6.1 論文工作總結(jié)
    6.2 展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果


【參考文獻(xiàn)】:
期刊論文
[1]城市道路交通安全管理規(guī)劃編制與實(shí)施策略研究[J]. 鞏建國,戴帥,劉金廣,朱建安,曲栩.  交通信息與安全. 2014(03)
[2]常用核函數(shù)的幾何度量與幾何性質(zhì)[J]. 羅林開,葉凌君,周綺鳳.  廈門大學(xué)學(xué)報(自然科學(xué)版). 2009(06)
[3]無人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學(xué)進(jìn).  上海汽車. 2007(07)
[4]分層強(qiáng)化學(xué)習(xí)中的并行自動分層方法研究[J]. 沈晶,顧國昌,劉海波.  計算機(jī)工程與設(shè)計. 2007(02)
[5]分層強(qiáng)化學(xué)習(xí)中的Option自動生成算法[J]. 沈晶,顧國昌,劉海波.  計算機(jī)工程與應(yīng)用. 2005(34)

博士論文
[1]智能駕駛車輛自主決策與規(guī)劃的增強(qiáng)學(xué)習(xí)方法研究[D]. 左磊.國防科學(xué)技術(shù)大學(xué) 2016
[2]基于近似動態(tài)規(guī)劃的優(yōu)化控制方法及在自主駕駛車輛中的應(yīng)用[D]. 連傳強(qiáng).國防科學(xué)技術(shù)大學(xué) 2016
[3]基于增強(qiáng)學(xué)習(xí)和車輛動力學(xué)的高速公路自主駕駛研究[D]. 劉春明.國防科學(xué)技術(shù)大學(xué) 2014
[4]城市環(huán)境下無人駕駛車輛決策系統(tǒng)研究[D]. 陳佳佳.中國科學(xué)技術(shù)大學(xué) 2014
[5]高速公路自主駕駛汽車視覺感知算法研究[D]. 聶一鳴.國防科學(xué)技術(shù)大學(xué) 2012
[6]策略梯度增強(qiáng)學(xué)習(xí)的理論、算法及應(yīng)用研究[D]. 王學(xué)寧.國防科學(xué)技術(shù)大學(xué) 2006
[7]自主駕駛汽車智能控制系統(tǒng)[D]. 孫振平.國防科學(xué)技術(shù)大學(xué) 2004
[8]增強(qiáng)學(xué)習(xí)及其在移動機(jī)器人導(dǎo)航與控制中的應(yīng)用研究[D]. 徐昕.國防科學(xué)技術(shù)大學(xué) 2002

碩士論文
[1]基于增強(qiáng)學(xué)習(xí)的無人車輛智能決策方法研究[D]. 鄭睿.國防科學(xué)技術(shù)大學(xué) 2013
[2]自主移動機(jī)器人導(dǎo)航與控制中的增強(qiáng)學(xué)習(xí)方法研究[D]. 李兆斌.國防科學(xué)技術(shù)大學(xué) 2010
[3]基于強(qiáng)化學(xué)習(xí)的自主移動機(jī)器人導(dǎo)航研究[D]. 吳洪巖.東北師范大學(xué) 2009



本文編號:3648406

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3648406.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶db355***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com