天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛決策仿真

發(fā)布時(shí)間:2021-03-23 15:50
  隨著全球經(jīng)濟(jì)的不斷發(fā)展和城鎮(zhèn)化節(jié)奏的持續(xù)加速,全球汽車的保有量和道路里程數(shù)逐步增加。汽車尾氣排放造成的污染、道路不斷擴(kuò)張帶來(lái)的土地資源緊張以及交通事故等問(wèn)題日益嚴(yán)重。由于傳統(tǒng)的機(jī)動(dòng)車輛無(wú)法避免此類交通問(wèn)題的持續(xù)膨脹,隨著車聯(lián)網(wǎng)、智能駕駛等智能汽車技術(shù)的興起,人們將這些傳統(tǒng)汽車無(wú)法解決的問(wèn)題寄予在智能駕駛等技術(shù)上。美國(guó)電氣和電子工程師協(xié)會(huì)(IEEE)預(yù)測(cè),到2040年底道路上行駛的車輛,配備自動(dòng)駕駛技術(shù)的將會(huì)達(dá)到75%。本文基于深度強(qiáng)化學(xué)習(xí)方法,提出一種自動(dòng)駕駛控制策略的學(xué)習(xí)方法。通過(guò)引入專業(yè)駕駛司機(jī)的經(jīng)驗(yàn)數(shù)據(jù)用于預(yù)訓(xùn)練,然后使用經(jīng)驗(yàn)過(guò)濾的Q-學(xué)習(xí)方法(DQFE)進(jìn)行強(qiáng)化學(xué)習(xí)的訓(xùn)練。鑒于這種方法往往需要很長(zhǎng)時(shí)間的訓(xùn)練,本文進(jìn)而提出一種基于聚類分析進(jìn)行優(yōu)化的學(xué)習(xí)方法(DQFE-C)。首先,通過(guò)K-means聚類方法對(duì)試驗(yàn)中獲得的狀態(tài)-動(dòng)作的信息數(shù)據(jù)進(jìn)行處理,然后基于預(yù)設(shè)的分類模型,從每一類別中分別采樣樣本數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)模型的訓(xùn)練。此處理方法不但可以有效降低樣本數(shù)據(jù)的維度,即試驗(yàn)序列在時(shí)間軸上的數(shù)據(jù)維度;并且基于各類別分別采樣處理的方法也使樣本的獨(dú)立同分布特性得到更好的保證。實(shí)驗(yàn)數(shù)據(jù)表明,DQ... 

【文章來(lái)源】:中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省

【文章頁(yè)數(shù)】:51 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第一章 引言
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 自動(dòng)駕駛技術(shù)的研究現(xiàn)狀
        1.2.2 深度強(qiáng)化學(xué)習(xí)方法的研究現(xiàn)狀
    1.3 論文研究的內(nèi)容
    1.4 論文的組織
第二章 深度強(qiáng)化學(xué)習(xí)方法概述
    2.1 深度學(xué)習(xí)
    2.2 強(qiáng)化學(xué)習(xí)
    2.3 經(jīng)驗(yàn)池回放
    2.4 聚類方法
    2.5 深度強(qiáng)化學(xué)習(xí)
    2.6 本章小結(jié)
第三章 自動(dòng)駕駛仿真器
    3.1 The Open Racing Car Simulation
    3.2 Championship Platform
    3.3 本章小結(jié)
第四章 自動(dòng)駕駛策略仿真系統(tǒng)
    4.1 系統(tǒng)架構(gòu)
    4.2 預(yù)訓(xùn)練網(wǎng)絡(luò)模型權(quán)值
    4.3 模型的交互式學(xué)習(xí)和測(cè)試
    4.4 經(jīng)驗(yàn)池回放的約束
    4.5 狀態(tài)特征的聚類分析處理
    4.6 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果及分析
    5.1 環(huán)境配置
    5.2 訓(xùn)練數(shù)據(jù)樣本的設(shè)置
    5.3 基于經(jīng)驗(yàn)池回放和深度強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛仿真系統(tǒng)研究
        5.3.1 參數(shù)配置
        5.3.2 模型訓(xùn)練效率及控制性能
        5.3.3 經(jīng)驗(yàn)池大小對(duì)網(wǎng)絡(luò)模型的影響
    5.4 針對(duì)狀態(tài)特征聚類的自動(dòng)駕駛控制決策學(xué)習(xí)的案例研究
        5.4.1 參數(shù)配置
        5.4.2 聚類分析模型
        5.4.3 模型訓(xùn)練效率及控制性能
        5.4.4 聚類數(shù)量的影響
        5.4.5 泛化能力測(cè)試
    5.5 本章小結(jié)
第六章 總結(jié)與展望
    6.1 研究總結(jié)
    6.2 研究展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)介


【參考文獻(xiàn)】:
期刊論文
[1]2016年底全國(guó)保有機(jī)動(dòng)車達(dá)2.9億輛[J].   汽車維修與保養(yǎng). 2017(02)
[2]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長(zhǎng),鐘珊,周倩,章鵬,徐進(jìn).  計(jì)算機(jī)學(xué)報(bào). 2018(01)
[3]期待無(wú)人駕駛汽車[J]. 艷濤.  機(jī)器人技術(shù)與應(yīng)用. 2015(02)
[4]無(wú)人駕駛汽車的發(fā)展綜述[J]. 馮學(xué)強(qiáng),張良旭,劉志宗.  山東工業(yè)技術(shù). 2015(05)
[5]深度學(xué)習(xí)算法的原理及應(yīng)用[J]. 胡侯立,魏維,胡蒙娜.  信息技術(shù). 2015(02)
[6]汽車智能化的道路:智能汽車、自動(dòng)駕駛汽車安全監(jiān)管研究[J]. 翁岳暄,多尼米克·希倫布蘭德.  科技與法律. 2014(04)
[7]無(wú)人駕駛汽車的發(fā)展現(xiàn)狀和展望[J]. 楊帆.  上海汽車. 2014(03)
[8]動(dòng)物行為訓(xùn)練的理論基礎(chǔ)[J]. 劉赫.  中國(guó)動(dòng)物保健. 2014(02)
[9]地面無(wú)人駕駛技術(shù)現(xiàn)狀及應(yīng)用[J]. 戴斌,聶一鳴,孫振平,安向京.  汽車與安全. 2012(03)
[10]基于TORCS平臺(tái)的虛擬車輛仿真系統(tǒng)開發(fā)[J]. 何寧,趙治國(guó),朱陽(yáng).  中國(guó)制造業(yè)信息化. 2010(15)

博士論文
[1]車輛自適應(yīng)巡航跟隨控制技術(shù)研究[D]. 馬國(guó)成.北京理工大學(xué) 2014



本文編號(hào):3096043

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3096043.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1272a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com