天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 汽車論文 >

基于安全強化學(xué)習(xí)的車道保持方法研究及其在SUMO中的驗證

發(fā)布時間:2021-11-03 12:00
  自動駕駛在不久的將來將會改變?nèi)藗內(nèi)粘I钪械慕煌ǚ绞?大量的工作已投入到自主駕駛中的決策和運動控制算法。目前,強化學(xué)習(xí)(Reinforcement Learning)一直是應(yīng)用于這方面的主要策略。但是,若將強化學(xué)習(xí)應(yīng)用于自動駕駛,其在進行探索時所采取的行動可能造成安全隱患,而且該算法的收斂速度可能太慢。因此要想將強化學(xué)習(xí)走出實驗室并應(yīng)用于實際的車輛自主學(xué)習(xí)中的話,迫切需要解決強化學(xué)習(xí)中的安全問題。論文提出了一種應(yīng)用于自動駕駛的安全強化學(xué)習(xí)算法(Safe Reinforcement Learning),通過添加約束來確保算法學(xué)習(xí)過程中的安全性。論文提出帶約束的策略優(yōu)化算法(CPO:Constrained Policy Optimization),該算法的關(guān)鍵在于在代價函數(shù)中引入條件約束。CPO算法基于Actor-Critic算法框架,通過設(shè)置硬約束條件降低策略更新的大小來確保策略更新過程中的安全性。論文主要工作內(nèi)容包括CPO算法的理論證明和推導(dǎo),實際應(yīng)用以及仿真結(jié)果分析。論文在多種地圖上比較了提出的算法,評估和分析了算法在不同地圖上的安全性和穩(wěn)定性。同時,論文也比較了CPO算法和傳統(tǒng)強化... 

【文章來源】:清華大學(xué)北京市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
CHAPTER 1.INTRODUCTION
    1.1 GENERAL INTRODUCTION AND BACKGROUND
    1.2 PROBLEM STATEMENT
    1.3 OBJECTIVE
    1.4 THESIS OUTLINE
CHAPTER 2.LITERATURE REVIEW
    2.1 THE RESEARCH STATUS OF REINFORCEMENT LEARNING
    2.2 REINFORCEMENT LEARNING THEORY AND STRUCTURE
        2.2.1 MARKOV DECISION PROCESS AND STRUCTURE
        2.2.2 BELLMAN EQUATION
    2.3 REINFORCEMENT LEARNING CLASSIFICATIONS
    2.4 REINFORCEMENT LEARNING ALGORITHMS
        2.4.1 DYNAMIC PROGRAMMING
        2.4.2 Q-LEARNING
        2.4.3 SARSA ALGORITHM
        2.4.4 POLICY GRADIENT METHODS
        2.4.5 ACTOR-CRITIC
    2.5 THE RESEARCH STATUS OF SAFE REINFORCEMENT LEARNING
        2.5.1 BASED ON THE MODIFICATION IN OPTIMIZATION CRITERIA:
        2.5.2 BASED ON THE MODIFICATION IN EXPLORATION PROCESS
CHAPTER 3.CONSTRAINED POLICY OPTIMIZATION
    3.1 CPO ALGORITHM
        3.1.1 CONSTRAINED MARKOV DECISION PROCESS(CMDP)
        3.1.2 TRUST REGION POLICY OPTIMIZATION(TRPO)ALGORITHM
        3.1.3 TRUST REGION APPLIED TO CONSTRAINED POLICY OPTIMIZATION
    3.2 LANE KEEPING BASED ON CONSTRAINED POLICY OPTIMIZATION ALGORITHM
        3.2.1 MARKOV MODELING OF LANE KEEPING PROBLEMS
        3.2.2 APPROXIMATE SOLUTION OF CPO ALGORITHM
CHAPTER 4.EXPERIMENT DESIGN& DATA ANALYSIS
    4.1 EXPERIMENT DESIGN
    4.2 MAP DESIGN AND ANALYSIS
        4.2.1 STRAIGHT ROAD
        4.2.2 S-SHAPED CURVED ROAD
        4.2.3 LOOP
        4.2.4 ROUNDABOUT
    4.3 RL VS CPO ENHANCED SAFE-RL
CHAPTER 5.SIMULATION ANALYSIS
    5.1 SUMO(SIMULATION OF URBAN MOBILITY)
    5.2 INTRODUCTION TO TRACI
    5.3 ANALYSIS OF LANE KEEPING PERFORMANCE:
    5.4 CHAPTER SUMMARY
CHAPTER 6.CONCLUSION AND FUTURE WORK
    6.1 SUMMARY AND CONTRIBUTIONS
    6.2 FUTURE WORK
REFERENCES
ACKNOWLEDGEMENT
RESUME



本文編號:3473643

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/qiche/3473643.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶13e00***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲精品福利视频你懂的| 九九热视频免费在线视频| 日韩精品小视频在线观看| 亚洲综合香蕉在线视频| 国产一级内射麻豆91| 国产精品亚洲精品亚洲| 日韩在线欧美一区二区| 欧美成人黄色一级视频| 欧美一级特黄特色大色大片| 国产av天堂一区二区三区粉嫩| av一区二区三区天堂| 国产精品日韩欧美一区二区| 日韩三级黄色大片免费观看| 日韩亚洲精品国产第二页| 日韩欧美国产亚洲一区| 好吊日在线观看免费视频| 五月情婷婷综合激情综合狠狠| 熟妇人妻av中文字幕老熟妇| 国产精品日韩精品最新| 在线中文字幕亚洲欧美一区| 樱井知香黑人一区二区| 黄色av尤物白丝在线播放网址| 亚洲欧洲在线一区二区三区| 中文字幕乱码免费人妻av| 久久少妇诱惑免费视频| 亚洲国产成人久久一区二区三区| 一级片黄色一区二区三区| 久久国产精品熟女一区二区三区| 出差被公高潮久久中文字幕| 国产一区二区三区香蕉av| 色婷婷国产精品视频一区二区保健 | 出差被公高潮久久中文字幕| 最近的中文字幕一区二区| 国产精品一区欧美二区| 国产原创中文av在线播放| 欧美又大又黄刺激视频| 欧美成人免费夜夜黄啪啪| 高清一区二区三区大伊香蕉| 91免费一区二区三区| 精品熟女少妇一区二区三区| 日韩中文无线码在线视频|