天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于DDPG強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃

發(fā)布時(shí)間:2023-03-23 22:42
  移動機(jī)器人在未知環(huán)境下的路徑規(guī)劃是機(jī)器人導(dǎo)航的核心問題,也是當(dāng)前眾多學(xué)者研究的熱點(diǎn)。強(qiáng)化學(xué)習(xí)作為基于獎(jiǎng)懲機(jī)制的非監(jiān)督算法,不依賴任何先驗(yàn)知識即可通過與環(huán)境交互選擇最優(yōu)動作,對于未知環(huán)境下的機(jī)器人路徑規(guī)劃具有較強(qiáng)的實(shí)用價(jià)值。路徑規(guī)劃任務(wù)需要輸出連續(xù)的動作空間,而基于Actor-Critic框架的深度確定策略梯度算法(Deep Deterministic Policy Gradient,DDPG)由于經(jīng)過策略直接輸出動作,有效解決了連續(xù)動作空間問題。本文使用DDPG強(qiáng)化學(xué)習(xí)算法研究未知環(huán)境下移動機(jī)器人的路徑規(guī)劃。論文分析了路徑規(guī)劃以及強(qiáng)化學(xué)習(xí)的國內(nèi)外研究現(xiàn)狀,探究了強(qiáng)化學(xué)習(xí)算法的分類以及發(fā)展歷程,并通過對已有多種強(qiáng)化學(xué)習(xí)算法的分析比較,最終選用結(jié)合神經(jīng)網(wǎng)絡(luò)的DDPG強(qiáng)化學(xué)習(xí)算法用于移動機(jī)器人的路徑規(guī)劃。對深度神經(jīng)網(wǎng)絡(luò)以及DDPG算法涉及到的經(jīng)驗(yàn)池回放等相關(guān)背景知識進(jìn)行了詳細(xì)描述,為后續(xù)DDPG算法改良奠定了理論基礎(chǔ)。為搭建DDPG算法路徑規(guī)劃框架,結(jié)合機(jī)器人環(huán)境狀態(tài)、動作空間設(shè)計(jì)了算法所需的神經(jīng)網(wǎng)絡(luò)模型,結(jié)合路徑規(guī)劃任務(wù)設(shè)計(jì)了算法的獎(jiǎng)賞函數(shù)。隨著DDPG算法學(xué)習(xí)能力的提升,固定大小的經(jīng)驗(yàn)池...

【文章頁數(shù)】:71 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 課題背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 非智能路徑規(guī)劃研究現(xiàn)狀
        1.2.2 智能路徑規(guī)劃研究現(xiàn)狀
    1.3 強(qiáng)化學(xué)習(xí)算法研究現(xiàn)狀
    1.4 全文內(nèi)容安排
第二章 DDPG路徑規(guī)劃模型
    2.1 移動機(jī)器人運(yùn)動學(xué)模型
    2.2 深度確定策略梯度(DDPG)算法
        2.2.1 DQN算法
        2.2.2 DDPG路徑規(guī)劃算法原理
        2.2.3 深度神經(jīng)網(wǎng)絡(luò)
        2.2.4 經(jīng)驗(yàn)池回放
    2.3 本章小結(jié)
第三章 基于學(xué)習(xí)曲線理論的DDPG算法
    3.1 獎(jiǎng)賞函數(shù)設(shè)計(jì)
    3.2 激活函數(shù)的選擇
        3.2.1 Sigmoid函數(shù)
        3.2.2 Tanh函數(shù)
        3.2.3 ReLU函數(shù)
    3.3 神經(jīng)網(wǎng)絡(luò)模型搭建
        3.3.1 策略神經(jīng)網(wǎng)絡(luò)
        3.3.2 評價(jià)神經(jīng)網(wǎng)絡(luò)
    3.4 基于學(xué)習(xí)曲線理論改進(jìn)DDPG算法
        3.4.1 學(xué)習(xí)曲線理論概述
        3.4.2 算法學(xué)習(xí)效率方程
        3.4.3 DDPG-vcep算法
    3.5 本章小結(jié)
第四章 路徑規(guī)劃仿真環(huán)境模型搭建
    4.1 實(shí)驗(yàn)環(huán)境
        4.1.1 開發(fā)環(huán)境
        4.1.2 TensorFlow學(xué)習(xí)框架
        4.1.3 Pyglet庫
    4.2 仿真環(huán)境模型搭建
        4.2.1 靜態(tài)圖形搭建
        4.2.2 動態(tài)環(huán)境實(shí)現(xiàn)
        4.2.3 環(huán)境模型建立
    4.3 使用TensorFlow構(gòu)建網(wǎng)絡(luò)模型
    4.4 仿真環(huán)境驗(yàn)證
    4.5 本章小結(jié)
第五章 基于ROS的移動機(jī)器人路徑規(guī)劃實(shí)驗(yàn)
    5.1 實(shí)驗(yàn)平臺簡介
        5.1.1 Roch移動機(jī)器人平臺
        5.1.2 激光雷達(dá)
    5.2 ROS系統(tǒng)
        5.2.1 ROS操作系統(tǒng)概述
        5.2.2 ROS系統(tǒng)框架
    5.3 ROS與 Gazebo聯(lián)合仿真
        5.3.1 Gazebo簡介
        5.3.2 建立環(huán)境與機(jī)器人仿真模型
        5.3.3 激光雷達(dá)數(shù)據(jù)裁切
        5.3.4 仿真實(shí)驗(yàn)
    5.4 Roch 機(jī)器人實(shí)物實(shí)驗(yàn)
    5.5 本章小結(jié)
結(jié)論與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文及研究成果
個(gè)人簡歷



本文編號:3768896

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3768896.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶704ff***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
亚洲欧美日本成人在线| 东北女人的逼操的舒服吗| 91福利视频日本免费看看| 久久国产精品亚州精品毛片| 中文字幕久热精品视频在线| 日韩欧美好看的剧情片免费 | 国产又粗又猛又大爽又黄| 97人妻精品一区二区三区免| 国产精品免费视频视频| 国产又粗又长又大的视频| 乱女午夜精品一区二区三区| 国产目拍亚洲精品区一区| 99热九九在线中文字幕| 日本黄色高清视频久久| 久久香蕉综合网精品视频| 亚洲熟女精品一区二区成人| 国产高清一区二区白浆| 欧美尤物在线观看西比尔| 麻豆印象传媒在线观看| 激情国产白嫩美女在线观看| 日本免费熟女一区二区三区| 欧美日韩国产综合特黄| 中文字幕中文字幕一区二区| 日韩精品视频免费观看| 不卡视频免费一区二区三区| 又黄又硬又爽又色的视频| 亚洲精品中文字幕无限乱码| 99久久无色码中文字幕免费| 亚洲最新一区二区三区| 热久久这里只有精品视频| 国产一区欧美一区日韩一区 | 午夜午夜精品一区二区| 欧美日本精品视频在线观看| 午夜精品福利视频观看| 爽到高潮嗷嗷叫之在现观看| 久热99中文字幕视频在线| 亚洲午夜精品视频在线| 欧美日韩乱码一区二区三区| 日韩精品一区二区三区四区| 国产内射一级二级三级| 国产丝袜女优一区二区三区|