天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃研究

發(fā)布時(shí)間:2017-05-08 11:16

  本文關(guān)鍵詞:基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著移動(dòng)機(jī)器人技術(shù)的飛速發(fā)展,應(yīng)用于未知環(huán)境下的移動(dòng)機(jī)器人路徑規(guī)劃技術(shù)得到了越來(lái)越多專家的關(guān)注與研究。強(qiáng)化學(xué)習(xí)是一種重要的機(jī)器學(xué)習(xí)方法,通過(guò)不斷試錯(cuò)與環(huán)境交互尋找最優(yōu)策略。針對(duì)未知環(huán)境下的移動(dòng)機(jī)器人路徑規(guī)劃問(wèn)題,研究基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃。首先,針對(duì)強(qiáng)化學(xué)習(xí)機(jī)器人面臨的探索與利用間的權(quán)衡問(wèn)題,設(shè)計(jì)一種基于近似動(dòng)作空間模型策略選擇的Q-學(xué)習(xí)算法。該方法根據(jù)機(jī)器人運(yùn)動(dòng)過(guò)程中周圍的環(huán)境信息,降低機(jī)器人真實(shí)動(dòng)作空間模型的復(fù)雜程度,提高計(jì)算效率。與傳統(tǒng)的動(dòng)作選擇策略相比,基于近似動(dòng)作模型的策略選擇方法能夠得到一條更加優(yōu)化的路徑,且提高了機(jī)器人路徑規(guī)劃的成功率。然后,針對(duì)復(fù)雜動(dòng)態(tài)環(huán)境下的機(jī)器人路徑規(guī)劃問(wèn)題,采用分層強(qiáng)化學(xué)習(xí)的方法,將路徑規(guī)劃系統(tǒng)從上至下分為根任務(wù)協(xié)作層、子任務(wù)選擇層和環(huán)境交互層三層結(jié)構(gòu),并將路徑規(guī)劃任務(wù)劃分為靜態(tài)障礙物避障、動(dòng)態(tài)障礙物避障及趨向目標(biāo)點(diǎn)運(yùn)動(dòng)三個(gè)基本子任務(wù),減小狀態(tài)空間以及系統(tǒng)學(xué)習(xí)的難度。最后,搭建移動(dòng)機(jī)器人系統(tǒng)的軟硬件平臺(tái),在Ubuntu操作系統(tǒng)和ROS(Robot Operating System,機(jī)器人操作系統(tǒng))軟件框架下,實(shí)現(xiàn)數(shù)據(jù)通信,并設(shè)計(jì)Pioneer3-AT移動(dòng)機(jī)器人的三維仿真模型和三維仿真環(huán)境,實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃的三維仿真實(shí)驗(yàn),然后結(jié)合Pioneer3-AT移動(dòng)機(jī)器人進(jìn)行實(shí)物實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明移動(dòng)機(jī)器人在未知環(huán)境下通過(guò)自主學(xué)習(xí)能夠自主運(yùn)動(dòng)到達(dá)目標(biāo)點(diǎn)。
【關(guān)鍵詞】:移動(dòng)機(jī)器人 路徑規(guī)劃 強(qiáng)化學(xué)習(xí) 近似動(dòng)作模型 ROS
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP242
【目錄】:
  • 摘要6-7
  • Abstract7-10
  • 第1章 緒論10-15
  • 1.1 課題背景與意義10-11
  • 1.2 移動(dòng)機(jī)器人路徑技術(shù)研究現(xiàn)狀11-12
  • 1.3 強(qiáng)化學(xué)習(xí)方法研究現(xiàn)狀12-13
  • 1.4 課題的主要工作與內(nèi)容安排13-15
  • 第2章 強(qiáng)化學(xué)習(xí)理論及算法15-25
  • 2.1 強(qiáng)化學(xué)習(xí)原理15-21
  • 2.1.1 馬爾可夫決策過(guò)程15-16
  • 2.1.2 強(qiáng)化學(xué)習(xí)模型與基本要素16-18
  • 2.1.3 強(qiáng)化學(xué)習(xí)的基本算法18-21
  • 2.2 分層強(qiáng)化學(xué)習(xí)基本原理21-24
  • 2.2.1 半馬爾可夫決策過(guò)程21-22
  • 2.2.2 分層強(qiáng)化學(xué)習(xí)的最優(yōu)策略22
  • 2.2.3 分層強(qiáng)化學(xué)習(xí)基本算法22-24
  • 2.3 本章小結(jié)24-25
  • 第3章 基于近似動(dòng)作空間模型的Q-學(xué)習(xí)算法25-36
  • 3.1 動(dòng)作選擇策略的主要方法25-27
  • 3.1.1 ε-greedy策略25
  • 3.1.2 Boltzmann分布策略25-26
  • 3.1.3 模擬退火策略26-27
  • 3.2 基于近似動(dòng)作模型策略選擇的Q-學(xué)習(xí)算法27-28
  • 3.3 仿真實(shí)驗(yàn)設(shè)計(jì)28-30
  • 3.3.1 環(huán)境模型28-29
  • 3.3.2 動(dòng)作空間的表示29-30
  • 3.3.3 獎(jiǎng)賞函數(shù)的設(shè)計(jì)30
  • 3.3.4 動(dòng)作選擇策略30
  • 3.4 仿真結(jié)果與分析30-35
  • 3.5 本章小結(jié)35-36
  • 第4章 基于分層強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃36-46
  • 4.1 分層強(qiáng)化學(xué)習(xí)結(jié)構(gòu)設(shè)計(jì)36-37
  • 4.2 移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)模型37-38
  • 4.3 環(huán)境信息的獲取38-40
  • 4.4 靜態(tài)避障模塊設(shè)計(jì)40-41
  • 4.4.1 輸入和輸出狀態(tài)空間設(shè)計(jì)40-41
  • 4.4.2 獎(jiǎng)賞函數(shù)的設(shè)計(jì)41
  • 4.4.3 動(dòng)作選擇策略41
  • 4.5 動(dòng)態(tài)避障模塊設(shè)計(jì)41-43
  • 4.5.1 輸入和輸出狀態(tài)空間設(shè)計(jì)41-42
  • 4.5.2 獎(jiǎng)賞函數(shù)的設(shè)計(jì)42-43
  • 4.6 仿真實(shí)驗(yàn)及結(jié)果分析43-45
  • 4.7 本章小結(jié)45-46
  • 第5章 移動(dòng)機(jī)器人系統(tǒng)設(shè)計(jì)及路徑規(guī)劃實(shí)驗(yàn)46-58
  • 5.1 機(jī)器人硬件平臺(tái)46-47
  • 5.1.1 Pioneer3-AT機(jī)器人46
  • 5.1.2 激光掃描測(cè)距儀46-47
  • 5.2 機(jī)器人軟件框架ROS47-49
  • 5.2.1 ROS系統(tǒng)簡(jiǎn)介47-48
  • 5.2.2 ROS系統(tǒng)結(jié)構(gòu)48-49
  • 5.3 基于ROS與Gazebo的機(jī)器人仿真49-52
  • 5.3.1 Gazebo簡(jiǎn)介49-50
  • 5.3.2 機(jī)器人仿真模型設(shè)計(jì)50-52
  • 5.4 實(shí)驗(yàn)結(jié)果與分析52-57
  • 5.4.1 三維仿真實(shí)驗(yàn)52-55
  • 5.4.2 實(shí)物實(shí)驗(yàn)55-57
  • 5.5 本章小結(jié)57-58
  • 總結(jié)與展望58-59
  • 致謝59-60
  • 參考文獻(xiàn)60-64
  • 攻讀碩士學(xué)位期間的論文及科研情況64

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 劉金國(guó);張學(xué)賓;曲艷麗;;歐盟“SPARC”機(jī)器人研發(fā)計(jì)劃解析[J];機(jī)器人技術(shù)與應(yīng)用;2015年02期

2 馬磊;張文旭;戴朝華;;多機(jī)器人系統(tǒng)強(qiáng)化學(xué)習(xí)研究綜述[J];西南交通大學(xué)學(xué)報(bào);2014年06期

3 朱大奇;顏明重;;移動(dòng)機(jī)器人路徑規(guī)劃技術(shù)綜述[J];控制與決策;2010年07期

4 原魁;李園;房立新;;多移動(dòng)機(jī)器人系統(tǒng)研究發(fā)展近況[J];自動(dòng)化學(xué)報(bào);2007年08期

5 譚冠政;賀歡;Aaron Sloman;;Global optimal path planning for mobile robot based onimproved Dijkstra algorithm and ant system algorithm[J];Journal of Central South University of Technology(English Edition);2006年01期

6 陳春林;陳宗海;卓睿;周光明;;基于分層式強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人導(dǎo)航控制[J];南京航空航天大學(xué)學(xué)報(bào);2006年01期

7 沈晶;顧國(guó)昌;劉海波;;分層強(qiáng)化學(xué)習(xí)中的Option自動(dòng)生成算法[J];計(jì)算機(jī)工程與應(yīng)用;2005年34期

8 王學(xué)寧,賀漢根,徐昕;求解部分可觀測(cè)馬氏決策過(guò)程的強(qiáng)化學(xué)習(xí)算法[J];控制與決策;2004年11期

9 高陽(yáng),陳世福,陸鑫;強(qiáng)化學(xué)習(xí)研究綜述[J];自動(dòng)化學(xué)報(bào);2004年01期

10 李磊,葉濤,譚民,陳細(xì)軍;移動(dòng)機(jī)器人技術(shù)研究現(xiàn)狀與未來(lái)[J];機(jī)器人;2002年05期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 鄭宇;分層強(qiáng)化學(xué)習(xí)算法及其應(yīng)用研究[D];北京交通大學(xué);2009年


  本文關(guān)鍵詞:基于強(qiáng)化學(xué)習(xí)的移動(dòng)機(jī)器人路徑規(guī)劃研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):351033

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/351033.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb17c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
少妇丰满a一区二区三区| 91久久精品国产成人| 国产一区二区熟女精品免费| 高清国产日韩欧美熟女| 欧美在线视频一区观看| 欧美精品在线播放一区二区| 91偷拍与自偷拍精品| 99秋霞在线观看视频| 午夜视频在线观看日韩| 九九热精品视频免费在线播放| 日韩精品视频一二三区| 色婷婷激情五月天丁香| 亚洲欧洲一区二区综合精品| 一区二区免费视频中文乱码国产| 精品国产av一区二区三区不卡蜜| 91福利免费一区二区三区| 欧美人妻免费一区二区三区| 亚洲天堂精品在线视频| 视频一区中文字幕日韩| 亚洲熟妇熟女久久精品| 黑丝国产精品一区二区| 99精品国产一区二区青青| 国产欧美一区二区三区精品视| 午夜久久久精品国产精品| 亚洲男人的天堂久久a| 日本最新不卡免费一区二区| 欧美日韩少妇精品专区性色| 成年人免费看国产视频| 人妻少妇av中文字幕乱码高清| 国产精品亚洲综合天堂夜夜| 99久久成人精品国产免费| 99视频精品免费视频播放| 亚洲国产成人久久99精品| 色老汉在线视频免费亚欧| 精品一区二区三区不卡少妇av| 国产原创激情一区二区三区| 日本高清不卡一二三区| 亚洲欧美日韩色图七区| 欧美一级内射一色桃子| 亚洲国产av在线视频| 欧洲自拍偷拍一区二区|