移動(dòng)機(jī)器人自主控制的深度增強(qiáng)學(xué)習(xí)方法研究
發(fā)布時(shí)間:2021-06-22 09:07
隨著人工智能時(shí)代的到來(lái),機(jī)器人及人工智能技術(shù)已經(jīng)成為當(dāng)前研究的熱點(diǎn),如何使機(jī)器更加智能化、自主化已經(jīng)成為了當(dāng)前研究的一個(gè)重大課題。移動(dòng)機(jī)器人的自主導(dǎo)航和控制一直是其最重要的研究方向之一。目前主流的自主控制方法是先對(duì)整個(gè)環(huán)境建圖,然后進(jìn)行定位和路徑規(guī)劃,最后跟蹤規(guī)劃的路徑。傳統(tǒng)方法一方面比較復(fù)雜,包含大量人工設(shè)計(jì)的工作,另一方面并不符合人的思維方式。如何使得機(jī)器人具備自我探索和學(xué)習(xí)的能力,使其像人類一樣思考,只需要看到眼前的場(chǎng)景就能推導(dǎo)出下一步的動(dòng)作。是一個(gè)十分值得研究的問題。深度增強(qiáng)學(xué)習(xí)通過機(jī)器人與環(huán)境進(jìn)行交互,使得機(jī)器人具備了自我探索和自學(xué)習(xí)的能力。深度增強(qiáng)學(xué)習(xí)只需輸入當(dāng)前看到的場(chǎng)景圖像,即可輸出指令級(jí)的控制命令,而不需要基于地圖,可以實(shí)現(xiàn)從圖像端到動(dòng)作端的控制,即端到端控制。這種方法類似于人類對(duì)于場(chǎng)景的記憶和導(dǎo)航方式,通過不斷的訓(xùn)練試錯(cuò),利用增強(qiáng)學(xué)習(xí)最大化行動(dòng)收益,使得智能體學(xué)會(huì)在遇到類似的場(chǎng)景時(shí)應(yīng)該如何行動(dòng)。深度增強(qiáng)學(xué)習(xí)需要大量的訓(xùn)練時(shí)間和許多不必要的失敗嘗試。而模仿學(xué)習(xí)可以從專家經(jīng)驗(yàn)數(shù)據(jù)中學(xué)習(xí)到專家先驗(yàn)知識(shí),可以用來(lái)指導(dǎo)深度增強(qiáng)學(xué)習(xí)。因此本文將深度增強(qiáng)學(xué)習(xí)和模仿學(xué)習(xí)結(jié)合,提出了...
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
常見無(wú)人車結(jié)構(gòu)及車載傳感器[11]
Waymo無(wú)人車
左所示,為
【參考文獻(xiàn)】:
期刊論文
[1]無(wú)人駕駛汽車的發(fā)展綜述[J]. 馮學(xué)強(qiáng),張良旭,劉志宗. 山東工業(yè)技術(shù). 2015(05)
[2]無(wú)人駕駛汽車的發(fā)展現(xiàn)狀和展望[J]. 楊帆. 上海汽車. 2014(03)
[3]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強(qiáng),徐偉. 計(jì)算機(jī)研究與發(fā)展. 2013(09)
[4]無(wú)人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學(xué)進(jìn). 上海汽車. 2007(07)
[5]移動(dòng)機(jī)器人技術(shù)研究現(xiàn)狀與未來(lái)[J]. 李磊,葉濤,譚民,陳細(xì)軍. 機(jī)器人. 2002(05)
[6]未知環(huán)境中移動(dòng)機(jī)器人導(dǎo)航控制研究的若干問題[J]. 蔡自興,賀漢根,陳虹. 控制與決策. 2002(04)
博士論文
[1]智能駕駛車輛自評(píng)價(jià)學(xué)習(xí)控制方法研究[D]. 黃振華.國(guó)防科技大學(xué) 2017
[2]高速公路自主駕駛汽車視覺感知算法研究[D]. 聶一鳴.國(guó)防科學(xué)技術(shù)大學(xué) 2012
本文編號(hào):3242566
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
常見無(wú)人車結(jié)構(gòu)及車載傳感器[11]
Waymo無(wú)人車
左所示,為
【參考文獻(xiàn)】:
期刊論文
[1]無(wú)人駕駛汽車的發(fā)展綜述[J]. 馮學(xué)強(qiáng),張良旭,劉志宗. 山東工業(yè)技術(shù). 2015(05)
[2]無(wú)人駕駛汽車的發(fā)展現(xiàn)狀和展望[J]. 楊帆. 上海汽車. 2014(03)
[3]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強(qiáng),徐偉. 計(jì)算機(jī)研究與發(fā)展. 2013(09)
[4]無(wú)人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學(xué)進(jìn). 上海汽車. 2007(07)
[5]移動(dòng)機(jī)器人技術(shù)研究現(xiàn)狀與未來(lái)[J]. 李磊,葉濤,譚民,陳細(xì)軍. 機(jī)器人. 2002(05)
[6]未知環(huán)境中移動(dòng)機(jī)器人導(dǎo)航控制研究的若干問題[J]. 蔡自興,賀漢根,陳虹. 控制與決策. 2002(04)
博士論文
[1]智能駕駛車輛自評(píng)價(jià)學(xué)習(xí)控制方法研究[D]. 黃振華.國(guó)防科技大學(xué) 2017
[2]高速公路自主駕駛汽車視覺感知算法研究[D]. 聶一鳴.國(guó)防科學(xué)技術(shù)大學(xué) 2012
本文編號(hào):3242566
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3242566.html
最近更新
教材專著