移動機器人自主控制的深度增強學習方法研究
發(fā)布時間:2021-06-22 09:07
隨著人工智能時代的到來,機器人及人工智能技術(shù)已經(jīng)成為當前研究的熱點,如何使機器更加智能化、自主化已經(jīng)成為了當前研究的一個重大課題。移動機器人的自主導航和控制一直是其最重要的研究方向之一。目前主流的自主控制方法是先對整個環(huán)境建圖,然后進行定位和路徑規(guī)劃,最后跟蹤規(guī)劃的路徑。傳統(tǒng)方法一方面比較復雜,包含大量人工設計的工作,另一方面并不符合人的思維方式。如何使得機器人具備自我探索和學習的能力,使其像人類一樣思考,只需要看到眼前的場景就能推導出下一步的動作。是一個十分值得研究的問題。深度增強學習通過機器人與環(huán)境進行交互,使得機器人具備了自我探索和自學習的能力。深度增強學習只需輸入當前看到的場景圖像,即可輸出指令級的控制命令,而不需要基于地圖,可以實現(xiàn)從圖像端到動作端的控制,即端到端控制。這種方法類似于人類對于場景的記憶和導航方式,通過不斷的訓練試錯,利用增強學習最大化行動收益,使得智能體學會在遇到類似的場景時應該如何行動。深度增強學習需要大量的訓練時間和許多不必要的失敗嘗試。而模仿學習可以從專家經(jīng)驗數(shù)據(jù)中學習到專家先驗知識,可以用來指導深度增強學習。因此本文將深度增強學習和模仿學習結(jié)合,提出了...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:87 頁
【學位級別】:碩士
【部分圖文】:
常見無人車結(jié)構(gòu)及車載傳感器[11]
Waymo無人車
左所示,為
【參考文獻】:
期刊論文
[1]無人駕駛汽車的發(fā)展綜述[J]. 馮學強,張良旭,劉志宗. 山東工業(yè)技術(shù). 2015(05)
[2]無人駕駛汽車的發(fā)展現(xiàn)狀和展望[J]. 楊帆. 上海汽車. 2014(03)
[3]深度學習的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[4]無人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學進. 上海汽車. 2007(07)
[5]移動機器人技術(shù)研究現(xiàn)狀與未來[J]. 李磊,葉濤,譚民,陳細軍. 機器人. 2002(05)
[6]未知環(huán)境中移動機器人導航控制研究的若干問題[J]. 蔡自興,賀漢根,陳虹. 控制與決策. 2002(04)
博士論文
[1]智能駕駛車輛自評價學習控制方法研究[D]. 黃振華.國防科技大學 2017
[2]高速公路自主駕駛汽車視覺感知算法研究[D]. 聶一鳴.國防科學技術(shù)大學 2012
本文編號:3242566
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:87 頁
【學位級別】:碩士
【部分圖文】:
常見無人車結(jié)構(gòu)及車載傳感器[11]
Waymo無人車
左所示,為
【參考文獻】:
期刊論文
[1]無人駕駛汽車的發(fā)展綜述[J]. 馮學強,張良旭,劉志宗. 山東工業(yè)技術(shù). 2015(05)
[2]無人駕駛汽車的發(fā)展現(xiàn)狀和展望[J]. 楊帆. 上海汽車. 2014(03)
[3]深度學習的昨天、今天和明天[J]. 余凱,賈磊,陳雨強,徐偉. 計算機研究與發(fā)展. 2013(09)
[4]無人駕駛汽車的發(fā)展現(xiàn)狀及方向[J]. 喬維高,徐學進. 上海汽車. 2007(07)
[5]移動機器人技術(shù)研究現(xiàn)狀與未來[J]. 李磊,葉濤,譚民,陳細軍. 機器人. 2002(05)
[6]未知環(huán)境中移動機器人導航控制研究的若干問題[J]. 蔡自興,賀漢根,陳虹. 控制與決策. 2002(04)
博士論文
[1]智能駕駛車輛自評價學習控制方法研究[D]. 黃振華.國防科技大學 2017
[2]高速公路自主駕駛汽車視覺感知算法研究[D]. 聶一鳴.國防科學技術(shù)大學 2012
本文編號:3242566
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3242566.html
最近更新
教材專著