基于深度強(qiáng)化學(xué)習(xí)的自動(dòng)泊車(chē)控制策略研究
發(fā)布時(shí)間:2022-04-17 17:10
目前汽車(chē)行業(yè)的發(fā)展重心正逐步由傳統(tǒng)車(chē)輛向智能車(chē)輛轉(zhuǎn)移,隨之帶來(lái)的是智能駕駛技術(shù)的迅速發(fā)展。自動(dòng)泊車(chē)系統(tǒng)是智能駕駛技術(shù)的研究方向之一,通過(guò)在泊車(chē)過(guò)程中給予駕駛引導(dǎo)或者完全代替駕駛員進(jìn)行泊車(chē)操作,有效地提升了泊車(chē)成功率,降低了交通事故發(fā)生幾率。同時(shí),由于停車(chē)位狹小、停車(chē)不規(guī)范,駕駛員常常面臨泊車(chē)?yán)щy的局面。因此,自動(dòng)泊車(chē)系統(tǒng)成為了當(dāng)下各大車(chē)企與高校的研究熱點(diǎn)。首先,本文對(duì)自動(dòng)泊車(chē)系統(tǒng)的研究現(xiàn)狀進(jìn)行分析與總結(jié),選擇自動(dòng)泊車(chē)系統(tǒng)中的泊車(chē)控制策略作為本文的研究重點(diǎn),總結(jié)了現(xiàn)有的自動(dòng)泊車(chē)控制策略以及存在的問(wèn)題。基于高斯坐標(biāo)系以及傳統(tǒng)的車(chē)輛坐標(biāo)系構(gòu)建泊車(chē)坐標(biāo)系。以車(chē)輛的運(yùn)動(dòng)學(xué)原理為基礎(chǔ),對(duì)汽車(chē)參數(shù)與停車(chē)位參數(shù)進(jìn)行簡(jiǎn)化;诎⒖寺D(zhuǎn)向原理建立汽車(chē)的運(yùn)動(dòng)學(xué)模型,以平行、垂直泊車(chē)為泊車(chē)場(chǎng)景,對(duì)運(yùn)動(dòng)學(xué)模型進(jìn)行運(yùn)動(dòng)分析。以車(chē)輛的極限轉(zhuǎn)彎特性為切入點(diǎn),研究了汽車(chē)進(jìn)行泊車(chē)所需的最小停車(chē)位尺寸。其次,對(duì)人工智能領(lǐng)域的深度強(qiáng)化學(xué)習(xí)算法進(jìn)行了研究。DDPG(Deep Deterministic Policy Gradient)算法是深度強(qiáng)化學(xué)習(xí)算法之一,具有一定學(xué)習(xí)能力與泛化性能,本文將其應(yīng)用于自動(dòng)泊車(chē)控制策略,實(shí)現(xiàn)端...
【文章頁(yè)數(shù)】:91 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 自動(dòng)泊車(chē)系統(tǒng)國(guó)內(nèi)外研究現(xiàn)狀
1.3 自動(dòng)泊車(chē)控制策略國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 基于經(jīng)驗(yàn)的泊車(chē)運(yùn)動(dòng)控制策略
1.3.2 基于路徑規(guī)劃與追蹤的泊車(chē)運(yùn)動(dòng)控制策略
1.4 深度強(qiáng)化學(xué)習(xí)國(guó)內(nèi)外研究現(xiàn)狀
1.5 本文主要研究?jī)?nèi)容
第二章 泊車(chē)運(yùn)動(dòng)學(xué)模型
2.1 車(chē)輛泊車(chē)坐標(biāo)系
2.2 汽車(chē)泊車(chē)運(yùn)動(dòng)學(xué)模型
2.2.1 汽車(chē)參數(shù)與車(chē)身簡(jiǎn)化
2.2.2 阿克曼轉(zhuǎn)向理論和幾何分析
2.2.3 基于阿克曼轉(zhuǎn)向的汽車(chē)運(yùn)動(dòng)學(xué)模型
2.3 最小停車(chē)空間
2.3.1 車(chē)輛最小轉(zhuǎn)彎半徑
2.3.2 最小停車(chē)空間仿真試驗(yàn)及分析
2.4 本章小結(jié)
第三章 深度強(qiáng)化學(xué)習(xí)算法模型
3.1 深度強(qiáng)化學(xué)習(xí)基礎(chǔ)
3.1.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)概念
3.1.2 馬爾可夫決策過(guò)程
3.1.3 強(qiáng)化學(xué)習(xí)算法分類(lèi)
3.2 DDPG算法原理及改進(jìn)
3.2.1 DDPG算法原理
3.2.2 DDPG算法改進(jìn)
3.3 DDPG算法狀態(tài)以及動(dòng)作定義
3.4 基于軌跡學(xué)習(xí)的權(quán)重獎(jiǎng)勵(lì)函數(shù)
3.4.1 獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)原則
3.4.2 泊車(chē)軌跡數(shù)據(jù)采集試驗(yàn)
3.4.3 權(quán)重獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)
3.5 算法網(wǎng)絡(luò)設(shè)計(jì)
3.6 基于優(yōu)先經(jīng)驗(yàn)回放方法的采樣策略
3.6.1 優(yōu)先經(jīng)驗(yàn)回放方法
3.6.2 樣本抽取方法設(shè)計(jì)
3.6.3 采樣策略驗(yàn)證試驗(yàn)
3.7 本章小結(jié)
第四章 自動(dòng)泊車(chē)控制系統(tǒng)仿真
4.1 仿真環(huán)境搭建
4.1.1 車(chē)輛參數(shù)與虛擬雷達(dá)設(shè)置
4.1.3 泊車(chē)環(huán)境設(shè)置
4.1.4 輸入、輸出參數(shù)設(shè)置
4.2 算法網(wǎng)絡(luò)模型搭建
4.3 模型訓(xùn)練以及結(jié)果分析
4.3.1 平行泊車(chē)訓(xùn)練結(jié)果分析
4.3.2 垂直泊車(chē)測(cè)試結(jié)果分析
4.4 針對(duì)不同泊車(chē)工況的泛化性試驗(yàn)
4.4.1 泊車(chē)起始位置不同的泛化性試驗(yàn)
4.4.2 停車(chē)位尺寸不同的泛化性試驗(yàn)
4.5 本章小結(jié)
第五章 硬件在環(huán)試驗(yàn)及其分析
5.1 HIL系統(tǒng)仿真硬件平臺(tái)
5.2 HIL系統(tǒng)試驗(yàn)方案設(shè)計(jì)
5.3 HIL硬件在環(huán)仿真試驗(yàn)
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的學(xué)術(shù)活動(dòng)及成果情況
【參考文獻(xiàn)】:
期刊論文
[1]AlphaGo與AlphaZero原理和未來(lái)應(yīng)用研究[J]. 陳銘禹. 通訊世界. 2019(12)
[2]卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式研究[J]. 賴(lài)策,魏小琴. 信息與電腦(理論版). 2019(22)
[3]基于TensorFlow的交通標(biāo)志識(shí)別系統(tǒng)研究[J]. 仲崇豪,宋斌,徐方明,楊怡均. 信息與電腦(理論版). 2019(22)
[4]深度強(qiáng)化學(xué)習(xí)中稀疏獎(jiǎng)勵(lì)問(wèn)題研究綜述[J]. 楊惟軼,白辰甲,蔡超,趙英男,劉鵬. 計(jì)算機(jī)科學(xué). 2020(03)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的火焰識(shí)別[J]. 段鎖林,劉福,高仁洲,王一凡,潘禮正. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(11)
[6]基于深度強(qiáng)化學(xué)習(xí)的交通信號(hào)控制方法[J]. 孫浩,陳春林,劉瓊,趙佳寶. 計(jì)算機(jī)科學(xué). 2020(02)
[7]深度學(xué)習(xí)算法研究進(jìn)展[J]. 田啟川,王滿(mǎn)麗. 計(jì)算機(jī)工程與應(yīng)用. 2019(22)
[8]基于改進(jìn)強(qiáng)化學(xué)習(xí)的無(wú)人艇集群一致性控制[J]. 曹詩(shī)杰,陳于濤,曾凡明. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(09)
[9]基于DDPG的無(wú)人車(chē)智能避障方法研究[J]. 徐國(guó)艷,宗孝鵬,余貴珍,蘇鴻杰. 汽車(chē)工程. 2019(02)
[10]深度強(qiáng)化學(xué)習(xí)理論及其應(yīng)用綜述[J]. 萬(wàn)里鵬,蘭旭光,張翰博,鄭南寧. 模式識(shí)別與人工智能. 2019(01)
博士論文
[1]自主泊車(chē)系統(tǒng)關(guān)鍵技術(shù)研究[D]. 宋金澤.國(guó)防科學(xué)技術(shù)大學(xué) 2009
碩士論文
[1]基于強(qiáng)化學(xué)習(xí)的倒立擺控制算法研究[D]. 楊文樂(lè).西安理工大學(xué) 2019
[2]基于深度強(qiáng)化學(xué)習(xí)算法的衛(wèi)星姿態(tài)控制算法研究[D]. 許瀚.哈爾濱工業(yè)大學(xué) 2019
[3]基于DDPG的智能汽車(chē)穩(wěn)定性控制方法研究[D]. 宋能學(xué).合肥工業(yè)大學(xué) 2019
[4]基于深度強(qiáng)化學(xué)習(xí)的無(wú)人車(chē)控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張磊.中國(guó)地質(zhì)大學(xué)(北京) 2019
[5]基于單點(diǎn)預(yù)瞄偏差模型的自動(dòng)泊車(chē)算法研究[D]. 謝寧猛.長(zhǎng)安大學(xué) 2019
[6]基于人工神經(jīng)網(wǎng)絡(luò)的智能汽車(chē)循跡控制研究[D]. 李子龍.合肥工業(yè)大學(xué) 2019
[7]基于深度強(qiáng)化學(xué)習(xí)的視頻游戲決策模型研究與應(yīng)用[D]. 郭勤.江西理工大學(xué) 2018
[8]基于深度強(qiáng)化學(xué)習(xí)在游戲上的應(yīng)用[D]. 王康.沈陽(yáng)理工大學(xué) 2018
[9]基于深度強(qiáng)化學(xué)習(xí)的主動(dòng)人臉感知技術(shù)研究[D]. 張輝.山東大學(xué) 2017
[10]基于強(qiáng)化學(xué)習(xí)的智能車(chē)移動(dòng)模型研究[D]. 羅志祥.大連理工大學(xué) 2017
本文編號(hào):3645984
【文章頁(yè)數(shù)】:91 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 自動(dòng)泊車(chē)系統(tǒng)國(guó)內(nèi)外研究現(xiàn)狀
1.3 自動(dòng)泊車(chē)控制策略國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 基于經(jīng)驗(yàn)的泊車(chē)運(yùn)動(dòng)控制策略
1.3.2 基于路徑規(guī)劃與追蹤的泊車(chē)運(yùn)動(dòng)控制策略
1.4 深度強(qiáng)化學(xué)習(xí)國(guó)內(nèi)外研究現(xiàn)狀
1.5 本文主要研究?jī)?nèi)容
第二章 泊車(chē)運(yùn)動(dòng)學(xué)模型
2.1 車(chē)輛泊車(chē)坐標(biāo)系
2.2 汽車(chē)泊車(chē)運(yùn)動(dòng)學(xué)模型
2.2.1 汽車(chē)參數(shù)與車(chē)身簡(jiǎn)化
2.2.2 阿克曼轉(zhuǎn)向理論和幾何分析
2.2.3 基于阿克曼轉(zhuǎn)向的汽車(chē)運(yùn)動(dòng)學(xué)模型
2.3 最小停車(chē)空間
2.3.1 車(chē)輛最小轉(zhuǎn)彎半徑
2.3.2 最小停車(chē)空間仿真試驗(yàn)及分析
2.4 本章小結(jié)
第三章 深度強(qiáng)化學(xué)習(xí)算法模型
3.1 深度強(qiáng)化學(xué)習(xí)基礎(chǔ)
3.1.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)概念
3.1.2 馬爾可夫決策過(guò)程
3.1.3 強(qiáng)化學(xué)習(xí)算法分類(lèi)
3.2 DDPG算法原理及改進(jìn)
3.2.1 DDPG算法原理
3.2.2 DDPG算法改進(jìn)
3.3 DDPG算法狀態(tài)以及動(dòng)作定義
3.4 基于軌跡學(xué)習(xí)的權(quán)重獎(jiǎng)勵(lì)函數(shù)
3.4.1 獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)原則
3.4.2 泊車(chē)軌跡數(shù)據(jù)采集試驗(yàn)
3.4.3 權(quán)重獎(jiǎng)勵(lì)函數(shù)設(shè)計(jì)
3.5 算法網(wǎng)絡(luò)設(shè)計(jì)
3.6 基于優(yōu)先經(jīng)驗(yàn)回放方法的采樣策略
3.6.1 優(yōu)先經(jīng)驗(yàn)回放方法
3.6.2 樣本抽取方法設(shè)計(jì)
3.6.3 采樣策略驗(yàn)證試驗(yàn)
3.7 本章小結(jié)
第四章 自動(dòng)泊車(chē)控制系統(tǒng)仿真
4.1 仿真環(huán)境搭建
4.1.1 車(chē)輛參數(shù)與虛擬雷達(dá)設(shè)置
4.1.3 泊車(chē)環(huán)境設(shè)置
4.1.4 輸入、輸出參數(shù)設(shè)置
4.2 算法網(wǎng)絡(luò)模型搭建
4.3 模型訓(xùn)練以及結(jié)果分析
4.3.1 平行泊車(chē)訓(xùn)練結(jié)果分析
4.3.2 垂直泊車(chē)測(cè)試結(jié)果分析
4.4 針對(duì)不同泊車(chē)工況的泛化性試驗(yàn)
4.4.1 泊車(chē)起始位置不同的泛化性試驗(yàn)
4.4.2 停車(chē)位尺寸不同的泛化性試驗(yàn)
4.5 本章小結(jié)
第五章 硬件在環(huán)試驗(yàn)及其分析
5.1 HIL系統(tǒng)仿真硬件平臺(tái)
5.2 HIL系統(tǒng)試驗(yàn)方案設(shè)計(jì)
5.3 HIL硬件在環(huán)仿真試驗(yàn)
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的學(xué)術(shù)活動(dòng)及成果情況
【參考文獻(xiàn)】:
期刊論文
[1]AlphaGo與AlphaZero原理和未來(lái)應(yīng)用研究[J]. 陳銘禹. 通訊世界. 2019(12)
[2]卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方式研究[J]. 賴(lài)策,魏小琴. 信息與電腦(理論版). 2019(22)
[3]基于TensorFlow的交通標(biāo)志識(shí)別系統(tǒng)研究[J]. 仲崇豪,宋斌,徐方明,楊怡均. 信息與電腦(理論版). 2019(22)
[4]深度強(qiáng)化學(xué)習(xí)中稀疏獎(jiǎng)勵(lì)問(wèn)題研究綜述[J]. 楊惟軼,白辰甲,蔡超,趙英男,劉鵬. 計(jì)算機(jī)科學(xué). 2020(03)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的火焰識(shí)別[J]. 段鎖林,劉福,高仁洲,王一凡,潘禮正. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(11)
[6]基于深度強(qiáng)化學(xué)習(xí)的交通信號(hào)控制方法[J]. 孫浩,陳春林,劉瓊,趙佳寶. 計(jì)算機(jī)科學(xué). 2020(02)
[7]深度學(xué)習(xí)算法研究進(jìn)展[J]. 田啟川,王滿(mǎn)麗. 計(jì)算機(jī)工程與應(yīng)用. 2019(22)
[8]基于改進(jìn)強(qiáng)化學(xué)習(xí)的無(wú)人艇集群一致性控制[J]. 曹詩(shī)杰,陳于濤,曾凡明. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(09)
[9]基于DDPG的無(wú)人車(chē)智能避障方法研究[J]. 徐國(guó)艷,宗孝鵬,余貴珍,蘇鴻杰. 汽車(chē)工程. 2019(02)
[10]深度強(qiáng)化學(xué)習(xí)理論及其應(yīng)用綜述[J]. 萬(wàn)里鵬,蘭旭光,張翰博,鄭南寧. 模式識(shí)別與人工智能. 2019(01)
博士論文
[1]自主泊車(chē)系統(tǒng)關(guān)鍵技術(shù)研究[D]. 宋金澤.國(guó)防科學(xué)技術(shù)大學(xué) 2009
碩士論文
[1]基于強(qiáng)化學(xué)習(xí)的倒立擺控制算法研究[D]. 楊文樂(lè).西安理工大學(xué) 2019
[2]基于深度強(qiáng)化學(xué)習(xí)算法的衛(wèi)星姿態(tài)控制算法研究[D]. 許瀚.哈爾濱工業(yè)大學(xué) 2019
[3]基于DDPG的智能汽車(chē)穩(wěn)定性控制方法研究[D]. 宋能學(xué).合肥工業(yè)大學(xué) 2019
[4]基于深度強(qiáng)化學(xué)習(xí)的無(wú)人車(chē)控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張磊.中國(guó)地質(zhì)大學(xué)(北京) 2019
[5]基于單點(diǎn)預(yù)瞄偏差模型的自動(dòng)泊車(chē)算法研究[D]. 謝寧猛.長(zhǎng)安大學(xué) 2019
[6]基于人工神經(jīng)網(wǎng)絡(luò)的智能汽車(chē)循跡控制研究[D]. 李子龍.合肥工業(yè)大學(xué) 2019
[7]基于深度強(qiáng)化學(xué)習(xí)的視頻游戲決策模型研究與應(yīng)用[D]. 郭勤.江西理工大學(xué) 2018
[8]基于深度強(qiáng)化學(xué)習(xí)在游戲上的應(yīng)用[D]. 王康.沈陽(yáng)理工大學(xué) 2018
[9]基于深度強(qiáng)化學(xué)習(xí)的主動(dòng)人臉感知技術(shù)研究[D]. 張輝.山東大學(xué) 2017
[10]基于強(qiáng)化學(xué)習(xí)的智能車(chē)移動(dòng)模型研究[D]. 羅志祥.大連理工大學(xué) 2017
本文編號(hào):3645984
本文鏈接:http://sikaile.net/kejilunwen/qiche/3645984.html
最近更新
教材專(zhuān)著