對(duì)抗環(huán)境下的目標(biāo)軌跡預(yù)報(bào)與意圖理解方法研究
發(fā)布時(shí)間:2020-05-26 09:56
【摘要】:在對(duì)抗環(huán)境中,由于智能體之間的交互關(guān)系較為復(fù)雜,對(duì)敵對(duì)目標(biāo)的軌跡預(yù)測(cè)和意圖理解十分重要。然而,現(xiàn)階段目標(biāo)意圖理解方法和軌跡預(yù)測(cè)方法在對(duì)抗場(chǎng)景中的效果普遍較差。本文以ICRA DJI RoboMaster人工智能挑戰(zhàn)賽為背景,主要研究在對(duì)抗環(huán)境下目標(biāo)的軌跡預(yù)報(bào)問(wèn)題和意圖理解問(wèn)題,論文主要成果如下:首先,建立了輪式機(jī)器人的運(yùn)動(dòng)學(xué)模型,給出了相關(guān)坐標(biāo)系和轉(zhuǎn)換關(guān)系,給出了軌跡預(yù)報(bào)以及意圖理解問(wèn)題的描述。其次,針對(duì)對(duì)抗環(huán)境下交互情況較為復(fù)雜的問(wèn)題,給出了處理時(shí)間序列數(shù)據(jù)的編碼模塊和解碼模塊。為了減少計(jì)算量,給出了結(jié)構(gòu)精簡(jiǎn)的判別器網(wǎng)絡(luò)。為了提取智能體之間的交互信息,設(shè)計(jì)了生成器編碼與解碼之間降采樣模塊。針對(duì)在訓(xùn)練過(guò)程中出現(xiàn)的收斂困難的問(wèn)題,給出了參數(shù)和結(jié)構(gòu)調(diào)節(jié)方法,綜合各個(gè)模塊,提出了一種基于生成式對(duì)抗網(wǎng)絡(luò)的軌跡預(yù)測(cè)方法,通過(guò)網(wǎng)絡(luò)的反向傳遞學(xué)習(xí)機(jī)器人之間隱含的交互關(guān)系。再次,給出了一種基于自動(dòng)編碼器的數(shù)據(jù)壓縮和特征提取網(wǎng)絡(luò),針對(duì)目標(biāo)意圖難以獲取的問(wèn)題,利用了特征提取網(wǎng)絡(luò)中的編碼器部分,提出了一種可以實(shí)現(xiàn)自動(dòng)聚類的深度嵌入式聚類網(wǎng)絡(luò),根據(jù)意圖分類結(jié)果,給出了基于長(zhǎng)短時(shí)記憶模塊的意圖分類網(wǎng)絡(luò)。最后,搭建了仿真平臺(tái)并設(shè)計(jì)實(shí)驗(yàn)對(duì)軌跡預(yù)報(bào)方法和意圖理解方法進(jìn)行驗(yàn)證。為了定量分析軌跡預(yù)測(cè)方法的準(zhǔn)確性,給出了兩個(gè)衡量預(yù)測(cè)軌跡準(zhǔn)確程度的指標(biāo)。根據(jù)軌跡預(yù)測(cè)方法和意圖理解方法的需要,給出了三種不同場(chǎng)景下的訓(xùn)練數(shù)據(jù)獲取方式。設(shè)計(jì)了三種特定場(chǎng)景交互模型,驗(yàn)證了軌跡預(yù)測(cè)方法的預(yù)測(cè)準(zhǔn)確性和意圖表現(xiàn)能力,給出了四種賽場(chǎng)環(huán)境下的智能體交互方式,評(píng)價(jià)了軌跡預(yù)測(cè)方法相較于其他方法的優(yōu)劣,針對(duì)意圖分類結(jié)果難以描述的問(wèn)題,將意圖分類結(jié)果以二維軌跡的方式映射到賽場(chǎng)平面圖中,分析了意圖分類結(jié)果的實(shí)際物理意義。
【圖文】:
因此需要建立機(jī)器人的運(yùn)動(dòng)模型。該項(xiàng)賽事中的機(jī)器人是輪式機(jī)器人,輪子采用麥克納姆輪,如圖2-1 所示。圖 2-1 機(jī)器人主要結(jié)構(gòu)2.2.1 坐標(biāo)系定義及轉(zhuǎn)換關(guān)系在建立機(jī)器人運(yùn)動(dòng)模型之前,首先建立機(jī)器人運(yùn)動(dòng)的相關(guān)坐標(biāo)系,其坐標(biāo)系分別為賽場(chǎng)坐標(biāo)系與機(jī)體坐標(biāo)系。下面分別給出這兩個(gè)坐標(biāo)系的定義。(1) 賽場(chǎng)坐標(biāo)系 ICRA DJI RoboMaster 人工智能挑戰(zhàn)賽的比賽場(chǎng)地為8m×5m 的長(zhǎng)方形場(chǎng)地,場(chǎng)地包括出發(fā)區(qū)、供彈區(qū)、障礙區(qū)和防守加成區(qū)。賽場(chǎng)坐標(biāo)系g g g gO X Y Z 以比賽場(chǎng)地平面圖左下角為坐標(biāo)原點(diǎn)gO ,gX 軸沿場(chǎng)地平面圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文緣延伸,指向右下角;gY 軸沿場(chǎng)平面圖左側(cè)較短邊緣延與gX 軸和 軸組成的平面垂直,,指向平面圖的外部。場(chǎng)系如圖 2-2 所示。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP18;TP242
【圖文】:
因此需要建立機(jī)器人的運(yùn)動(dòng)模型。該項(xiàng)賽事中的機(jī)器人是輪式機(jī)器人,輪子采用麥克納姆輪,如圖2-1 所示。圖 2-1 機(jī)器人主要結(jié)構(gòu)2.2.1 坐標(biāo)系定義及轉(zhuǎn)換關(guān)系在建立機(jī)器人運(yùn)動(dòng)模型之前,首先建立機(jī)器人運(yùn)動(dòng)的相關(guān)坐標(biāo)系,其坐標(biāo)系分別為賽場(chǎng)坐標(biāo)系與機(jī)體坐標(biāo)系。下面分別給出這兩個(gè)坐標(biāo)系的定義。(1) 賽場(chǎng)坐標(biāo)系 ICRA DJI RoboMaster 人工智能挑戰(zhàn)賽的比賽場(chǎng)地為8m×5m 的長(zhǎng)方形場(chǎng)地,場(chǎng)地包括出發(fā)區(qū)、供彈區(qū)、障礙區(qū)和防守加成區(qū)。賽場(chǎng)坐標(biāo)系g g g gO X Y Z 以比賽場(chǎng)地平面圖左下角為坐標(biāo)原點(diǎn)gO ,gX 軸沿場(chǎng)地平面圖
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文緣延伸,指向右下角;gY 軸沿場(chǎng)平面圖左側(cè)較短邊緣延與gX 軸和 軸組成的平面垂直,,指向平面圖的外部。場(chǎng)系如圖 2-2 所示。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP18;TP242
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李成升;于洋;;基于行波特征量與堆疊自動(dòng)編碼器的電纜早期故障定位方法[J];四川電力技術(shù);2019年04期
2 王憲保;何文秀;王辛剛;姚明海;錢(qián)l勌
本文編號(hào):2681667
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2681667.html
最近更新
教材專著