對抗場景中的意圖理解與決策設計方法研究
發(fā)布時間:2022-08-23 22:22
在對抗場景下,機器人自主理解敵方意圖,并根據(jù)理解到的意圖進行決策是實現(xiàn)機器人自主控制的核心技術。ICRA RoboMaster人工智能挑戰(zhàn)賽是首次將人工智能與機器人結合起來的嘗試,對未來機器人智能化有著重要的意義。本文以ICRA RoboMaster人工智能挑戰(zhàn)賽為背景,對對抗場景下的敵方機器人意圖理解和我方機器人決策算法設計進行研究。論文的主要工作如下:首先,給出坐標系的定義及坐標系間轉換關系,建立輪式機器人的運動學模型,給出意圖理解和決策問題的數(shù)學描述。其次,基于數(shù)據(jù)驅動的方法構建了意圖理解問題框架,使用仿真環(huán)境和實驗環(huán)境中采集到的數(shù)據(jù)進行了層次化數(shù)據(jù)集構建。再次,提出了基于熱度地圖的敵方意圖抽象;設計了基于長短時記憶和基于序列相似性分析的兩種意圖理解算法,仿真結果說明了意圖理解算法的有效性。然后,提出了基于意圖理解的分層有限狀態(tài)機和強化學習兩種決策算法,仿真結果說明了算法的有效性和穩(wěn)定性。最后,搭建了RoboMaster AI實驗平臺,設計實驗驗證了所提出的意圖理解算法和決策算法的有效性,并對實驗結果進行了分析。
【文章頁數(shù)】:86 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景與意義
1.2 國內外研究現(xiàn)狀
1.2.1 意圖理解
1.2.2 決策方法
1.2.3 目前研究存在的問題
1.3 論文主要內容及章節(jié)安排
第2章 對抗場景下意圖理解與決策問題描述
2.1 引言
2.2 坐標系定義及轉換關系
2.3 機器人運動學建模
2.4 問題描述
2.4.1 問題分析
2.4.2 意圖理解問題描述
2.4.3 決策問題描述
2.5 本章小結
第3章 對抗場景數(shù)據(jù)集構建
3.1 引言
3.2 仿真生成數(shù)據(jù)
3.3 實驗采集數(shù)據(jù)
3.4 數(shù)據(jù)集構建
3.5 本章小結
第4章 敵方意圖理解算法設計
4.1 引言
4.2 基于熱度地圖的意圖抽象
4.3 基于長短時記憶的意圖理解算法設計
4.3.1 長短時記憶網絡結構設計
4.3.2 網絡訓練結果
4.4 基于序列相似性分析的意圖理解算法設計
4.4.1 算法設計
4.4.2 分類效果
4.5 仿真結果及分析
4.6 本章小結
第5章 對抗場景下的決策算法設計
5.1 引言
5.2 基于意圖理解的分層有限狀態(tài)機算法設計
5.2.1 分層有限狀態(tài)機算法描述
5.2.2 單機器人狀態(tài)機設計
5.2.3 雙機器人狀態(tài)機設計
5.3 基于意圖理解的強化學習算法設計
5.3.1 單機器人強化學習算法設計
5.3.2 雙機器人強化學習算法設計
5.4 仿真結果及分析
5.4.1 仿真環(huán)境設置
5.4.2 分層有限狀態(tài)機算法仿真結果及分析
5.4.3 強化學習算法仿真結果及分析
5.5 本章小結
第6章 算法實現(xiàn)與實驗驗證
6.1 引言
6.2 RoboMaster AI實驗平臺搭建
6.2.1 實驗平臺硬件實現(xiàn)
6.2.2 實驗平臺軟件實現(xiàn)
6.3 意圖理解實驗與結果分析
6.4 決策算法實驗與結果分析
6.4.1 決策程序各子功能運行測試
6.4.2 與測試算法對抗實驗結果與分析
6.4.3 與有人操縱機器人對抗實驗結果與分析
6.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
【參考文獻】:
期刊論文
[1]多智能體分層協(xié)作規(guī)劃及在RoboCup中的應用[J]. 陳榮亞,陳小平. 計算機系統(tǒng)應用. 2016(01)
[2]基于MMDP的無人作戰(zhàn)飛機任務分配模型研究[J]. 李月娟,呂永健,常遷臻,朱李云. 計算機應用與軟件. 2013(07)
[3]交互式動態(tài)影響圖的一種近似求解算法[J]. 李波,羅鍵,莊進發(fā),尹華一. 華中科技大學學報(自然科學版). 2011(10)
[4]基于概率推理的入侵意圖識別研究[J]. 彭武,姚淑萍. 計算機科學. 2010(01)
[5]基于博弈論模型的多機協(xié)同對抗多目標任務決策方法[J]. 姚宗信,李明,陳宗基. 航空計算技術. 2007(03)
本文編號:3678590
【文章頁數(shù)】:86 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景與意義
1.2 國內外研究現(xiàn)狀
1.2.1 意圖理解
1.2.2 決策方法
1.2.3 目前研究存在的問題
1.3 論文主要內容及章節(jié)安排
第2章 對抗場景下意圖理解與決策問題描述
2.1 引言
2.2 坐標系定義及轉換關系
2.3 機器人運動學建模
2.4 問題描述
2.4.1 問題分析
2.4.2 意圖理解問題描述
2.4.3 決策問題描述
2.5 本章小結
第3章 對抗場景數(shù)據(jù)集構建
3.1 引言
3.2 仿真生成數(shù)據(jù)
3.3 實驗采集數(shù)據(jù)
3.4 數(shù)據(jù)集構建
3.5 本章小結
第4章 敵方意圖理解算法設計
4.1 引言
4.2 基于熱度地圖的意圖抽象
4.3 基于長短時記憶的意圖理解算法設計
4.3.1 長短時記憶網絡結構設計
4.3.2 網絡訓練結果
4.4 基于序列相似性分析的意圖理解算法設計
4.4.1 算法設計
4.4.2 分類效果
4.5 仿真結果及分析
4.6 本章小結
第5章 對抗場景下的決策算法設計
5.1 引言
5.2 基于意圖理解的分層有限狀態(tài)機算法設計
5.2.1 分層有限狀態(tài)機算法描述
5.2.2 單機器人狀態(tài)機設計
5.2.3 雙機器人狀態(tài)機設計
5.3 基于意圖理解的強化學習算法設計
5.3.1 單機器人強化學習算法設計
5.3.2 雙機器人強化學習算法設計
5.4 仿真結果及分析
5.4.1 仿真環(huán)境設置
5.4.2 分層有限狀態(tài)機算法仿真結果及分析
5.4.3 強化學習算法仿真結果及分析
5.5 本章小結
第6章 算法實現(xiàn)與實驗驗證
6.1 引言
6.2 RoboMaster AI實驗平臺搭建
6.2.1 實驗平臺硬件實現(xiàn)
6.2.2 實驗平臺軟件實現(xiàn)
6.3 意圖理解實驗與結果分析
6.4 決策算法實驗與結果分析
6.4.1 決策程序各子功能運行測試
6.4.2 與測試算法對抗實驗結果與分析
6.4.3 與有人操縱機器人對抗實驗結果與分析
6.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
【參考文獻】:
期刊論文
[1]多智能體分層協(xié)作規(guī)劃及在RoboCup中的應用[J]. 陳榮亞,陳小平. 計算機系統(tǒng)應用. 2016(01)
[2]基于MMDP的無人作戰(zhàn)飛機任務分配模型研究[J]. 李月娟,呂永健,常遷臻,朱李云. 計算機應用與軟件. 2013(07)
[3]交互式動態(tài)影響圖的一種近似求解算法[J]. 李波,羅鍵,莊進發(fā),尹華一. 華中科技大學學報(自然科學版). 2011(10)
[4]基于概率推理的入侵意圖識別研究[J]. 彭武,姚淑萍. 計算機科學. 2010(01)
[5]基于博弈論模型的多機協(xié)同對抗多目標任務決策方法[J]. 姚宗信,李明,陳宗基. 航空計算技術. 2007(03)
本文編號:3678590
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3678590.html