基于人工智能的星際爭霸Ⅱ智能體研究與實現
發(fā)布時間:2022-02-22 01:25
近年來,隨著人工智能技術的發(fā)展,人工智能技術已經在許多游戲領域取得了超越最頂級人類玩家水平的成績。但是,其在星際爭霸類即時戰(zhàn)略類游戲中并沒有取得令人滿意的成績。因為,星際爭霸類游戲是由不完全信息博弈、巨大動作空間、實時性需求、長期規(guī)劃和多智能體協(xié)作等多個問題構成的復雜性系統(tǒng)問題。目前,許多表現優(yōu)異的星際爭霸II智能體大都依賴于硬編碼策略,幾乎不能因對手所采取的策略的不同而做出適當的調整。本課題使用深度學習算法從頂級玩家的比賽游戲回放中學習玩家的生產策略,并將學習到的生產策略應用到現有的復雜智能體中,從而提高其競爭性。本文首先通過預處理、解析、提取游戲特征等流程從SC2LE(StarCraft II Learning Environment)提供的120多萬場游戲回放中構造數據集。然后使用LSTM網絡訓練預測人族對抗人族、蟲族和神族的下一步生產動作的網絡模型,分別取得了80.19%、80.05%和79.58%的準確率。接著再將訓練的預測人族對抗各種族下一步生產動作的網絡模型集成到星際爭霸II開源智能體——CommandCenter中,改進其原有的Production Manager模塊和...
【文章來源】:西南交通大學四川省211工程院校教育部直屬院校
【文章頁數】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現狀
1.3 主要研究工作
1.4 論文組織結構
1.5 本章小結
第2章 基于SC2LE構建游戲特征數據集
2.1 SC2LE簡介及搭建
2.1.1 星際爭霸II客戶端和SC2API
2.1.2 PySC2
2.1.3 游戲回放數據集
2.1.4 搭建SC2LE平臺
2.2 構建游戲特征數據集
2.2.1 實驗環(huán)境
2.2.2 預處理
2.2.3 解析游戲回放
2.2.4 特征提取
2.2.5 歸一化
2.2.6 劃分
2.3 本章小結
第3章 游戲智能體下一步生產動作的預測
3.1 基于多層感知機的下一步生產動作的預測
3.1.1 網絡架構
3.1.2 網絡實現細節(jié)
3.1.3 實驗及分析
3.2 基于LSTM網絡的下一步生產動作的預測
3.2.1 LSTM網絡架構
3.2.2 LSTM網絡實現
3.2.3 實驗及分析
3.3 本章小結
第4章 智能體構造
4.1 Command Center簡介
4.2 搭建Command Center開發(fā)環(huán)境
4.3 模型集成到Command Center中
4.3.1 編譯Tensor Flow
4.3.2 模型固化
4.3.3 改進Production Manager并實現Build Order Prediction
4.4 實驗及分析
4.4.1 本地測試
4.4.2 Star Craft 2 AI Ladder測試
4.5 本章小結
總結與展望
致謝
參考文獻
附錄
攻讀碩士學位期間發(fā)表的論文及參與的科研項目
【參考文獻】:
期刊論文
[1]卷積神經網絡的發(fā)展及其在計算機視覺領域中的應用綜述[J]. 陳超,齊峰. 計算機科學. 2019(03)
[2]人工智能與“星際爭霸”:多智能體博弈研究新進展[J]. 張宏達,李德才,何玉慶. 無人系統(tǒng)技術. 2019(01)
[3]深度強化學習進展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒. 控制理論與應用. 2017(12)
[4]深度學習在語音識別中的研究進展綜述[J]. 侯一民,周慧瓊,王政一. 計算機應用研究. 2017(08)
本文編號:3638408
【文章來源】:西南交通大學四川省211工程院校教育部直屬院校
【文章頁數】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現狀
1.3 主要研究工作
1.4 論文組織結構
1.5 本章小結
第2章 基于SC2LE構建游戲特征數據集
2.1 SC2LE簡介及搭建
2.1.1 星際爭霸II客戶端和SC2API
2.1.2 PySC2
2.1.3 游戲回放數據集
2.1.4 搭建SC2LE平臺
2.2 構建游戲特征數據集
2.2.1 實驗環(huán)境
2.2.2 預處理
2.2.3 解析游戲回放
2.2.4 特征提取
2.2.5 歸一化
2.2.6 劃分
2.3 本章小結
第3章 游戲智能體下一步生產動作的預測
3.1 基于多層感知機的下一步生產動作的預測
3.1.1 網絡架構
3.1.2 網絡實現細節(jié)
3.1.3 實驗及分析
3.2 基于LSTM網絡的下一步生產動作的預測
3.2.1 LSTM網絡架構
3.2.2 LSTM網絡實現
3.2.3 實驗及分析
3.3 本章小結
第4章 智能體構造
4.1 Command Center簡介
4.2 搭建Command Center開發(fā)環(huán)境
4.3 模型集成到Command Center中
4.3.1 編譯Tensor Flow
4.3.2 模型固化
4.3.3 改進Production Manager并實現Build Order Prediction
4.4 實驗及分析
4.4.1 本地測試
4.4.2 Star Craft 2 AI Ladder測試
4.5 本章小結
總結與展望
致謝
參考文獻
附錄
攻讀碩士學位期間發(fā)表的論文及參與的科研項目
【參考文獻】:
期刊論文
[1]卷積神經網絡的發(fā)展及其在計算機視覺領域中的應用綜述[J]. 陳超,齊峰. 計算機科學. 2019(03)
[2]人工智能與“星際爭霸”:多智能體博弈研究新進展[J]. 張宏達,李德才,何玉慶. 無人系統(tǒng)技術. 2019(01)
[3]深度強化學習進展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒. 控制理論與應用. 2017(12)
[4]深度學習在語音識別中的研究進展綜述[J]. 侯一民,周慧瓊,王政一. 計算機應用研究. 2017(08)
本文編號:3638408
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/3638408.html