融合深度學(xué)習(xí)與搜索的實時策略游戲微操方法

發(fā)布時間：2022-08-11 14:49

　　實時策略游戲的微操是指操縱多個作戰(zhàn)單元以贏得勝利,針對傳統(tǒng)搜索方法在面對大規(guī)模戰(zhàn)斗場景時存在的搜索效率低下、搜索空間有限等問題,提出深度學(xué)習(xí)與在線搜索相結(jié)合的方法,以實現(xiàn)學(xué)習(xí)模型對搜索過程的引導(dǎo)。給出一種基于編碼-解碼卷積架構(gòu)的聯(lián)合策略網(wǎng)絡(luò),將其嵌入到PGS、POE和SSS+3種經(jīng)典搜索方法中,實現(xiàn)多智能體聯(lián)合動作的端到端學(xué)習(xí)。實驗結(jié)果表明,該方法可以適應(yīng)復(fù)雜的作戰(zhàn)場景,在StarCraft:BroodWar的2個基準(zhǔn)場景中能夠擊敗內(nèi)置人工智能方法,勝率分別達到95%、99%,接近當(dāng)前最好的基準(zhǔn)方法。

【文章頁數(shù)】：10 頁

【文章目錄】：
0 概述
1 相關(guān)工作
2 問題描述
3 RTS游戲微操方法
    3.1 整體方案
    3.2 狀態(tài)表達
    3.3 動作表達
    3.4 基于卷積神經(jīng)網(wǎng)絡(luò)的聯(lián)合策略模型
        3.4.1 網(wǎng)絡(luò)結(jié)構(gòu)
        3.4.2 損失函數(shù)
    3.5 改進搜索方法
        3.5.1 PGS w/JPN方法
        3.5.2 POE w/JPN方法
        3.5.3 SSS+ w/JPN方法
4 實驗評估
    4.1 場景設(shè)置
    4.2 基準(zhǔn)算法設(shè)置
    4.3 數(shù)據(jù)集構(gòu)建
    4.4 結(jié)果分析
        4.4.1 策略模型的預(yù)測性能評估
        4.4.2 原始搜索方法與改進搜索方法的對比分析
        4.4.3 內(nèi)置AI與改進搜索方法的對比分析
5 結(jié)束語

【參考文獻】：
期刊論文
[1]強化學(xué)習(xí)研究綜述[J]. 馬騁乾,謝偉,孫偉杰.  指揮控制與仿真. 2018(06)
[2]深度強化學(xué)習(xí)進展:從AlphaGo到AlphaGo Zero[J]. 唐振韜,邵坤,趙冬斌,朱圓恒.  控制理論與應(yīng)用. 2017(12)
[3]深度強化學(xué)習(xí)綜述:兼論計算機圍棋的發(fā)展[J]. 趙冬斌,邵坤,朱圓恒,李棟,陳亞冉,王海濤,劉德榮,周彤,王成紅.  控制理論與應(yīng)用. 2016(06)
[4]機器博弈海戰(zhàn)兵棋推演系統(tǒng)的設(shè)計實現(xiàn)[J]. 傅調(diào)平,張奧狄,馬濱強.  計算機仿真. 2015(03)
[5]亞馬遜棋機器博弈系統(tǒng)中評估函數(shù)的研究[J]. 郭琴琴,李淑琴,包華.  計算機工程與應(yīng)用. 2012(34)
[6]五子棋中Alpha-Beta搜索算法的研究與改進[J]. 程宇,雷小鋒.  計算機工程. 2012(17)
[7]采用時間差分算法的九路圍棋機器博弈系統(tǒng)[J]. 張小川,唐艷,梁寧寧.  智能系統(tǒng)學(xué)報. 2012(03)
[8]機器博弈研究面臨的各種挑戰(zhàn)[J]. 徐心和,鄧志立,王驕,徐長明,劉紀(jì)紅,馬宗民.  智能系統(tǒng)學(xué)報. 2008(04)

本文編號：3674861

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3674861.html

上一篇：基于GNSS系統(tǒng)的整周模糊度解算算法仿真
下一篇：基于Tent混沌的測試用例優(yōu)先級排序

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合深度學(xué)習(xí)與搜索的實時策略游戲微操方法