基于深度強化學習的第一人稱射擊游戲研究
發(fā)布時間:2022-01-04 00:16
深度強化學習結合了深度學習和強化學習的優(yōu)勢,近來在游戲、機器人、自動駕駛、推薦系統(tǒng)等多個領域有了巨大突破。其中,游戲領域具有簡單快捷的數(shù)據(jù)采樣優(yōu)勢,極大地方便了深度強化學習的研究。雖然深度強化學習在Atari 2600游戲和棋類游戲中展現(xiàn)了超越人類的得分能力,但是在第一人稱射擊(First-person Shooting,FPS)游戲等復雜任務中仍然面臨重要挑戰(zhàn);赩iZDoom平臺,本文分析了FPS游戲的特點,有針對性地提出了智能體分解方案,并且采用了多任務學習方法。主要研究內容如下:(1)FPS游戲通常面臨著復雜的離散動作空間,多樣的任務挑戰(zhàn)和難以分配的游戲獎勵,本文提出智能體分解方案來解決這些問題。智能體分解是將一個智能體從動作空間、任務類型和獎勵分配三個層面進行分解,以此來應對更復雜的任務挑戰(zhàn)。其一,本文提出語義動作空間分解方法,按照動作的組合規(guī)律和實際意義將原始動作空間分解成若干個動作子空間,每個動作子空間對應了一個Q網絡分支,降低了原始動作空間的復雜程度。其二,本文提出任務分解方法,將復合任務分解為導航和進攻兩個子任務,每個子任務包括若干個相關的Q網絡分支,降低了復合任務...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
第一人稱視角和第三人稱視角游戲的對比
ViZDoom中的不同場景
學習率對實驗結果的影響
本文編號:3567262
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
第一人稱視角和第三人稱視角游戲的對比
ViZDoom中的不同場景
學習率對實驗結果的影響
本文編號:3567262
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3567262.html
最近更新
教材專著