基于蒙特卡羅樹(shù)搜索的計(jì)算機(jī)撲克程序

發(fā)布時(shí)間：2017-03-29 19:16

本文關(guān)鍵詞：基于蒙特卡羅樹(shù)搜索的計(jì)算機(jī)撲克程序，由筆耕文化傳播整理發(fā)布。

【摘要】：計(jì)算機(jī)博弈是測(cè)試人工智能所達(dá)到水平的一個(gè)重要平臺(tái)。早期的研究主要集中在確定性完全信息博弈之上。然而由于與現(xiàn)實(shí)之中的問(wèn)題更加貼近,非確定性非完全信息博弈逐漸引起學(xué)術(shù)界的重視。德州撲克是一種非確定性非完全信息博弈。因?yàn)樗囊?guī)則簡(jiǎn)單同時(shí)富于變化,所以其作為這種博弈的一個(gè)典型,正在成為計(jì)算機(jī)博弈研究領(lǐng)域的又一個(gè)熱點(diǎn)。機(jī)器學(xué)習(xí)中的蒙特卡羅樹(shù)搜索算法,是一種集成了蒙特卡羅方法作為評(píng)估的博弈樹(shù)搜索算法,毋需引入過(guò)多的領(lǐng)域知識(shí),同時(shí)具有巨大的可擴(kuò)展性。多臂匪徒問(wèn)題是一種從多重決策選擇問(wèn)題之中抽象出來(lái)的一種機(jī)器學(xué)習(xí)模型。UCB策略是求解多臂匪徒問(wèn)題的一種方法。集成UCB策略的基于UCT的蒙特卡羅樹(shù)搜索算法被證明可以極大地提升計(jì)算機(jī)博弈引擎水平。本文結(jié)合德州撲克的相關(guān)特性改進(jìn)并設(shè)計(jì)了德州撲克的蒙特卡羅博弈樹(shù),同時(shí)對(duì)博弈樹(shù)中的相關(guān)節(jié)點(diǎn)設(shè)計(jì)了對(duì)應(yīng)的模擬、選擇、回溯更新策略。本文使用C++編程序語(yǔ)言、面向?qū)ο蠹夹g(shù)以及設(shè)計(jì)模式思想實(shí)現(xiàn)了一個(gè)德州撲克的博弈引擎。本文為基于蒙特卡羅樹(shù)搜索算法的博弈引擎引入了與德州撲克的相關(guān)的領(lǐng)域知識(shí),其包括Bucketing的底牌提取,以及在此基礎(chǔ)上的基于統(tǒng)計(jì)的對(duì)手模型用于模擬對(duì)手以及估計(jì)對(duì)手的底牌的概率分布。最后我們提出了一個(gè)保守度的概念用于將引擎的下注行為改造成一個(gè)比較“松”的策略。本文設(shè)計(jì)四個(gè)實(shí)驗(yàn)來(lái)驗(yàn)證純粹的蒙特卡羅樹(shù)搜索引擎的性能,并通過(guò)分析輸出日志,發(fā)現(xiàn)了過(guò)“緊”的下注策略對(duì)于博弈的負(fù)面影響。我們測(cè)試了在引入保守度后執(zhí)行一個(gè)比較“松”的下注策略時(shí)對(duì)博弈結(jié)果的影響,同時(shí)驗(yàn)證集成了對(duì)手模型后對(duì)于程序博弈水平的提升。最終,通過(guò)實(shí)驗(yàn)結(jié)果的分析,可以確認(rèn),蒙特卡羅樹(shù)搜索算法可以應(yīng)用于求解非確定性非完全信息博弈問(wèn)題。同時(shí)在求解德州撲克博弈的問(wèn)題中,集成領(lǐng)域知識(shí)以及對(duì)手模型可以提高蒙特卡羅樹(shù)搜索引擎的性能。
【關(guān)鍵詞】：計(jì)算機(jī)博弈 德州撲克 蒙特卡羅樹(shù)搜索 對(duì)手模型
【學(xué)位授予單位】：北京郵電大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2014
【分類號(hào)】：TP18
【目錄】：

摘要4-5
ABSTRACT5-9
第一章緒論9-12
1.1 研究背景9
1.2 課題研究?jī)?nèi)容9-10
1.3 課題意義10
1.4 論文結(jié)構(gòu)10-12
第二章德州撲克12-21
2.1 德克薩斯撲克12-15
2.1.1 德州撲克的起源與現(xiàn)狀12
2.1.2 德州撲克的游戲規(guī)則12-14
2.1.3 德州撲克的打牌規(guī)則14-15
2.2 德州撲克的特性描述15-18
2.2.1 德州撲克的博弈特性15-17
2.2.2 德州撲克的問(wèn)題復(fù)雜度17-18
2.3 相關(guān)研究18-20
2.3.1 基于博弈論理論的研究18-19
2.3.2 基于領(lǐng)域知識(shí)的研究19
2.3.3 基于博弈樹(shù)的研究19-20
2.4 本章小結(jié)20-21
第三章傳統(tǒng)蒙特卡羅樹(shù)搜索21-28
3.1 博弈樹(shù)理論21-22
3.2 蒙特卡羅樹(shù)搜索算法22-24
3.2.1 蒙特卡羅方法22-23
3.2.2 蒙特卡羅樹(shù)搜索23-24
3.3 基于UCT策略的蒙特卡羅樹(shù)搜索算法24-27
3.3.1 UCB1策略25-26
3.3.2 博弈樹(shù)的信息上限UCT策略26-27
3.4 本章小結(jié)27-28
第四章基于德州撲克的蒙特卡羅樹(shù)搜索28-45
4.1 基于德州撲克的博弈樹(shù)構(gòu)造28-32
4.1.1 博弈樹(shù)節(jié)點(diǎn)的設(shè)計(jì)28-30
4.1.2 節(jié)點(diǎn)狀態(tài)的轉(zhuǎn)移30-32
4.2 博弈樹(shù)節(jié)點(diǎn)的蒙特卡羅模擬32-34
4.2.1 葉子節(jié)點(diǎn)的蒙特卡羅模擬32
4.2.2 決策節(jié)點(diǎn)以及對(duì)手節(jié)點(diǎn)的蒙特卡羅模擬32-33
4.2.3 隨機(jī)節(jié)點(diǎn)的蒙特卡羅模擬33-34
4.3 博弈樹(shù)節(jié)點(diǎn)的更新回溯以及選擇策略34-37
4.3.1 葉子節(jié)點(diǎn)的更新回溯策略34-35
4.3.2 隨機(jī)節(jié)點(diǎn)的回溯與選擇策略35
4.3.3 決策節(jié)點(diǎn)的回溯與選擇策略35-36
4.3.4 對(duì)手節(jié)點(diǎn)的回溯與選擇策略36-37
4.4 博弈引擎的設(shè)計(jì)與實(shí)現(xiàn)37-44
4.4.1 博弈樹(shù)節(jié)點(diǎn)的構(gòu)造37-39
4.4.2 蒙特卡羅樹(shù)搜索的設(shè)計(jì)與實(shí)現(xiàn)39-42
4.4.3 博弈引擎的設(shè)計(jì)與實(shí)現(xiàn)42-44
4.5 本章小結(jié)44-45
第五章領(lǐng)域知識(shí)的集成45-53
5.1 Buckting底牌提取45-47
5.2 基于統(tǒng)計(jì)的對(duì)手模型47-50
5.3 翻牌前的策略積極化50-52
5.4 本章小結(jié)52-53
第六章實(shí)驗(yàn)與結(jié)果分析53-56
6.1 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析53-55
6.2 本章小結(jié)55-56
第七章總結(jié)與展望56-58
參考文獻(xiàn)58-60
致謝60-61
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文61

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 孫杰;;淺析人工智能[J];內(nèi)江科技;2011年07期

本文關(guān)鍵詞：基于蒙特卡羅樹(shù)搜索的計(jì)算機(jī)撲克程序，由筆耕文化傳播整理發(fā)布。

，

本文編號(hào)：275218

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/275218.html

上一篇：TD汽車銷售服務(wù)公司網(wǎng)絡(luò)營(yíng)銷策略研究
下一篇：基于混合模型的推薦系統(tǒng)的研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于蒙特卡羅樹(shù)搜索的計(jì)算機(jī)撲克程序