愛恩斯坦棋計(jì)算機(jī)博弈算法的研究與實(shí)施
發(fā)布時(shí)間:2020-09-23 06:21
計(jì)算機(jī)博弈,也稱機(jī)器博弈,是人工智能領(lǐng)域極具挑戰(zhàn)的一個(gè)分支。計(jì)算機(jī)博弈的研究,最早追溯到20世紀(jì)50年代阿蘭圖靈所設(shè)計(jì)的第一個(gè)紙上象棋程序。經(jīng)過(guò)近七十年的研究,全球計(jì)算機(jī)博弈領(lǐng)域的專家、學(xué)者們?yōu)橛?jì)算機(jī)博弈貢獻(xiàn)比較豐富的理論、實(shí)戰(zhàn)案例分析,包括相關(guān)的技術(shù)、方法與策略,特別是國(guó)際象棋、圍棋等棋類計(jì)算機(jī)博弈,取得了令人驚訝的成果。比如,1997年國(guó)際象棋棋王卡斯帕羅夫?qū)?zhàn)IBM深藍(lán)、2016年世界圍棋九段李世石對(duì)戰(zhàn)谷歌AlphaGo,均以人類棋手失敗而告終,藉此人們對(duì)計(jì)算機(jī)博弈有了嶄新認(rèn)識(shí),真正認(rèn)識(shí)到計(jì)算機(jī)博弈領(lǐng)域,人工智能的強(qiáng)大。相比國(guó)外的精彩,國(guó)內(nèi)計(jì)算機(jī)博弈的研究起步較晚,但也發(fā)展迅速,比如,從2006年首屆全國(guó)性計(jì)算機(jī)博弈競(jìng)標(biāo)賽開始,迄今已經(jīng)成功舉辦11屆比賽,近年來(lái)每年參加決賽的師生有300多支隊(duì)伍、400余名師生,角逐17個(gè)項(xiàng)目,參加高校近40所,這些活動(dòng)極大推動(dòng)了我國(guó)計(jì)算機(jī)博弈活動(dòng)的發(fā)展。本論文選擇了不完全信息博弈、并非大家喜聞常見的愛恩斯坦計(jì)算機(jī)博弈為研究對(duì)象,愛恩斯坦棋具有多變的初始對(duì)局狀態(tài)和在行棋過(guò)程中需要通過(guò)擲骰子決定具體走子范圍的特點(diǎn),這既提高了博弈過(guò)程的趣味性,也增加了博弈決策的研究難度。論文引入計(jì)算機(jī)博弈領(lǐng)域的著名UCT(Upper Confidence Bound Apply to Tree)算法,提出改進(jìn)思想及其實(shí)施方法,在此基礎(chǔ)上構(gòu)建新的博弈策略系統(tǒng),以提升棋力。為此,全文首先闡述了計(jì)算機(jī)博弈基本原理以及相關(guān)技術(shù);其次,介紹了愛恩斯坦棋規(guī)則并建立了數(shù)學(xué)模型;然后,比較深入分析了UCT算法,構(gòu)建應(yīng)用策略;最后,開發(fā)了愛恩斯坦棋博弈系統(tǒng),參加全國(guó)比賽,驗(yàn)證成果。論文在以下方面開展細(xì)小的創(chuàng)新工作:(1)確立攻守平衡基本策略。比較詳細(xì)分析了愛恩斯坦棋特征并建立數(shù)學(xué)模型,從攻守結(jié)合和削減擲骰子所帶來(lái)決策影響力角度,與調(diào)節(jié)進(jìn)攻因子、防守因子和保護(hù)因子為手段,優(yōu)化了估值方法,構(gòu)建了二次估值函數(shù),極大提高了愛恩斯坦棋計(jì)算機(jī)博弈中的估值準(zhǔn)確性。(2)建立混合優(yōu)化算法。提出了基于隨機(jī)模擬的蒙特卡洛算法和基于預(yù)測(cè)的期望搜索算法相結(jié)合的混合優(yōu)化算法(Hybrid Optimization Algorithm),并將二次估值函數(shù)應(yīng)用到混合優(yōu)化算法之中,提高了機(jī)器學(xué)習(xí)方法蒙特卡洛的模擬搜索過(guò)程與運(yùn)行效率。(3)提出提速與全局優(yōu)化著法方法;诂F(xiàn)在PC機(jī)強(qiáng)大的多核計(jì)算能力,引入并行計(jì)算方法,提高了UCT算法運(yùn)行速度;引入當(dāng)前估值因子(WINK)和次優(yōu)節(jié)點(diǎn)平衡因子(UCTK),以決策估值方法部分克服了博弈著法優(yōu)選難題,促使博弈全局性最優(yōu)著法的產(chǎn)生。論文作者攜帶上述研究成果武裝的KnighTeam-AN2程序跟隨計(jì)算機(jī)博弈團(tuán)隊(duì)參加了2016年在沈陽(yáng)航天航空大學(xué)和2017年在重慶互聯(lián)網(wǎng)學(xué)院、重慶理工大學(xué)舉辦的2屆全國(guó)比賽,均取得全國(guó)冠軍。這直接證明了論文研究成果的可行性與有效性。
【學(xué)位單位】:重慶理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP18
【學(xué)位單位】:重慶理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 梁國(guó)軍;謝垂益;胡伶俐;林昊;李景p
本文編號(hào):2824966
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2824966.html
最近更新
教材專著