五子棋人機(jī)博弈算法優(yōu)化研究與實(shí)現(xiàn)

發(fā)布時(shí)間：2020-12-12 19:14

　　計(jì)算機(jī)博弈,也稱機(jī)器博弈,是博弈論與計(jì)算機(jī)技術(shù)結(jié)合的產(chǎn)物,是人工智能領(lǐng)域的一個(gè)重要研究方向,同時(shí)也是兵棋推演、機(jī)器智能、智能決策系統(tǒng)等眾多人工智能應(yīng)用領(lǐng)域的研究基礎(chǔ)和實(shí)驗(yàn)田,長期以來一直受到國內(nèi)外學(xué)者的廣泛關(guān)注。近年來,隨著以各類深度學(xué)習(xí)算法為代表的人工智能技術(shù)研究的日益深入,尤其以AlphaGo為代表的機(jī)器博弈系統(tǒng)取得的巨大成功,進(jìn)一步推動(dòng)了機(jī)器博弈理論與相關(guān)技術(shù)的快速發(fā)展。近代機(jī)器博弈研究主要以圍棋、象棋、五子棋等棋類人機(jī)博弈為主。其中,國際象棋的計(jì)算機(jī)博弈研究歷史最為悠久,并且經(jīng)歷了一場波瀾壯闊的“搏殺”,尤其“深藍(lán)”計(jì)算機(jī)的勝利不僅給人類留下了深刻印象,同時(shí)總結(jié)出一套關(guān)于國際象棋機(jī)器博弈的過程建模、狀態(tài)表示、著法生成、棋局評(píng)估、博弈樹搜索、開局庫與殘局庫開發(fā)、系統(tǒng)測試與參數(shù)優(yōu)化等核心技術(shù)要點(diǎn),為后續(xù)相關(guān)研究確定了研究方向。鑒于五子棋作為生活中最為普及的棋類之一,具有規(guī)則簡單易懂和典型零和完備信息博弈的所有特點(diǎn),便于開展深入研究和快速評(píng)估博弈算法的優(yōu)劣,為此本文以五子棋博弈為研究對(duì)象,針對(duì)零和完備信息博弈問題開展了博弈樹搜索算法優(yōu)化和系統(tǒng)自學(xué)習(xí)能力訓(xùn)練等方面的相關(guān)研究,主要研究內(nèi)...

【文章來源】：大連海事大學(xué)遼寧省 211工程院校

【文章頁數(shù)】：81 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖１」技術(shù)路線圖??Ｆｉｇ．?１．１?Ｔｈｅ?ｔｅｃｈｎｏｌｏｇｙ?ｒｏａｄｍａｐ??１．４論文組織結(jié)構(gòu)??

模型圖,模型,神經(jīng)元,人工神經(jīng)網(wǎng)絡(luò)

及計(jì)算，使機(jī)器能夠像人腦一樣，實(shí)現(xiàn)對(duì)各類數(shù)據(jù)的學(xué)習(xí)、分類和識(shí)別。為了模擬細(xì)胞??結(jié)構(gòu)，模型中設(shè)置了權(quán)值來實(shí)現(xiàn)調(diào)整神經(jīng)元之間的連接程度，通過一層層的計(jì)算處理實(shí)??現(xiàn)了信息的傳遞。人工神經(jīng)網(wǎng)絡(luò)根據(jù)模型內(nèi)部的架構(gòu)層次和激勵(lì)函數(shù)的不同，網(wǎng)絡(luò)的輸??出也會(huì)有所不同。關(guān)于人工神經(jīng)網(wǎng)絡(luò)的重要概念和模型算法分述如下。??３．１．１感知機(jī)模型??感知機(jī)模型在１９５８年被提出用于模擬神經(jīng)元的內(nèi)部結(jié)構(gòu)，最初的結(jié)構(gòu)只有簡單的??兩層神經(jīng)元，輸入層接受模型的輸入信息，通過內(nèi)部結(jié)構(gòu)的權(quán)值運(yùn)算后再經(jīng)過激活函數(shù)??得到最終的輸出值［２９］。??感知機(jī)其類型屬于標(biāo)準(zhǔn)的二分類模型，模型的輸入是樣本的特征，輸出是樣本的類??型，其結(jié)構(gòu)如圖３．１所示。??

函數(shù)圖像,函數(shù)圖像,函數(shù)

?五子棋人機(jī)博弈算法優(yōu)化研宄與實(shí)現(xiàn)???／（ｘ）?＝?ｍａｘ（０，ｘ）?（３．４）??函數(shù)圖像如圖３．３所示：??ＲｅＬＵ函數(shù)??６．５?：??５．５?／??／??３５??２．５??１５????．?０－５?／?＇??－６?－４?－２?－０．５?０?２?４?６??‘圖３．３?ＲｅＬＵ函數(shù)圖像??Ｆｉｇ．?３．３?ＲｅＬＵ?Ｆｕｎｃｔｉｏｎ?Ｉｍａｇｅ??由函數(shù)圖像看出，當(dāng)輸入值小于等于０時(shí)，則輸出０；當(dāng)輸入大于０時(shí)，則輸出??＿ｙ?＝?ｘ。相比較于上面兩個(gè)函數(shù)，ＲｅＬＵ函數(shù)在第一象限中，斜率保持不變，整體呈持上??升狀態(tài)，該分段公式中只存在線性公式，而其它的兩個(gè)函數(shù)都需要指數(shù)運(yùn)算，這樣計(jì)算??速度就會(huì)快很多。??ＲｅＬＵ函數(shù)的缺點(diǎn)也很明顯，當(dāng)輸入是負(fù)數(shù)時(shí)，函數(shù)的值一直為０，也就是說一旦??輸入的是負(fù)數(shù)，激活函數(shù)就會(huì)失效。在模型訓(xùn)練中調(diào)整梯度也就會(huì)為零，并且該函數(shù)函??數(shù)的輸出不是原點(diǎn)對(duì)稱的，在訓(xùn)練調(diào)整的過程中效率低下，后期的優(yōu)化也會(huì)變得十分困??難。??針對(duì)上述存在的問題，有學(xué)者提出了?Ｌｅａｋｙ?ＲｅＬＵ函數(shù)來解決神經(jīng)元無效的問題，??將該函數(shù)直接分為兩段，與ＲｅＬＵ不同地方在于當(dāng)輸入值小于０時(shí)，不再是直接歸０，??而是取一個(gè)斜率較小的線性函數(shù)具體見公式（３．５）：??ｆｊｖ，?Ｘ?＾?０??Ｌｅａｋｙ：〇：〇：）二ｊ?”?（３．５）??［ｏｘ，ｘ＜?０??類似的還有公式（３．６）的Ｓｏｆｔｐｌｕｓ函數(shù)，也是在ＲｅＬＵ函數(shù)的基礎(chǔ)改進(jìn)得到的：??Ｓｏｆｔｐｌｕｓ：漢（ｘ）?＝?ｌｏｇ（ｌ?＋?ｅｖ）?（３．６）??－２０?－??

【參考文獻(xiàn)】：
期刊論文
[1]愛恩斯坦棋計(jì)算機(jī)博弈算法研究與改進(jìn)[J]. 楊昌杰,陳柯成,劉躍元,王京.  無線互聯(lián)科技. 2018(15)
[2]計(jì)算機(jī)博弈的研究與發(fā)展[J]. 王亞杰,邱虹坤,吳燕燕,李飛,楊周鳳.  智能系統(tǒng)學(xué)報(bào). 2016(06)
[3]六子棋中基于局部“路”掃描方式的博弈樹生成算法[J]. 李學(xué)俊,王小龍,吳蕾,劉慧婷.  智能系統(tǒng)學(xué)報(bào). 2015(02)
[4]愛恩斯坦棋靜態(tài)攻防策略的研究[J]. 周文敏,李淑琴.  電腦知識(shí)與技術(shù). 2014(05)
[5]愛恩斯坦棋算法設(shè)計(jì)與分析[J]. 李占宇,李淑琴,顧磊,史玉峰,周文敏.  信息技術(shù)與信息化. 2014(01)
[6]蘇拉卡爾塔博弈系統(tǒng)中評(píng)估函數(shù)的研究[J]. 李淑琴,李靜波,韓裕華,陶思拓.  北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(06)
[7]UCT算法在計(jì)算機(jī)圍棋中的應(yīng)用與改進(jìn)[J]. 周明明,高航,趙國安.  數(shù)據(jù)采集與處理. 2012(S2)
[8]計(jì)算機(jī)博弈中估值算法與博弈訓(xùn)練的研究[J]. 呂艷輝,宮瑞敏.  計(jì)算機(jī)工程. 2012(11)
[9]一種改進(jìn)的基于博弈樹模型的五子棋系統(tǒng)[J]. 楊云強(qiáng),吳姣.  科學(xué)技術(shù)與工程. 2012(05)
[10]一類非完備信息博弈的信息模型[J]. 馬驍,王軒,王曉龍.  計(jì)算機(jī)研究與發(fā)展. 2010(12)

博士論文
[1]計(jì)算機(jī)博弈問題的復(fù)雜性、理論解及相關(guān)搜索算法研究[D]. 高強(qiáng).東北大學(xué) 2016
[2]模糊神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法及收斂性研究[D]. 李龍.大連理工大學(xué) 2010

碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的射線圖像識(shí)別系統(tǒng)的研究[D]. 李玉.北華航天工業(yè)學(xué)院 2019
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別研究[D]. 陳航.南京郵電大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的蘋果表面?zhèn)套R(shí)別研究[D]. 高友文.南京郵電大學(xué) 2018
[4]國際跳棋完備信息博弈關(guān)鍵技術(shù)研究與系統(tǒng)設(shè)計(jì)[D]. 楊周鳳.沈陽航空航天大學(xué) 2018
[5]雙人博弈問題中的蒙特卡洛樹搜索算法的改進(jìn)[D]. 季輝.中國科學(xué)技術(shù)大學(xué) 2017
[6]五子棋計(jì)算機(jī)博弈系統(tǒng)的研究與設(shè)計(jì)[D]. 張效見.安徽大學(xué) 2017
[7]基于Alpha-Beta剪枝算法的黑白棋游戲的設(shè)計(jì)與開發(fā)[D]. 王增財(cái).內(nèi)蒙古大學(xué) 2016
[8]基于BP神經(jīng)網(wǎng)絡(luò)的五子棋自學(xué)習(xí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳橋.燕山大學(xué) 2016
[9]六子棋博弈中搜索技術(shù)的研究與實(shí)現(xiàn)[D]. 汪坤兵.安徽大學(xué) 2016
[10]愛恩斯坦棋計(jì)算機(jī)博弈系統(tǒng)的研究與實(shí)現(xiàn)[D]. 光洋.安徽大學(xué) 2016

本文編號(hào)：2913127

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/shoufeilunwen/xixikjs/2913127.html

上一篇：基于液晶材料的可重構(gòu)無源器件研究
下一篇：超弱光纖光柵傳感解調(diào)系統(tǒng)研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

五子棋人機(jī)博弈算法優(yōu)化研究與實(shí)現(xiàn)