天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

五子棋人機(jī)博弈算法優(yōu)化研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-12-12 19:14
  計(jì)算機(jī)博弈,也稱機(jī)器博弈,是博弈論與計(jì)算機(jī)技術(shù)結(jié)合的產(chǎn)物,是人工智能領(lǐng)域的一個(gè)重要研究方向,同時(shí)也是兵棋推演、機(jī)器智能、智能決策系統(tǒng)等眾多人工智能應(yīng)用領(lǐng)域的研究基礎(chǔ)和實(shí)驗(yàn)田,長期以來一直受到國內(nèi)外學(xué)者的廣泛關(guān)注。近年來,隨著以各類深度學(xué)習(xí)算法為代表的人工智能技術(shù)研究的日益深入,尤其以AlphaGo為代表的機(jī)器博弈系統(tǒng)取得的巨大成功,進(jìn)一步推動(dòng)了機(jī)器博弈理論與相關(guān)技術(shù)的快速發(fā)展。近代機(jī)器博弈研究主要以圍棋、象棋、五子棋等棋類人機(jī)博弈為主。其中,國際象棋的計(jì)算機(jī)博弈研究歷史最為悠久,并且經(jīng)歷了一場波瀾壯闊的“搏殺”,尤其“深藍(lán)”計(jì)算機(jī)的勝利不僅給人類留下了深刻印象,同時(shí)總結(jié)出一套關(guān)于國際象棋機(jī)器博弈的過程建模、狀態(tài)表示、著法生成、棋局評(píng)估、博弈樹搜索、開局庫與殘局庫開發(fā)、系統(tǒng)測試與參數(shù)優(yōu)化等核心技術(shù)要點(diǎn),為后續(xù)相關(guān)研究確定了研究方向。鑒于五子棋作為生活中最為普及的棋類之一,具有規(guī)則簡單易懂和典型零和完備信息博弈的所有特點(diǎn),便于開展深入研究和快速評(píng)估博弈算法的優(yōu)劣,為此本文以五子棋博弈為研究對(duì)象,針對(duì)零和完備信息博弈問題開展了博弈樹搜索算法優(yōu)化和系統(tǒng)自學(xué)習(xí)能力訓(xùn)練等方面的相關(guān)研究,主要研究內(nèi)... 

【文章來源】:大連海事大學(xué)遼寧省 211工程院校

【文章頁數(shù)】:81 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

五子棋人機(jī)博弈算法優(yōu)化研究與實(shí)現(xiàn)


圖1」技術(shù)路線圖??Fig.?1.1?The?technology?roadmap??1.4論文組織結(jié)構(gòu)??

模型圖,模型,神經(jīng)元,人工神經(jīng)網(wǎng)絡(luò)


及計(jì)算,使機(jī)器能夠像人腦一樣,實(shí)現(xiàn)對(duì)各類數(shù)據(jù)的學(xué)習(xí)、分類和識(shí)別。為了模擬細(xì)胞??結(jié)構(gòu),模型中設(shè)置了權(quán)值來實(shí)現(xiàn)調(diào)整神經(jīng)元之間的連接程度,通過一層層的計(jì)算處理實(shí)??現(xiàn)了信息的傳遞。人工神經(jīng)網(wǎng)絡(luò)根據(jù)模型內(nèi)部的架構(gòu)層次和激勵(lì)函數(shù)的不同,網(wǎng)絡(luò)的輸??出也會(huì)有所不同。關(guān)于人工神經(jīng)網(wǎng)絡(luò)的重要概念和模型算法分述如下。??3.1.1感知機(jī)模型??感知機(jī)模型在1958年被提出用于模擬神經(jīng)元的內(nèi)部結(jié)構(gòu),最初的結(jié)構(gòu)只有簡單的??兩層神經(jīng)元,輸入層接受模型的輸入信息,通過內(nèi)部結(jié)構(gòu)的權(quán)值運(yùn)算后再經(jīng)過激活函數(shù)??得到最終的輸出值[29]。??感知機(jī)其類型屬于標(biāo)準(zhǔn)的二分類模型,模型的輸入是樣本的特征,輸出是樣本的類??型,其結(jié)構(gòu)如圖3.1所示。??

函數(shù)圖像,函數(shù)圖像,函數(shù)


?五子棋人機(jī)博弈算法優(yōu)化研宄與實(shí)現(xiàn)???/(x)?=?max(0,x)?(3.4)??函數(shù)圖像如圖3.3所示:??ReLU函數(shù)??6.5?:??5.5?/??/??35??2.5??15????.?0-5?/?'??-6?-4?-2?-0.5?0?2?4?6??‘圖3.3?ReLU函數(shù)圖像??Fig.?3.3?ReLU?Function?Image??由函數(shù)圖像看出,當(dāng)輸入值小于等于0時(shí),則輸出0;當(dāng)輸入大于0時(shí),則輸出??_y?=?x。相比較于上面兩個(gè)函數(shù),ReLU函數(shù)在第一象限中,斜率保持不變,整體呈持上??升狀態(tài),該分段公式中只存在線性公式,而其它的兩個(gè)函數(shù)都需要指數(shù)運(yùn)算,這樣計(jì)算??速度就會(huì)快很多。??ReLU函數(shù)的缺點(diǎn)也很明顯,當(dāng)輸入是負(fù)數(shù)時(shí),函數(shù)的值一直為0,也就是說一旦??輸入的是負(fù)數(shù),激活函數(shù)就會(huì)失效。在模型訓(xùn)練中調(diào)整梯度也就會(huì)為零,并且該函數(shù)函??數(shù)的輸出不是原點(diǎn)對(duì)稱的,在訓(xùn)練調(diào)整的過程中效率低下,后期的優(yōu)化也會(huì)變得十分困??難。??針對(duì)上述存在的問題,有學(xué)者提出了?Leaky?ReLU函數(shù)來解決神經(jīng)元無效的問題,??將該函數(shù)直接分為兩段,與ReLU不同地方在于當(dāng)輸入值小于0時(shí),不再是直接歸0,??而是取一個(gè)斜率較小的線性函數(shù)具體見公式(3.5):??fjv,?X?^?0??Leaky:〇:〇:)二j?”?(3.5)??[ox,x<?0??類似的還有公式(3.6)的Softplus函數(shù),也是在ReLU函數(shù)的基礎(chǔ)改進(jìn)得到的:??Softplus:漢(x)?=?log(l?+?ev)?(3.6)??-20?-??

【參考文獻(xiàn)】:
期刊論文
[1]愛恩斯坦棋計(jì)算機(jī)博弈算法研究與改進(jìn)[J]. 楊昌杰,陳柯成,劉躍元,王京.  無線互聯(lián)科技. 2018(15)
[2]計(jì)算機(jī)博弈的研究與發(fā)展[J]. 王亞杰,邱虹坤,吳燕燕,李飛,楊周鳳.  智能系統(tǒng)學(xué)報(bào). 2016(06)
[3]六子棋中基于局部“路”掃描方式的博弈樹生成算法[J]. 李學(xué)俊,王小龍,吳蕾,劉慧婷.  智能系統(tǒng)學(xué)報(bào). 2015(02)
[4]愛恩斯坦棋靜態(tài)攻防策略的研究[J]. 周文敏,李淑琴.  電腦知識(shí)與技術(shù). 2014(05)
[5]愛恩斯坦棋算法設(shè)計(jì)與分析[J]. 李占宇,李淑琴,顧磊,史玉峰,周文敏.  信息技術(shù)與信息化. 2014(01)
[6]蘇拉卡爾塔博弈系統(tǒng)中評(píng)估函數(shù)的研究[J]. 李淑琴,李靜波,韓裕華,陶思拓.  北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(06)
[7]UCT算法在計(jì)算機(jī)圍棋中的應(yīng)用與改進(jìn)[J]. 周明明,高航,趙國安.  數(shù)據(jù)采集與處理. 2012(S2)
[8]計(jì)算機(jī)博弈中估值算法與博弈訓(xùn)練的研究[J]. 呂艷輝,宮瑞敏.  計(jì)算機(jī)工程. 2012(11)
[9]一種改進(jìn)的基于博弈樹模型的五子棋系統(tǒng)[J]. 楊云強(qiáng),吳姣.  科學(xué)技術(shù)與工程. 2012(05)
[10]一類非完備信息博弈的信息模型[J]. 馬驍,王軒,王曉龍.  計(jì)算機(jī)研究與發(fā)展. 2010(12)

博士論文
[1]計(jì)算機(jī)博弈問題的復(fù)雜性、理論解及相關(guān)搜索算法研究[D]. 高強(qiáng).東北大學(xué) 2016
[2]模糊神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法及收斂性研究[D]. 李龍.大連理工大學(xué) 2010

碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的射線圖像識(shí)別系統(tǒng)的研究[D]. 李玉.北華航天工業(yè)學(xué)院 2019
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的表情識(shí)別研究[D]. 陳航.南京郵電大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的蘋果表面?zhèn)套R(shí)別研究[D]. 高友文.南京郵電大學(xué) 2018
[4]國際跳棋完備信息博弈關(guān)鍵技術(shù)研究與系統(tǒng)設(shè)計(jì)[D]. 楊周鳳.沈陽航空航天大學(xué) 2018
[5]雙人博弈問題中的蒙特卡洛樹搜索算法的改進(jìn)[D]. 季輝.中國科學(xué)技術(shù)大學(xué) 2017
[6]五子棋計(jì)算機(jī)博弈系統(tǒng)的研究與設(shè)計(jì)[D]. 張效見.安徽大學(xué) 2017
[7]基于Alpha-Beta剪枝算法的黑白棋游戲的設(shè)計(jì)與開發(fā)[D]. 王增財(cái).內(nèi)蒙古大學(xué) 2016
[8]基于BP神經(jīng)網(wǎng)絡(luò)的五子棋自學(xué)習(xí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳橋.燕山大學(xué) 2016
[9]六子棋博弈中搜索技術(shù)的研究與實(shí)現(xiàn)[D]. 汪坤兵.安徽大學(xué) 2016
[10]愛恩斯坦棋計(jì)算機(jī)博弈系統(tǒng)的研究與實(shí)現(xiàn)[D]. 光洋.安徽大學(xué) 2016



本文編號(hào):2913127

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2913127.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶22012***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com