德州撲克計(jì)算機(jī)博弈智能決策模型研究
發(fā)布時(shí)間:2021-06-20 07:35
計(jì)算機(jī)博弈一直是人工智能最具挑戰(zhàn)性的研究方向之一。它也稱機(jī)器博弈,主要分為完全信息計(jì)算機(jī)博弈和不完全信息計(jì)算機(jī)博弈兩大類型,其中,完全信息計(jì)算機(jī)博弈是指博弈各方在博弈狀態(tài)、博弈進(jìn)程完全透明下的博弈,而不完全信息計(jì)算機(jī)博弈是指博弈各方的博弈狀態(tài)或過程信息不透明、或不完全透明下的博弈。論文中的德?lián)洳┺木蛯儆谑欠峭耆畔⒂?jì)算機(jī)博弈的一個(gè)實(shí)例,論文以它為應(yīng)用研究對象,探討人工智能技術(shù)在非完全信息博弈中的實(shí)際應(yīng)用。機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的一個(gè)研究熱點(diǎn),以谷歌阿爾法狗為代表的圍棋博弈程序,表現(xiàn)出了強(qiáng)大對弈能力,圍棋僅僅是雙人完全信息博弈棋類游戲,而德?lián)鋵儆趦扇嘶騼扇艘陨系姆峭耆畔⒉┺呐祁愑螒?因此,如何對照圍棋博弈方法將強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)相結(jié)合,并應(yīng)用于非完全信息的德?lián)洳┺闹?是計(jì)算機(jī)博弈領(lǐng)域亟待解決的問題。特別是強(qiáng)化學(xué)習(xí)面對德?lián)洳┺闹行畔⒉煌耆⒏呔S狀態(tài)空間、存在過估計(jì)問題、難以快速發(fā)現(xiàn)最優(yōu)解,以及難收斂等問題,極大地影響了博弈程序的戰(zhàn)力。論文針對上述問題,采用人工神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)相結(jié)合的方法,改進(jìn)強(qiáng)化學(xué)習(xí)算法,改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),研制德?lián)錄Q策模型,最后驗(yàn)證決策模型達(dá)到預(yù)期效果。論文具體研究工...
【文章來源】:重慶理工大學(xué)重慶市
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
籌碼數(shù)量80表示方法
5德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)435德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)5.1德?lián)洳┺南到y(tǒng)的構(gòu)造5.1.1系統(tǒng)模塊德?lián)洳┺南到y(tǒng)分為五個(gè)部分:博弈系統(tǒng)的表示方法、博弈系統(tǒng)的搜索引擎、博弈系統(tǒng)的博弈估值算法、博弈系統(tǒng)的規(guī)則解釋器以及博弈系統(tǒng)可視化模塊。如圖5-1和如圖5-2所示。圖5-1德?lián)洳┺南到y(tǒng)模塊圖5-2德?lián)洳┺南到y(tǒng)界面
5德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)435德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)5.1德?lián)洳┺南到y(tǒng)的構(gòu)造5.1.1系統(tǒng)模塊德?lián)洳┺南到y(tǒng)分為五個(gè)部分:博弈系統(tǒng)的表示方法、博弈系統(tǒng)的搜索引擎、博弈系統(tǒng)的博弈估值算法、博弈系統(tǒng)的規(guī)則解釋器以及博弈系統(tǒng)可視化模塊。如圖5-1和如圖5-2所示。圖5-1德?lián)洳┺南到y(tǒng)模塊圖5-2德?lián)洳┺南到y(tǒng)界面
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)應(yīng)用技術(shù)研究[J]. 毛勇華,桂小林,李前,賀興時(shí). 計(jì)算機(jī)應(yīng)用研究. 2016(11)
[2]阿法狗圍棋系統(tǒng)的簡要分析[J]. 田淵棟. 自動化學(xué)報(bào). 2016(05)
[3]四國軍棋游戲中搜索算法的實(shí)驗(yàn)與分析[J]. 陸慧,夏正友. 江南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(06)
[4]棋牌游戲與事件對策[J]. 徐心和,鄭新穎. 控制與決策. 2007(07)
[5]中國象棋計(jì)算機(jī)博弈關(guān)鍵技術(shù)分析[J]. 徐心和,王驕. 小型微型計(jì)算機(jī)系統(tǒng). 2006(06)
碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的3D游戲的非完備信息機(jī)器博弈研究[D]. 朱航宇.哈爾濱工業(yè)大學(xué) 2018
[2]計(jì)算機(jī)圍棋博弈中UCT算法的應(yīng)用及改進(jìn)[D]. 黃晶.北京郵電大學(xué) 2011
本文編號:3238768
【文章來源】:重慶理工大學(xué)重慶市
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
籌碼數(shù)量80表示方法
5德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)435德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)5.1德?lián)洳┺南到y(tǒng)的構(gòu)造5.1.1系統(tǒng)模塊德?lián)洳┺南到y(tǒng)分為五個(gè)部分:博弈系統(tǒng)的表示方法、博弈系統(tǒng)的搜索引擎、博弈系統(tǒng)的博弈估值算法、博弈系統(tǒng)的規(guī)則解釋器以及博弈系統(tǒng)可視化模塊。如圖5-1和如圖5-2所示。圖5-1德?lián)洳┺南到y(tǒng)模塊圖5-2德?lián)洳┺南到y(tǒng)界面
5德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)435德?lián)洳┺南到y(tǒng)的實(shí)現(xiàn)5.1德?lián)洳┺南到y(tǒng)的構(gòu)造5.1.1系統(tǒng)模塊德?lián)洳┺南到y(tǒng)分為五個(gè)部分:博弈系統(tǒng)的表示方法、博弈系統(tǒng)的搜索引擎、博弈系統(tǒng)的博弈估值算法、博弈系統(tǒng)的規(guī)則解釋器以及博弈系統(tǒng)可視化模塊。如圖5-1和如圖5-2所示。圖5-1德?lián)洳┺南到y(tǒng)模塊圖5-2德?lián)洳┺南到y(tǒng)界面
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)應(yīng)用技術(shù)研究[J]. 毛勇華,桂小林,李前,賀興時(shí). 計(jì)算機(jī)應(yīng)用研究. 2016(11)
[2]阿法狗圍棋系統(tǒng)的簡要分析[J]. 田淵棟. 自動化學(xué)報(bào). 2016(05)
[3]四國軍棋游戲中搜索算法的實(shí)驗(yàn)與分析[J]. 陸慧,夏正友. 江南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(06)
[4]棋牌游戲與事件對策[J]. 徐心和,鄭新穎. 控制與決策. 2007(07)
[5]中國象棋計(jì)算機(jī)博弈關(guān)鍵技術(shù)分析[J]. 徐心和,王驕. 小型微型計(jì)算機(jī)系統(tǒng). 2006(06)
碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的3D游戲的非完備信息機(jī)器博弈研究[D]. 朱航宇.哈爾濱工業(yè)大學(xué) 2018
[2]計(jì)算機(jī)圍棋博弈中UCT算法的應(yīng)用及改進(jìn)[D]. 黃晶.北京郵電大學(xué) 2011
本文編號:3238768
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3238768.html
最近更新
教材專著