國(guó)際跳棋完備信息博弈關(guān)鍵技術(shù)研究與系統(tǒng)設(shè)計(jì)
發(fā)布時(shí)間:2023-05-07 06:13
計(jì)算機(jī)博弈是人工智能領(lǐng)域重要且極具挑戰(zhàn)性的研究方向,從2016年到2017年AlphaGo先后戰(zhàn)勝了專業(yè)圍棋選手和世界圍棋冠軍,計(jì)算機(jī)博弈也因此受到全世界的廣泛關(guān)注。本文針對(duì)完備信息博弈,以國(guó)際跳棋(100)為研究對(duì)象,設(shè)計(jì)并實(shí)現(xiàn)了國(guó)際跳棋計(jì)算機(jī)博弈系統(tǒng),重點(diǎn)研究和分析了國(guó)際跳棋計(jì)算機(jī)博弈的關(guān)鍵技術(shù),提出了新的評(píng)估和搜索算法,增強(qiáng)了棋力。本文的主要研究工作如下:(1)提出了基于專家知識(shí)的棋子價(jià)值矩陣的評(píng)估算法。傳統(tǒng)評(píng)估方法在面對(duì)多變復(fù)雜的棋局時(shí)難以采取積極應(yīng)對(duì)的措施。針對(duì)這些不足,首先根據(jù)專家知識(shí)對(duì)整個(gè)棋局的棋子分布進(jìn)行分類處理,將分類出來(lái)的不同棋子采用不同的方法進(jìn)行計(jì)算對(duì)比;然后,利用棋子價(jià)值矩陣對(duì)評(píng)估進(jìn)行對(duì)應(yīng)加分;最后將得到的每類不同棋子的值進(jìn)行加權(quán)處理,得到新的評(píng)估函數(shù)。實(shí)驗(yàn)表明,該方法對(duì)棋局的評(píng)估效率提升效果明顯。(2)提出了基于蒙特卡洛樹搜索(Monte Carlo Tree Search,MCTS)的UCT(UCB applied to Tree)算法的排序策略。針對(duì)選擇落子點(diǎn)時(shí)沒(méi)有規(guī)律可循,而導(dǎo)致很多優(yōu)秀的可選點(diǎn)容易被忽略這個(gè)問(wèn)題,提出了新的方法,即在UCB(Upper ...
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景與意義
1.1.1 計(jì)算機(jī)博弈概述
1.1.2 計(jì)算機(jī)博弈的研究意義
1.2 國(guó)內(nèi)外相關(guān)研究進(jìn)展
1.2.1 國(guó)內(nèi)研究
1.2.2 國(guó)外研究
1.3 本文主要研究思路
第2章 國(guó)際跳棋計(jì)算機(jī)博弈概述
2.1 國(guó)際跳棋簡(jiǎn)介
2.1.1 國(guó)際跳棋起源
2.1.2 國(guó)際跳棋基本規(guī)則
2.2 博弈樹
2.2.1 狀態(tài)空間
2.2.2 博弈樹的作用
2.3 博弈的復(fù)雜度
2.4 計(jì)算機(jī)博弈求解的基本搜索方法
2.4.1 極大極小算法
2.4.2 Alpha-Beta剪枝算法
2.5 本章小結(jié)
第3章 國(guó)際跳棋靜態(tài)評(píng)估算法的研究與實(shí)現(xiàn)
3.1 國(guó)際跳棋評(píng)估研究與分析
3.2 國(guó)際跳棋評(píng)估函數(shù)的設(shè)計(jì)
3.2.1 棋盤狀態(tài)特征值計(jì)算
3.2.2 中間位置的棋子特征值計(jì)算
3.2.3 棋子形成的列的特征值的計(jì)算
3.2.4 進(jìn)度平衡因子特征值計(jì)算
3.2.5 棋子價(jià)值矩陣
3.3 評(píng)估函數(shù)的算法實(shí)現(xiàn)
3.3.1 評(píng)估特征系數(shù)的參數(shù)優(yōu)化
3.3.2 評(píng)估函數(shù)實(shí)驗(yàn)及分析
3.4 本章小結(jié)
第4章 基于MCTS的UCT的應(yīng)用與改進(jìn)
4.1 蒙特卡羅方法的概述
4.2 UCB算法
4.3 蒙特卡洛樹搜索
4.4 UCT算法在計(jì)算機(jī)國(guó)際跳棋博弈中的應(yīng)用
4.5 基于MCTS的UCT的改進(jìn)
4.5.1 落子點(diǎn)排序與優(yōu)化
4.5.2 實(shí)驗(yàn)與分析
4.6 本章小結(jié)
第5章 國(guó)際跳棋計(jì)算機(jī)博弈系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 博弈平臺(tái)的設(shè)計(jì)
5.2 數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì)
5.2.1 棋盤要素結(jié)構(gòu)設(shè)計(jì)
5.2.2 哈希函數(shù)
5.3 界面顯示
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表(含錄用)的學(xué)術(shù)論文
本文編號(hào):3810443
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景與意義
1.1.1 計(jì)算機(jī)博弈概述
1.1.2 計(jì)算機(jī)博弈的研究意義
1.2 國(guó)內(nèi)外相關(guān)研究進(jìn)展
1.2.1 國(guó)內(nèi)研究
1.2.2 國(guó)外研究
1.3 本文主要研究思路
第2章 國(guó)際跳棋計(jì)算機(jī)博弈概述
2.1 國(guó)際跳棋簡(jiǎn)介
2.1.1 國(guó)際跳棋起源
2.1.2 國(guó)際跳棋基本規(guī)則
2.2 博弈樹
2.2.1 狀態(tài)空間
2.2.2 博弈樹的作用
2.3 博弈的復(fù)雜度
2.4 計(jì)算機(jī)博弈求解的基本搜索方法
2.4.1 極大極小算法
2.4.2 Alpha-Beta剪枝算法
2.5 本章小結(jié)
第3章 國(guó)際跳棋靜態(tài)評(píng)估算法的研究與實(shí)現(xiàn)
3.1 國(guó)際跳棋評(píng)估研究與分析
3.2 國(guó)際跳棋評(píng)估函數(shù)的設(shè)計(jì)
3.2.1 棋盤狀態(tài)特征值計(jì)算
3.2.2 中間位置的棋子特征值計(jì)算
3.2.3 棋子形成的列的特征值的計(jì)算
3.2.4 進(jìn)度平衡因子特征值計(jì)算
3.2.5 棋子價(jià)值矩陣
3.3 評(píng)估函數(shù)的算法實(shí)現(xiàn)
3.3.1 評(píng)估特征系數(shù)的參數(shù)優(yōu)化
3.3.2 評(píng)估函數(shù)實(shí)驗(yàn)及分析
3.4 本章小結(jié)
第4章 基于MCTS的UCT的應(yīng)用與改進(jìn)
4.1 蒙特卡羅方法的概述
4.2 UCB算法
4.3 蒙特卡洛樹搜索
4.4 UCT算法在計(jì)算機(jī)國(guó)際跳棋博弈中的應(yīng)用
4.5 基于MCTS的UCT的改進(jìn)
4.5.1 落子點(diǎn)排序與優(yōu)化
4.5.2 實(shí)驗(yàn)與分析
4.6 本章小結(jié)
第5章 國(guó)際跳棋計(jì)算機(jī)博弈系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 博弈平臺(tái)的設(shè)計(jì)
5.2 數(shù)據(jù)結(jié)構(gòu)的設(shè)計(jì)
5.2.1 棋盤要素結(jié)構(gòu)設(shè)計(jì)
5.2.2 哈希函數(shù)
5.3 界面顯示
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表(含錄用)的學(xué)術(shù)論文
本文編號(hào):3810443
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3810443.html
最近更新
教材專著