具有自學(xué)習(xí)功能的計(jì)算機(jī)象棋博弈系統(tǒng)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:具有自學(xué)習(xí)功能的計(jì)算機(jī)象棋博弈系統(tǒng)的研究與實(shí)現(xiàn)
更多相關(guān)文章: 人工智能 中國(guó)象棋 估值函數(shù) 時(shí)間差分 神經(jīng)網(wǎng)絡(luò)
【摘要】: 計(jì)算機(jī)博弈是人工智能研究的一個(gè)重要分支,它的研究為人工智能帶來(lái)了很多重要的方法和理論,產(chǎn)生了廣泛的社會(huì)影響和學(xué)術(shù)影響。國(guó)內(nèi)外對(duì)博弈的研究已經(jīng)較為廣泛。近年來(lái)隨著研究的不斷深入,計(jì)算機(jī)中國(guó)象棋博弈越來(lái)越成為繼國(guó)際象棋之后計(jì)算機(jī)博弈研究的熱點(diǎn)之一。 本文在對(duì)相關(guān)文獻(xiàn)進(jìn)行了全面的綜述之后,圍繞計(jì)算機(jī)中國(guó)象棋博弈中的若干關(guān)鍵問題進(jìn)行了研究和改進(jìn),在此之上開發(fā)了一個(gè)具有自學(xué)習(xí)功能的中國(guó)象棋博弈系統(tǒng),,論文主要研究了以下3個(gè)方面的問題: 第一、研究了一些博弈的關(guān)鍵技術(shù),包括棋盤和棋子在計(jì)算機(jī)中的表示問題,走法生成,搜索技術(shù),估值函數(shù)等。 第二、研究了建立在博弈樹的極大極小搜索技術(shù)基礎(chǔ)之上的各種優(yōu)化方法和局面靜態(tài)估值函數(shù)。論文主要討論了4個(gè)方面的優(yōu)化方法,并根據(jù)應(yīng)用提出了具體的組合方案;然后分析了針對(duì)評(píng)估局面優(yōu)劣的靜態(tài)估值函數(shù)的一些優(yōu)點(diǎn)和缺點(diǎn)。 第三、針對(duì)靜態(tài)估值函數(shù)依賴人類棋類知識(shí)和評(píng)估不夠準(zhǔn)確的問題,本文提出了一種解決方案:用BP神經(jīng)網(wǎng)絡(luò)結(jié)合時(shí)間差分算法代替?zhèn)鹘y(tǒng)的線性估值函數(shù),并構(gòu)建系統(tǒng)和實(shí)驗(yàn)方案對(duì)其相關(guān)的問題進(jìn)行了討論。 本文實(shí)現(xiàn)的象棋系統(tǒng),通過對(duì)估值部分的改進(jìn)和增強(qiáng),提高了棋力,具有一定的使用和研究意義。
【關(guān)鍵詞】:人工智能 中國(guó)象棋 估值函數(shù) 時(shí)間差分 神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:TP311.52
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-13
- 1.1 選題背景10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-12
- 1.3 課題的主要工作和論文結(jié)構(gòu)12-13
- 第2章 計(jì)算機(jī)博弈關(guān)鍵技術(shù)13-23
- 2.1 棋盤的表示14-15
- 2.2 著法生成15-16
- 2.3 搜索算法16-21
- 2.3.1 博弈樹的基本概念和思想16-17
- 2.3.2 極大極小值算法17-18
- 2.3.3 負(fù)極大值法18-19
- 2.3.4 Alpha-Beta 搜索算法19-21
- 2.4 估值函數(shù)21-22
- 2.5 本章小結(jié)22-23
- 第3章 搜索算法的優(yōu)化23-30
- 3.1 窗口探測(cè)23-25
- 3.1.1 渴望搜索23-24
- 3.1.2 極小窗口算法24-25
- 3.2 調(diào)整節(jié)點(diǎn)順序25-27
- 3.3 時(shí)間控制優(yōu)化27-28
- 3.4 內(nèi)存增強(qiáng)優(yōu)化28-29
- 3.5 本章小結(jié)29-30
- 第4章 靜態(tài)估值函數(shù)30-35
- 4.1 靜態(tài)估值函數(shù)的特點(diǎn)30
- 4.2 靜態(tài)估值方法的主要評(píng)估因素30-33
- 4.3 靜態(tài)估值方法存在的問題33
- 4.4 本章小結(jié)33-35
- 第5章 自學(xué)習(xí)功能的實(shí)現(xiàn)35-44
- 5.1 人工神經(jīng)網(wǎng)絡(luò)35-38
- 5.1.1 誤差反向傳播神經(jīng)網(wǎng)絡(luò)與學(xué)習(xí)規(guī)則36-37
- 5.1.2 學(xué)習(xí)過程具體步驟和流程圖37-38
- 5.2 時(shí)間差分算法38-39
- 5.3 結(jié)合時(shí)間差分算法的 BP 網(wǎng)絡(luò)39-40
- 5.4 自學(xué)習(xí)網(wǎng)絡(luò)40-42
- 5.4.1 網(wǎng)絡(luò)模型的建立40-41
- 5.4.2 樣本的選擇方式41-42
- 5.4.3 學(xué)習(xí)流程42
- 5.5 相關(guān)問題的討論42-43
- 5.5.1 輸入層編碼問題42-43
- 5.5.2 參數(shù)取值問題43
- 5.6 本章小結(jié)43-44
- 第6章 中國(guó)象棋系統(tǒng)的實(shí)現(xiàn)44-56
- 6.1 系統(tǒng)結(jié)構(gòu)組織44-45
- 6.2 系統(tǒng)詳細(xì)設(shè)計(jì)45-52
- 6.2.1 棋子和棋盤的表示45-46
- 6.2.2 走法生成器的設(shè)計(jì)46-48
- 6.2.3 搜索引擎的設(shè)計(jì)48-51
- 6.2.4 估值函數(shù)的設(shè)計(jì)51-52
- 6.3 實(shí)驗(yàn)結(jié)果和相關(guān)問題的討論52-55
- 6.4 本章小結(jié)55-56
- 結(jié)論56-57
- 參考文獻(xiàn)57-60
- 攻讀碩士學(xué)位期間發(fā)表的論文和取得的科研成果60-61
- 致謝61
【引證文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 陳業(yè)鵬;;基于Alpha-Beta搜索算法的中國(guó)象棋人機(jī)對(duì)戰(zhàn)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年04期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 宮瑞敏;基于增強(qiáng)學(xué)習(xí)的計(jì)算機(jī)博弈策略的研究與實(shí)現(xiàn)[D];沈陽(yáng)理工大學(xué);2011年
2 于超;博弈算法在中國(guó)象棋上的應(yīng)用[D];中國(guó)海洋大學(xué);2011年
3 宋興亮;中國(guó)象棋博弈樹搜索算法研究與實(shí)現(xiàn)[D];沈陽(yáng)工業(yè)大學(xué);2012年
4 邢勝;基于數(shù)據(jù)庫(kù)自學(xué)習(xí)的中國(guó)象棋研究[D];河北大學(xué);2009年
5 郭峰;中國(guó)象棋計(jì)算機(jī)博弈中的判別剪枝搜索研究[D];河北大學(xué);2009年
6 何玉林;瞬時(shí)差分方法在中國(guó)象棋計(jì)算機(jī)博弈中的應(yīng)用[D];河北大學(xué);2009年
7 張紅軍;計(jì)算機(jī)中國(guó)象棋界面和搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];西安理工大學(xué);2009年
8 閔文杰;六子棋計(jì)算機(jī)博弈關(guān)鍵技術(shù)研究[D];重慶交通大學(xué);2010年
9 杜向然;基于PSO的中國(guó)象棋評(píng)估函數(shù)的研究[D];河北大學(xué);2010年
10 劉雅靖;基于Alpha-Beta搜索算法的計(jì)算機(jī)博弈的研究與實(shí)現(xiàn)[D];大連交通大學(xué);2012年
本文編號(hào):949129
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/949129.html