中國象棋計算機博弈中搜索算法的研究與改進

發(fā)布時間：2016-10-26 17:49

本文關鍵詞：機器自學習博弈策略研究與實現(xiàn)，由筆耕文化傳播整理發(fā)布。

《河北大學》 2010年

郭秀麗

【摘要】： 在人工智能領域,機器博弈始終是一個重要的組成部分。自從計算機問世以來,人們?yōu)榱俗層嬎銠C具有與人類棋手一樣的博弈能力,進行了大量的研究和實驗。機器棋手和人類棋手之間也展開了長達幾十年的競賽。其中最廣為人知的要數(shù)“深藍”在國際象棋上所取得的成就�！吧钏{”的成功標志著計算機棋手戰(zhàn)勝人類頂級大師已經(jīng)從夢想變成了現(xiàn)實。而中國象棋的計算機博弈研究比國際象棋要落后三、四十年。雖然起步晚,但也取得了一定的成績,出現(xiàn)了一大批具有高水平的象棋程序。本文針對中國象棋博弈系統(tǒng)進行研究,介紹了中國象棋計算機博弈的關鍵技術,總結并比較了不同的搜索算法、搜索策略在實戰(zhàn)中的不同效果,分析了評估函數(shù)和輔助搜索機制在系統(tǒng)中所起的作用,并在研究的基礎上實現(xiàn)了基于最佳優(yōu)先搜索策略的算法,設計并改進了符合此算法的評估函數(shù),使系統(tǒng)能夠達到一定的實戰(zhàn)水平。實驗結果表明這種改進的評估函數(shù)對于最佳優(yōu)先搜索的算法而言是有效的。

【關鍵詞】：
【學位授予單位】：河北大學
【學位級別】：碩士
【學位授予年份】：2010
【分類號】：O225
【目錄】：

摘要5-6

Abstract6-9

第1章緒論9-13

1.1 研究背景9-10

1.2 中國象棋機器博弈研究的發(fā)展狀況10-12

1.3 中國象棋機器博弈簡介12

1.4 本文結構12-13

第2章數(shù)據(jù)結構與表示13-19

2.1 棋盤結構13-14

2.2 棋子表示14-15

2.3 著法生成15-17

2.4 局面存儲17-18

2.5 本章小結18-19

第3章中國象棋的評估函數(shù)19-25

3.1 經(jīng)驗評估函數(shù)19-22

3.1.1 棋子本身價值19-20

3.1.2 棋子位置附加值20

3.1.3 棋子相互作用值20-21

3.1.4 經(jīng)驗函數(shù)的一般形式21-22

3.2 實驗評估函數(shù)22-23

3.3 自學習評估函數(shù)23-24

3.4 本章小結24-25

第4章經(jīng)典搜索算法25-36

4.1 基礎的極大極小算法25-27

4.2 alpha-beta剪枝算法27-29

4.3 小窗口搜索29-31

4.3.1 渴望搜索29-30

4.3.2 最小窗口搜索30-31

4.4 克服水平效應31-33

4.5 充分利用經(jīng)驗知識33-34

4.5.1 置換表法33

4.5.2 歷史表法和著法排序33-34

4.6 實驗結果34-36

第5章基于最佳優(yōu)先的搜索方法36-44

5.1 SSS*與A*搜索36-37

5.2 分支定界搜索37

5.3 B*算法37-41

5.4 應用新的評估函數(shù)41-44

第6章結束語44-46

參考文獻46-48

致謝48-49

攻讀碩士學位期間科研工作情況49-50

下載全文更多同類文獻

CAJ全文下載

(如何獲取全文？歡迎：購買知網(wǎng)充值卡、在線充值、在線咨詢)

CAJViewer閱讀器支持CAJ、PDF文件格式

【參考文獻】

中國期刊全文數(shù)據(jù)庫前4條

1 王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統(tǒng)評估函數(shù)的自適應遺傳算法實現(xiàn)[J];東北大學學報(自然科學版);2005年10期

2 馬占欣;李亞;陸玉昌;;用遺傳算法解決博弈問題[J];河南科學;2007年02期

3 魏欽剛;王驕;徐心和;南曉斐;;中國象棋計算機博弈開局庫研究與設計[J];智能系統(tǒng)學報;2007年01期

4 徐心和;王驕;;中國象棋計算機博弈關鍵技術分析[J];小型微型計算機系統(tǒng);2006年06期

中國碩士學位論文全文數(shù)據(jù)庫前3條

1 莫建文;機器自學習博弈策略研究與實現(xiàn)[D];廣西師范大學;2002年

2 付強;基于激勵學習的中國象棋研究[D];長沙理工大學;2006年

3 危春波;中國象棋博弈系統(tǒng)的研究與實現(xiàn)[D];昆明理工大學;2008年

【共引文獻】

中國期刊全文數(shù)據(jù)庫前10條

1 李春貴,吳滄浦,劉永信;一種集成規(guī)劃的SARSA(λ)強化學習算法[J];北京理工大學學報;2002年03期

2 林海,孫吉貴;預測及其主要模型的實現(xiàn)系統(tǒng)[J];吉林大學學報(信息科學版);2002年04期

3 王曉鵬;王驕;徐心和;鄭新穎;;中國象棋與國際象棋比較分析[J];重慶工學院學報(自然科學版);2007年01期

4 王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統(tǒng)評估函數(shù)的自適應遺傳算法實現(xiàn)[J];東北大學學報(自然科學版);2005年10期

5 呂志來,張保會,哈恒旭;一種變結構的時間序列預測算法及其在電力系統(tǒng)暫態(tài)穩(wěn)定預測中的應用[J];電工技術學報;2002年03期

6 秦斌 ,王欣 ,吳敏;基于RBF神經(jīng)網(wǎng)絡的鐵水硅含量預報模型[J];電氣傳動;2002年03期

7 殷萇茗,陳煥文,謝麗娟;樣本有限關聯(lián)值遞歸Q學習算法及其收斂性證明[J];計算機研究與發(fā)展;2002年09期

8 顧國昌,仲宇,張汝波;一種新的多智能體強化學習算法及其在多機器人協(xié)作任務中的應用[J];機器人;2003年04期

9 謝志鵬,蔡燦輝;游戲地圖最短路徑搜索設計與實現(xiàn)[J];計算機工程與應用;2005年24期

10 朱全民;陳松喬;;五子棋算法的研究與思考[J];計算技術與自動化;2006年02期

中國重要會議論文全文數(shù)據(jù)庫前10條

1 胡光華;;平均準則TD策略迭代算法[A];中國運籌學會第六屆學術交流會論文集（上卷）[C];2000年

2 胡光華;殷英;李世云;;即時差分策略迭代算法[A];中國運籌學會第七屆學術交流會論文集（下卷）[C];2004年

3 王直杰;方建安;邵世煌;;一種增強式學習算法及其在控制中的應用[A];1996中國控制與決策學術年會論文集[C];1996年

4 王洪巖;朱峰;張雪峰;李玉倩;安爽;徐心和;;一種基于粗神經(jīng)網(wǎng)絡的中國象棋機器博弈評估實現(xiàn)[A];2007中國控制與決策學術年會論文集[C];2007年

5 徐心和;石鴻雁;;一個空戰(zhàn)實例中的混合對策問題[A];2007中國控制與決策學術年會論文集[C];2007年

6 朱峰;張雪峰;徐心和;;關于機器博弈中的逐步展開型對策的一點討論[A];2007中國控制與決策學術年會論文集[C];2007年

7 陳春林;陳宗海;卓睿;;分層式強化學習的定性空間表達[A];’2004系統(tǒng)仿真技術及其應用學術交流會論文集[C];2004年

8 徐義春;韓芳;;結合TD(0)的馬爾可夫鏈擾動分析求解算法[A];’2004系統(tǒng)仿真技術及其應用學術交流會論文集[C];2004年

9 任燚;陳宗海;;一種強化學習算法應用于多移動機器人的覓食實例研究[A];’2004系統(tǒng)仿真技術及其應用學術交流會論文集[C];2004年

10 徐心和;王浩;孔凡禹;;事件對策理論及在棋類游戲中的應用[A];2007年中國智能自動化會議論文集[C];2007年

中國博士學位論文全文數(shù)據(jù)庫前10條

1 張濤;非線性系統(tǒng)控制策略的研究[D];浙江大學;2001年

2 徐昕;增強學習及其在移動機器人導航與控制中的應用研究[D];國防科學技術大學;2002年

3 佘震宇;復雜經(jīng)濟系統(tǒng)演化建模研究[D];天津大學;2003年

4 李四明;基于智能Agent的網(wǎng)上農(nóng)業(yè)信息挖掘研究[D];中國農(nóng)業(yè)大學;2003年

5 趙黎明;災害管理系統(tǒng)研究[D];天津大學;2003年

6 仲宇;分布式強化學習理論及在多機器人中的應用研究[D];哈爾濱工程大學;2003年

7 張雙民;群體Agent合作求解方法的研究[D];清華大學;2004年

8 楊東勇;多機器人協(xié)作的學習與進化方法[D];浙江大學;2005年

9 王醒策;基于強化學習和群集智能方法的多機器人協(xié)作協(xié)調(diào)研究[D];哈爾濱工程大學;2005年

10 莊曉東;多移動機器人運動控制策略的強化學習研究[D];中國海洋大學;2005年

中國碩士學位論文全文數(shù)據(jù)庫前10條

1 王醒策;基于強化學習的多機器人編隊方法研究[D];哈爾濱工程大學;2002年

2 張必勇;強化學習在用戶學習中的應用研究[D];太原理工大學;2003年

3 趙秀粉;藍牙技術及多代理技術在車間控制系統(tǒng)中的應用研究[D];重慶大學;2003年

4 宋梅萍;多移動機器人協(xié)作任務的分布式?jīng)Q策控制系統(tǒng)[D];哈爾濱工程大學;2003年

5 鄒丹;自主式水下機器人運動規(guī)劃技術[D];哈爾濱工程大學;2003年

6 莫建文;機器自學習博弈策略研究與實現(xiàn)[D];廣西師范大學;2002年

7 羅寧泉;增強學習在共面雙機空戰(zhàn)格斗中的應用[D];沈陽工業(yè)大學;2003年

8 滕軼棟;移動通信系統(tǒng)信道分配算法研究[D];浙江工業(yè)大學;2004年

9 陳雪江;基于強化學習的多機器人協(xié)作機制研究[D];浙江工業(yè)大學;2004年

10 孫光余;強化學習及其在空中攔截中的應用[D];沈陽工業(yè)大學;2004年

【二級參考文獻】

中國期刊全文數(shù)據(jù)庫前10條

1 王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統(tǒng)評估函數(shù)的自適應遺傳算法實現(xiàn)[J];東北大學學報(自然科學版);2005年10期

2 嚴小衛(wèi),莫建文;智能五子棋的設計與實現(xiàn)[J];廣西師范大學學報(自然科學版);1999年04期

3 廖家平,舒軍,王粟;基于 PDC-PROLOG 自學習機器博弈[J];湖北工學院學報;1997年04期

4 陳煥文,謝麗娟,謝建平;一類值函數(shù)激勵學習的遺忘算法[J];計算機研究與發(fā)展;2001年04期

5 李寧,高陽,陸鑫,陳世福;一種基于強化學習的學習Agent[J];計算機研究與發(fā)展;2001年09期

6 陸鑫,高陽,李寧,陳世福;基于神經(jīng)網(wǎng)絡的強化學習算法研究[J];計算機研究與發(fā)展;2002年08期

7 殷萇茗,陳煥文,謝麗娟;樣本有限關聯(lián)值遞歸Q學習算法及其收斂性證明[J];計算機研究與發(fā)展;2002年09期

8 張偉,王一川,石純一;Agent組織規(guī)則的再勵學習[J];計算機研究與發(fā)展;2003年03期

9 謝克明,郭紅波,謝剛,續(xù)欣瑩;人工免疫算法及其應用[J];計算機工程與應用;2005年20期

10 莫建文,林士敏,張順嵐;基于TD強化學習智能博弈程序的設計與實現(xiàn)[J];計算機應用;2004年S1期

中國碩士學位論文全文數(shù)據(jù)庫前2條

1 王騏;博弈樹搜索算法的研究及改進[D];浙江大學;2006年

2 張賾;計算機中國象棋博弈中的二次估值方法及其優(yōu)化的研究[D];東北大學;2006年

中國知網(wǎng)廣告投放

中國象棋計算機博弈中搜索算法的研究與改進

《中國學術期刊（光盤版）》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術股份有限公司
地址：北京清華大學 84-48信箱大眾知識服務
京ICP證040441號
互聯(lián)網(wǎng)出版許可證新出網(wǎng)證（京）字008號
出版物經(jīng)營許可證新出發(fā)京批字第直0595號

訂購熱線：400-819-9993 010-62982499
服務熱線：010-62985026 010-62791813
在線咨詢：
傳真：010-62780361
京公網(wǎng)安備11010802020475號

本文關鍵詞：機器自學習博弈策略研究與實現(xiàn)，由筆耕文化傳播整理發(fā)布。

，

本文編號：154479

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/rengongzhinen/154479.html

上一篇：五子棋可行性研究報告
下一篇：基于CA模型的城市用地擴張模擬研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

中國象棋計算機博弈中搜索算法的研究與改進