中國象棋計算機博弈中搜索算法的研究與改進
本文關鍵詞:機器自學習博弈策略研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
《河北大學》 2010年
中國象棋計算機博弈中搜索算法的研究與改進
郭秀麗
【摘要】: 在人工智能領域,機器博弈始終是一個重要的組成部分。自從計算機問世以來,人們?yōu)榱俗層嬎銠C具有與人類棋手一樣的博弈能力,進行了大量的研究和實驗。機器棋手和人類棋手之間也展開了長達幾十年的競賽。其中最廣為人知的要數(shù)“深藍”在國際象棋上所取得的成就!吧钏{”的成功標志著計算機棋手戰(zhàn)勝人類頂級大師已經(jīng)從夢想變成了現(xiàn)實。 而中國象棋的計算機博弈研究比國際象棋要落后三、四十年。雖然起步晚,但也取得了一定的成績,出現(xiàn)了一大批具有高水平的象棋程序。本文針對中國象棋博弈系統(tǒng)進行研究,介紹了中國象棋計算機博弈的關鍵技術,總結并比較了不同的搜索算法、搜索策略在實戰(zhàn)中的不同效果,分析了評估函數(shù)和輔助搜索機制在系統(tǒng)中所起的作用,并在研究的基礎上實現(xiàn)了基于最佳優(yōu)先搜索策略的算法,設計并改進了符合此算法的評估函數(shù),使系統(tǒng)能夠達到一定的實戰(zhàn)水平。實驗結果表明這種改進的評估函數(shù)對于最佳優(yōu)先搜索的算法而言是有效的。
【關鍵詞】:
【學位授予單位】:河北大學
【學位級別】:碩士
【學位授予年份】:2010
【分類號】:O225
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統(tǒng)評估函數(shù)的自適應遺傳算法實現(xiàn)[J];東北大學學報(自然科學版);2005年10期
2 馬占欣;李亞;陸玉昌;;用遺傳算法解決博弈問題[J];河南科學;2007年02期
3 魏欽剛;王驕;徐心和;南曉斐;;中國象棋計算機博弈開局庫研究與設計[J];智能系統(tǒng)學報;2007年01期
4 徐心和;王驕;;中國象棋計算機博弈關鍵技術分析[J];小型微型計算機系統(tǒng);2006年06期
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 莫建文;機器自學習博弈策略研究與實現(xiàn)[D];廣西師范大學;2002年
2 付強;基于激勵學習的中國象棋研究[D];長沙理工大學;2006年
3 危春波;中國象棋博弈系統(tǒng)的研究與實現(xiàn)[D];昆明理工大學;2008年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李春貴,吳滄浦,劉永信;一種集成規(guī)劃的SARSA(λ)強化學習算法[J];北京理工大學學報;2002年03期
2 林海,孫吉貴;預測及其主要模型的實現(xiàn)系統(tǒng)[J];吉林大學學報(信息科學版);2002年04期
3 王曉鵬;王驕;徐心和;鄭新穎;;中國象棋與國際象棋比較分析[J];重慶工學院學報(自然科學版);2007年01期
4 王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統(tǒng)評估函數(shù)的自適應遺傳算法實現(xiàn)[J];東北大學學報(自然科學版);2005年10期
5 呂志來,張保會,哈恒旭;一種變結構的時間序列預測算法及其在電力系統(tǒng)暫態(tài)穩(wěn)定預測中的應用[J];電工技術學報;2002年03期
6 秦斌 ,王欣 ,吳敏;基于RBF神經(jīng)網(wǎng)絡的鐵水硅含量預報模型[J];電氣傳動;2002年03期
7 殷萇茗,陳煥文,謝麗娟;樣本有限關聯(lián)值遞歸Q學習算法及其收斂性證明[J];計算機研究與發(fā)展;2002年09期
8 顧國昌,仲宇,張汝波;一種新的多智能體強化學習算法及其在多機器人協(xié)作任務中的應用[J];機器人;2003年04期
9 謝志鵬,蔡燦輝;游戲地圖最短路徑搜索設計與實現(xiàn)[J];計算機工程與應用;2005年24期
10 朱全民;陳松喬;;五子棋算法的研究與思考[J];計算技術與自動化;2006年02期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 胡光華;;平均準則TD策略迭代算法[A];中國運籌學會第六屆學術交流會論文集(上卷)[C];2000年
2 胡光華;殷英;李世云;;即時差分策略迭代算法[A];中國運籌學會第七屆學術交流會論文集(下卷)[C];2004年
3 王直杰;方建安;邵世煌;;一種增強式學習算法及其在控制中的應用[A];1996中國控制與決策學術年會論文集[C];1996年
4 王洪巖;朱峰;張雪峰;李玉倩;安爽;徐心和;;一種基于粗神經(jīng)網(wǎng)絡的中國象棋機器博弈評估實現(xiàn)[A];2007中國控制與決策學術年會論文集[C];2007年
5 徐心和;石鴻雁;;一個空戰(zhàn)實例中的混合對策問題[A];2007中國控制與決策學術年會論文集[C];2007年
6 朱峰;張雪峰;徐心和;;關于機器博弈中的逐步展開型對策的一點討論[A];2007中國控制與決策學術年會論文集[C];2007年
7 陳春林;陳宗海;卓睿;;分層式強化學習的定性空間表達[A];’2004系統(tǒng)仿真技術及其應用學術交流會論文集[C];2004年
8 徐義春;韓芳;;結合TD(0)的馬爾可夫鏈擾動分析求解算法[A];’2004系統(tǒng)仿真技術及其應用學術交流會論文集[C];2004年
9 任燚;陳宗海;;一種強化學習算法應用于多移動機器人的覓食實例研究[A];’2004系統(tǒng)仿真技術及其應用學術交流會論文集[C];2004年
10 徐心和;王浩;孔凡禹;;事件對策理論及在棋類游戲中的應用[A];2007年中國智能自動化會議論文集[C];2007年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 張濤;非線性系統(tǒng)控制策略的研究[D];浙江大學;2001年
2 徐昕;增強學習及其在移動機器人導航與控制中的應用研究[D];國防科學技術大學;2002年
3 佘震宇;復雜經(jīng)濟系統(tǒng)演化建模研究[D];天津大學;2003年
4 李四明;基于智能Agent的網(wǎng)上農(nóng)業(yè)信息挖掘研究[D];中國農(nóng)業(yè)大學;2003年
5 趙黎明;災害管理系統(tǒng)研究[D];天津大學;2003年
6 仲宇;分布式強化學習理論及在多機器人中的應用研究[D];哈爾濱工程大學;2003年
7 張雙民;群體Agent合作求解方法的研究[D];清華大學;2004年
8 楊東勇;多機器人協(xié)作的學習與進化方法[D];浙江大學;2005年
9 王醒策;基于強化學習和群集智能方法的多機器人協(xié)作協(xié)調(diào)研究[D];哈爾濱工程大學;2005年
10 莊曉東;多移動機器人運動控制策略的強化學習研究[D];中國海洋大學;2005年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王醒策;基于強化學習的多機器人編隊方法研究[D];哈爾濱工程大學;2002年
2 張必勇;強化學習在用戶學習中的應用研究[D];太原理工大學;2003年
3 趙秀粉;藍牙技術及多代理技術在車間控制系統(tǒng)中的應用研究[D];重慶大學;2003年
4 宋梅萍;多移動機器人協(xié)作任務的分布式?jīng)Q策控制系統(tǒng)[D];哈爾濱工程大學;2003年
5 鄒丹;自主式水下機器人運動規(guī)劃技術[D];哈爾濱工程大學;2003年
6 莫建文;機器自學習博弈策略研究與實現(xiàn)[D];廣西師范大學;2002年
7 羅寧泉;增強學習在共面雙機空戰(zhàn)格斗中的應用[D];沈陽工業(yè)大學;2003年
8 滕軼棟;移動通信系統(tǒng)信道分配算法研究[D];浙江工業(yè)大學;2004年
9 陳雪江;基于強化學習的多機器人協(xié)作機制研究[D];浙江工業(yè)大學;2004年
10 孫光余;強化學習及其在空中攔截中的應用[D];沈陽工業(yè)大學;2004年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王驕,王濤,羅艷紅,徐心和;中國象棋計算機博弈系統(tǒng)評估函數(shù)的自適應遺傳算法實現(xiàn)[J];東北大學學報(自然科學版);2005年10期
2 嚴小衛(wèi),莫建文;智能五子棋的設計與實現(xiàn)[J];廣西師范大學學報(自然科學版);1999年04期
3 廖家平,舒軍,王粟;基于 PDC-PROLOG 自學習機器博弈[J];湖北工學院學報;1997年04期
4 陳煥文,謝麗娟,謝建平;一類值函數(shù)激勵學習的遺忘算法[J];計算機研究與發(fā)展;2001年04期
5 李寧,高陽,陸鑫,陳世福;一種基于強化學習的學習Agent[J];計算機研究與發(fā)展;2001年09期
6 陸鑫,高陽,李寧,陳世福;基于神經(jīng)網(wǎng)絡的強化學習算法研究[J];計算機研究與發(fā)展;2002年08期
7 殷萇茗,陳煥文,謝麗娟;樣本有限關聯(lián)值遞歸Q學習算法及其收斂性證明[J];計算機研究與發(fā)展;2002年09期
8 張偉,王一川,石純一;Agent組織規(guī)則的再勵學習[J];計算機研究與發(fā)展;2003年03期
9 謝克明,郭紅波,謝剛,續(xù)欣瑩;人工免疫算法及其應用[J];計算機工程與應用;2005年20期
10 莫建文,林士敏,張順嵐;基于TD強化學習智能博弈程序的設計與實現(xiàn)[J];計算機應用;2004年S1期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 王騏;博弈樹搜索算法的研究及改進[D];浙江大學;2006年
2 張賾;計算機中國象棋博弈中的二次估值方法及其優(yōu)化的研究[D];東北大學;2006年
《中國學術期刊(光盤版)》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術股份有限公司
地址:北京清華大學 84-48信箱 大眾知識服務
京ICP證040441號
互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號
出版物經(jīng)營許可證 新出發(fā)京批字第直0595號
訂購熱線:400-819-9993 010-62982499
服務熱線:010-62985026 010-62791813
在線咨詢:
傳真:010-62780361
京公網(wǎng)安備11010802020475號
本文關鍵詞:機器自學習博弈策略研究與實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:154479
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/154479.html