基于蒙特卡洛樹搜索的計算機圍棋博弈研究
本文關鍵詞:基于蒙特卡洛樹搜索的計算機圍棋博弈研究,由筆耕文化傳播整理發(fā)布。
《大連海事大學》 2015年
基于蒙特卡洛樹搜索的計算機圍棋博弈研究
于永波
【摘要】:近年來,計算機軟硬件和互聯(lián)網(wǎng)迅猛發(fā)展,相關學科也在不斷進步。人工智能是長期以來的熱點話題,而計算機博弈是它的一個受到廣泛關注的研究方向。作為最復雜的博弈項目之一,具有挑戰(zhàn)性的圍棋能夠充分檢驗人工智能的發(fā)展水平,因此計算機圍棋博弈的研究在計算機博弈、人工智能乃至計算機科學領域占有重要的地位。由于圍棋知識規(guī)則不便歸納,搜索空間過于巨大,傳統(tǒng)計算機博弈的理論和方法目前均難以適用。近些年,在計算機性能大幅度提高的基礎上,計算機圍棋博弈采用蒙特卡洛方法進行動態(tài)評估,并引入了上限信心界應用樹算法,搜索的效率和評估的性能均得到了很大提升,計算機圍棋博弈程序的水平不斷提高。同時,這種聚類智能的計算方法不僅適用于圍棋,還適用于規(guī)劃決策類問題等其他許多問題,因此計算機圍棋博弈方面的研究成果有著重要的現(xiàn)實意義,可以有更廣闊的用武之地。由蒙特卡洛方法和上限信心界應用樹算法構成的蒙特卡洛樹搜索是當今高水平計算機圍棋程序普遍采用的較優(yōu)方法,但其仍有可完善之處。本文立足于蒙特卡洛樹搜索的思想和特點,針對蒙特卡洛方法和上限信心界應用樹算法存在的不足,提出了絕對剪枝策略和漸進展開策略兩大改進措施,并從理論上證明了改進的必要性和正確性。而后,本文選用了采用蒙特卡洛樹搜索的棋力很強的開源圍棋程序Fuego作為改進試驗程序,通過GoGui平臺使其改進前和改進后分別與另一高水平程序Pachi對弈,根據(jù)對局的用時和勝負進行驗證和分析。實驗結果表明,Fuego在用時略有下降的情況下勝率有所提高,這說明改進方案切實有效,具備一定的實用價值。
【關鍵詞】:
【學位授予單位】:大連海事大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP18
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 李德毅;肖俐平;;網(wǎng)絡時代的人工智能[J];中文信息學報;2008年02期
2 鄧超;吳霖;陳磊;袁梅宇;;局部UCT算法在圍棋死活題上的性能測試[J];信息技術;2013年03期
3 王巖;尹海麗;竇在祥;;蒙特卡羅方法應用研究[J];青島理工大學學報;2006年02期
4 周明明;高航;趙國安;;UCT算法在計算機圍棋中的應用與改進[J];數(shù)據(jù)采集與處理;2012年S2期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 岳鵬;計算機圍棋中的算法研究[D];西南大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 黃晶;計算機圍棋博弈中UCT算法的應用及改進[D];北京郵電大學;2011年
2 郭潔;圍棋人工智能中幾個上限值的研究[D];中南大學;2013年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 來水利;顏珩燁;朱雷;;RSM法優(yōu)化微波場下殼聚糖降解[J];北京工商大學學報(自然科學版);2008年03期
2 侯大志;賀曉玲;張孝雙;蔣洪暉;;基于蒙特卡羅仿真的多種二進制通信系統(tǒng)性能分析[J];電子設計工程;2012年06期
3 魯靖;卞樹檀;周帥;;基于蒙特卡羅仿真與逆向FTF的復雜系統(tǒng)可靠性分析[J];電子器件;2014年02期
4 張立嘉;茆家旭;;人工智能在下一代廣播電視網(wǎng)中的應用[J];廣播電視信息;2015年07期
5 余麗麗;李仲謹;朱雷;宋涼;;應用響應曲面法優(yōu)化N,N′-亞甲基雙丙烯酰胺交聯(lián)淀粉微球的合成工藝[J];化工進展;2008年03期
6 李仲謹;朱雷;余麗麗;宋涼;肖昊江;邱輝;;應用響應曲面優(yōu)化交聯(lián)淀粉微球的合成工藝[J];化學工程;2009年01期
7 利珊;;不確定性中的隨機性和模糊性[J];金華職業(yè)技術學院學報;2010年03期
8 黃克平;應浩;黃婷;張亞;;蒙特卡羅算法在室內(nèi)三維實時定位系統(tǒng)的應用[J];計量與測試技術;2008年09期
9 張?zhí)m江;張建福;;蒙特卡羅模擬法在排隊論中的應用[J];交通與運輸;2008年02期
10 柳高潔;顧克秋;;結合NSGA-Ⅱ算法和蒙特卡羅模擬技術實現(xiàn)結構的魯棒優(yōu)化[J];機械設計;2009年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 Li Fei;Ouyang Li;Wang Yajie;Dong Yanqiu;;Study of Strategy Selection Based on Phantom Go[A];第26屆中國控制與決策會議論文集[C];2014年
中國博士學位論文全文數(shù)據(jù)庫 前9條
1 揣媛媛;空間信息網(wǎng)格環(huán)境下的礦產(chǎn)資源證據(jù)權評價方法研究[D];吉林大學;2007年
2 馮國雙;中國癌癥高發(fā)現(xiàn)場評價與質量控制[D];北京大學;2008年
3 孫剛;限制性克立格法在礦產(chǎn)資源儲量估算中的應用[D];吉林大學;2008年
4 楊鵬;船舶六自由度運動模擬臺及其控制方法研究[D];哈爾濱工程大學;2008年
5 趙丕杰;LOD在直擴系統(tǒng)微弱信號檢測中的應用與研究[D];哈爾濱工程大學;2009年
6 張勤;浮法玻璃成形中傳熱與滲錫的數(shù)值模擬[D];清華大學;2011年
7 王富強;空間知識地圖構建理論和方法研究[D];解放軍信息工程大學;2013年
8 鄧文紅;基于知識管理的辦公系統(tǒng)智能化研究[D];西南交通大學;2014年
9 龔誼承;基于頻率類別的洪水過程模擬和廣義洪水風險分析與模擬[D];武漢大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 曹慶安;基于RS與GIS的安?h基本農(nóng)田保護區(qū)劃定研究[D];江西師范大學;2010年
2 王剛;生物科學視角下的類生命體生態(tài)設計[D];江南大學;2011年
3 黃晶;計算機圍棋博弈中UCT算法的應用及改進[D];北京郵電大學;2011年
4 王樹波;基于抽樣模擬技術的有色冶金配料過程優(yōu)化方法研究[D];中南大學;2011年
5 郭佳;多股流換熱器通道排列優(yōu)化設計研究[D];上海理工大學;2009年
6 常樂;長白山典型地區(qū)降雨分布型及洪澇災害預測研究[D];東北師范大學;2011年
7 李晶影;考慮局部應力集中的機械零部件可靠性靈敏度分析[D];吉林大學;2007年
8 李輝山;工程項目進度—費用協(xié)調控制的仿真實現(xiàn)研究[D];西安建筑科技大學;2007年
9 陳英;基于季節(jié)模型的通信話務量預測的研究與實施[D];北京郵電大學;2007年
10 牟磊;基于GIS和CA模型的土地利用變化研究[D];新疆大學;2007年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 沈傲東;羅立民;;基于蒙特卡羅積分的數(shù)字影像重建方法[J];東南大學學報(自然科學版);2008年06期
2 張振;顧治華;;機器博弈及其搜索算法的研究[J];電腦知識與技術;2008年24期
3 徐東升;周偉華;;基于馬爾科夫決策過程的貨物流的配給策略[J];管理工程學報;2009年04期
4 余磊;劉錦高;;一種圍棋中盤問題的計算機求解方法[J];華東師范大學學報(自然科學版);2008年01期
5 李德毅;劉坤;孫巖;韓明暢;;涌現(xiàn)計算:從無序掌聲到有序掌聲的虛擬現(xiàn)實[J];中國科學(E輯:信息科學);2007年10期
6 孫舒楊;劉大有;孫成敏;;二人博弈問題中單一納什均衡的搜索算法[J];吉林大學學報(理學版);2006年03期
7 谷蓉,劉學民,朱仲濤,周杰;一種圍棋定式的機器學習方法[J];計算機工程;2004年06期
8 廖里;圍棋死活問題的計算機求解[J];計算機應用;2005年11期
9 李德毅;肖俐平;;網(wǎng)絡時代的人工智能[J];中文信息學報;2008年02期
10 王魯明,戴汝為;在計算機圍棋中形象思維的研究[J];自動化學報;1997年04期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 黃晶;計算機圍棋博弈中UCT算法的應用及改進[D];北京郵電大學;2011年
2 陳磊;計算機圍棋領域概念網(wǎng)的設計與實現(xiàn)[D];北京郵電大學;2010年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 元丁;;令人驚訝的張冠李戴[J];新聞戰(zhàn)線;1992年09期
2 張文明;工作站環(huán)境中電路的蒙特卡洛分析[J];計算機應用研究;1997年02期
3 程康萱;;憶訪棋王衛(wèi)冕戰(zhàn)——蒙特卡洛瑣記[J];新聞三昧;1995年03期
4 董寬;;再見,蒙特卡洛——訪申辦2000年奧運會決戰(zhàn)紀實[J];新聞三昧;1994年01期
5 閔濤;張帆;;參數(shù)反演的微分進化蒙特卡洛算法[J];計算機工程與應用;2012年07期
6 葛麗萍;鄂英杰;;運用Crystal Ball & MS Project實現(xiàn)項目進度的蒙特卡洛風險分析[J];電腦編程技巧與維護;2013年08期
7 張建平;張鳳蓮;陶華;;基于混合蒙特卡洛算法的容差分配研究[J];計算機仿真;2009年10期
8 馬北北;;蒙特卡洛:舉世矚目的一天[J];青年記者;1994年01期
9 曲洪權;龐麗萍;李運澤;;序列蒙特卡洛濾波在衛(wèi)星傳熱反問題中的應用[J];系統(tǒng)仿真學報;2008年13期
10 錢鍵民;;雷達虛警概率模擬與重要采樣技術[J];火控雷達技術;1984年02期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 程磊;房永智;王剛;;蒙特卡洛計算方法與作戰(zhàn)毀傷模擬決策分析[A];中國系統(tǒng)工程學會決策科學專業(yè)委員會第六屆學術年會論文集[C];2005年
2 周永宏;鄭大偉;廖新浩;;相關分析顯著水平的蒙特卡洛模擬檢驗[A];中國地球物理學會年刊2002——中國地球物理學會第十八屆年會論文集[C];2002年
3 康曉巖;陳永義;;一種改進的蒙特卡洛選擇算子[A];中國系統(tǒng)工程學會模糊數(shù)學與模糊系統(tǒng)委員會第十一屆年會論文選集[C];2002年
中國重要報紙全文數(shù)據(jù)庫 前6條
1 記者 王慶芳;[N];石家莊日報;2005年
2 梁麗娟;[N];人民日報海外版;2008年
3 宋志堅;[N];福建日報;2007年
4 陽映紅 編譯;[N];中國保險報;2014年
5 陽映紅 編譯;[N];中國保險報;2014年
6 李雨萌;[N];大連日報;2014年
中國碩士學位論文全文數(shù)據(jù)庫 前7條
1 于永波;基于蒙特卡洛樹搜索的計算機圍棋博弈研究[D];大連海事大學;2015年
2 祁建娟;CDO信用風險度量的蒙特卡洛算法優(yōu)化及應用[D];上海交通大學;2015年
3 鄧斌;基于蒙特卡洛算法的錨泊容量研究[D];大連海事大學;2012年
4 徐麟;基于蒙特卡洛分析的港口項目財務風險研究[D];大連海事大學;2008年
5 謝東;基于蒙特卡洛技術的中國移動無線網(wǎng)優(yōu)項目時間管理研究[D];安徽大學;2012年
6 夏勇;基于蒙特卡洛的動態(tài)無線傳感器網(wǎng)絡節(jié)點定位算法研究[D];遼寧科技大學;2014年
7 肖峰;GPU高性能運算在計算機圍棋博弈系統(tǒng)中的應用研究及實驗[D];北京郵電大學;2011年
本文關鍵詞:基于蒙特卡洛樹搜索的計算機圍棋博弈研究,由筆耕文化傳播整理發(fā)布。
,本文編號:178381
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/178381.html