基于蒙特卡洛樹(shù)搜索的計(jì)算機(jī)圍棋博弈研究
本文關(guān)鍵詞:基于蒙特卡洛樹(shù)搜索的計(jì)算機(jī)圍棋博弈研究,由筆耕文化傳播整理發(fā)布。
《大連海事大學(xué)》 2015年
基于蒙特卡洛樹(shù)搜索的計(jì)算機(jī)圍棋博弈研究
于永波
【摘要】:近年來(lái),計(jì)算機(jī)軟硬件和互聯(lián)網(wǎng)迅猛發(fā)展,相關(guān)學(xué)科也在不斷進(jìn)步。人工智能是長(zhǎng)期以來(lái)的熱點(diǎn)話題,而計(jì)算機(jī)博弈是它的一個(gè)受到廣泛關(guān)注的研究方向。作為最復(fù)雜的博弈項(xiàng)目之一,具有挑戰(zhàn)性的圍棋能夠充分檢驗(yàn)人工智能的發(fā)展水平,因此計(jì)算機(jī)圍棋博弈的研究在計(jì)算機(jī)博弈、人工智能乃至計(jì)算機(jī)科學(xué)領(lǐng)域占有重要的地位。由于圍棋知識(shí)規(guī)則不便歸納,搜索空間過(guò)于巨大,傳統(tǒng)計(jì)算機(jī)博弈的理論和方法目前均難以適用。近些年,在計(jì)算機(jī)性能大幅度提高的基礎(chǔ)上,計(jì)算機(jī)圍棋博弈采用蒙特卡洛方法進(jìn)行動(dòng)態(tài)評(píng)估,并引入了上限信心界應(yīng)用樹(shù)算法,搜索的效率和評(píng)估的性能均得到了很大提升,計(jì)算機(jī)圍棋博弈程序的水平不斷提高。同時(shí),這種聚類(lèi)智能的計(jì)算方法不僅適用于圍棋,還適用于規(guī)劃決策類(lèi)問(wèn)題等其他許多問(wèn)題,因此計(jì)算機(jī)圍棋博弈方面的研究成果有著重要的現(xiàn)實(shí)意義,可以有更廣闊的用武之地。由蒙特卡洛方法和上限信心界應(yīng)用樹(shù)算法構(gòu)成的蒙特卡洛樹(shù)搜索是當(dāng)今高水平計(jì)算機(jī)圍棋程序普遍采用的較優(yōu)方法,但其仍有可完善之處。本文立足于蒙特卡洛樹(shù)搜索的思想和特點(diǎn),針對(duì)蒙特卡洛方法和上限信心界應(yīng)用樹(shù)算法存在的不足,提出了絕對(duì)剪枝策略和漸進(jìn)展開(kāi)策略?xún)纱蟾倪M(jìn)措施,并從理論上證明了改進(jìn)的必要性和正確性。而后,本文選用了采用蒙特卡洛樹(shù)搜索的棋力很強(qiáng)的開(kāi)源圍棋程序Fuego作為改進(jìn)試驗(yàn)程序,通過(guò)GoGui平臺(tái)使其改進(jìn)前和改進(jìn)后分別與另一高水平程序Pachi對(duì)弈,根據(jù)對(duì)局的用時(shí)和勝負(fù)進(jìn)行驗(yàn)證和分析。實(shí)驗(yàn)結(jié)果表明,Fuego在用時(shí)略有下降的情況下勝率有所提高,這說(shuō)明改進(jìn)方案切實(shí)有效,具備一定的實(shí)用價(jià)值。
【關(guān)鍵詞】:
【學(xué)位授予單位】:大連海事大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP18
【目錄】:
下載全文 更多同類(lèi)文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買(mǎi)知網(wǎng)充值卡、在線充值、在線咨詢(xún))
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 李德毅;肖俐平;;網(wǎng)絡(luò)時(shí)代的人工智能[J];中文信息學(xué)報(bào);2008年02期
2 鄧超;吳霖;陳磊;袁梅宇;;局部UCT算法在圍棋死活題上的性能測(cè)試[J];信息技術(shù);2013年03期
3 王巖;尹海麗;竇在祥;;蒙特卡羅方法應(yīng)用研究[J];青島理工大學(xué)學(xué)報(bào);2006年02期
4 周明明;高航;趙國(guó)安;;UCT算法在計(jì)算機(jī)圍棋中的應(yīng)用與改進(jìn)[J];數(shù)據(jù)采集與處理;2012年S2期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 岳鵬;計(jì)算機(jī)圍棋中的算法研究[D];西南大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 黃晶;計(jì)算機(jī)圍棋博弈中UCT算法的應(yīng)用及改進(jìn)[D];北京郵電大學(xué);2011年
2 郭潔;圍棋人工智能中幾個(gè)上限值的研究[D];中南大學(xué);2013年
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 來(lái)水利;顏珩燁;朱雷;;RSM法優(yōu)化微波場(chǎng)下殼聚糖降解[J];北京工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
2 侯大志;賀曉玲;張孝雙;蔣洪暉;;基于蒙特卡羅仿真的多種二進(jìn)制通信系統(tǒng)性能分析[J];電子設(shè)計(jì)工程;2012年06期
3 魯靖;卞樹(shù)檀;周帥;;基于蒙特卡羅仿真與逆向FTF的復(fù)雜系統(tǒng)可靠性分析[J];電子器件;2014年02期
4 張立嘉;茆家旭;;人工智能在下一代廣播電視網(wǎng)中的應(yīng)用[J];廣播電視信息;2015年07期
5 余麗麗;李仲謹(jǐn);朱雷;宋涼;;應(yīng)用響應(yīng)曲面法優(yōu)化N,N′-亞甲基雙丙烯酰胺交聯(lián)淀粉微球的合成工藝[J];化工進(jìn)展;2008年03期
6 李仲謹(jǐn);朱雷;余麗麗;宋涼;肖昊江;邱輝;;應(yīng)用響應(yīng)曲面優(yōu)化交聯(lián)淀粉微球的合成工藝[J];化學(xué)工程;2009年01期
7 利珊;;不確定性中的隨機(jī)性和模糊性[J];金華職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年03期
8 黃克平;應(yīng)浩;黃婷;張亞;;蒙特卡羅算法在室內(nèi)三維實(shí)時(shí)定位系統(tǒng)的應(yīng)用[J];計(jì)量與測(cè)試技術(shù);2008年09期
9 張?zhí)m江;張建福;;蒙特卡羅模擬法在排隊(duì)論中的應(yīng)用[J];交通與運(yùn)輸;2008年02期
10 柳高潔;顧克秋;;結(jié)合NSGA-Ⅱ算法和蒙特卡羅模擬技術(shù)實(shí)現(xiàn)結(jié)構(gòu)的魯棒優(yōu)化[J];機(jī)械設(shè)計(jì);2009年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 Li Fei;Ouyang Li;Wang Yajie;Dong Yanqiu;;Study of Strategy Selection Based on Phantom Go[A];第26屆中國(guó)控制與決策會(huì)議論文集[C];2014年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 揣媛媛;空間信息網(wǎng)格環(huán)境下的礦產(chǎn)資源證據(jù)權(quán)評(píng)價(jià)方法研究[D];吉林大學(xué);2007年
2 馮國(guó)雙;中國(guó)癌癥高發(fā)現(xiàn)場(chǎng)評(píng)價(jià)與質(zhì)量控制[D];北京大學(xué);2008年
3 孫剛;限制性克立格法在礦產(chǎn)資源儲(chǔ)量估算中的應(yīng)用[D];吉林大學(xué);2008年
4 楊鵬;船舶六自由度運(yùn)動(dòng)模擬臺(tái)及其控制方法研究[D];哈爾濱工程大學(xué);2008年
5 趙丕杰;LOD在直擴(kuò)系統(tǒng)微弱信號(hào)檢測(cè)中的應(yīng)用與研究[D];哈爾濱工程大學(xué);2009年
6 張勤;浮法玻璃成形中傳熱與滲錫的數(shù)值模擬[D];清華大學(xué);2011年
7 王富強(qiáng);空間知識(shí)地圖構(gòu)建理論和方法研究[D];解放軍信息工程大學(xué);2013年
8 鄧文紅;基于知識(shí)管理的辦公系統(tǒng)智能化研究[D];西南交通大學(xué);2014年
9 龔誼承;基于頻率類(lèi)別的洪水過(guò)程模擬和廣義洪水風(fēng)險(xiǎn)分析與模擬[D];武漢大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 曹慶安;基于RS與GIS的安福縣基本農(nóng)田保護(hù)區(qū)劃定研究[D];江西師范大學(xué);2010年
2 王剛;生物科學(xué)視角下的類(lèi)生命體生態(tài)設(shè)計(jì)[D];江南大學(xué);2011年
3 黃晶;計(jì)算機(jī)圍棋博弈中UCT算法的應(yīng)用及改進(jìn)[D];北京郵電大學(xué);2011年
4 王樹(shù)波;基于抽樣模擬技術(shù)的有色冶金配料過(guò)程優(yōu)化方法研究[D];中南大學(xué);2011年
5 郭佳;多股流換熱器通道排列優(yōu)化設(shè)計(jì)研究[D];上海理工大學(xué);2009年
6 常樂(lè);長(zhǎng)白山典型地區(qū)降雨分布型及洪澇災(zāi)害預(yù)測(cè)研究[D];東北師范大學(xué);2011年
7 李晶影;考慮局部應(yīng)力集中的機(jī)械零部件可靠性靈敏度分析[D];吉林大學(xué);2007年
8 李輝山;工程項(xiàng)目進(jìn)度—費(fèi)用協(xié)調(diào)控制的仿真實(shí)現(xiàn)研究[D];西安建筑科技大學(xué);2007年
9 陳英;基于季節(jié)模型的通信話務(wù)量預(yù)測(cè)的研究與實(shí)施[D];北京郵電大學(xué);2007年
10 牟磊;基于GIS和CA模型的土地利用變化研究[D];新疆大學(xué);2007年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 沈傲東;羅立民;;基于蒙特卡羅積分的數(shù)字影像重建方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年06期
2 張振;顧治華;;機(jī)器博弈及其搜索算法的研究[J];電腦知識(shí)與技術(shù);2008年24期
3 徐東升;周偉華;;基于馬爾科夫決策過(guò)程的貨物流的配給策略[J];管理工程學(xué)報(bào);2009年04期
4 余磊;劉錦高;;一種圍棋中盤(pán)問(wèn)題的計(jì)算機(jī)求解方法[J];華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年01期
5 李德毅;劉坤;孫巖;韓明暢;;涌現(xiàn)計(jì)算:從無(wú)序掌聲到有序掌聲的虛擬現(xiàn)實(shí)[J];中國(guó)科學(xué)(E輯:信息科學(xué));2007年10期
6 孫舒楊;劉大有;孫成敏;;二人博弈問(wèn)題中單一納什均衡的搜索算法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
7 谷蓉,劉學(xué)民,朱仲濤,周杰;一種圍棋定式的機(jī)器學(xué)習(xí)方法[J];計(jì)算機(jī)工程;2004年06期
8 廖里;圍棋死活問(wèn)題的計(jì)算機(jī)求解[J];計(jì)算機(jī)應(yīng)用;2005年11期
9 李德毅;肖俐平;;網(wǎng)絡(luò)時(shí)代的人工智能[J];中文信息學(xué)報(bào);2008年02期
10 王魯明,戴汝為;在計(jì)算機(jī)圍棋中形象思維的研究[J];自動(dòng)化學(xué)報(bào);1997年04期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 黃晶;計(jì)算機(jī)圍棋博弈中UCT算法的應(yīng)用及改進(jìn)[D];北京郵電大學(xué);2011年
2 陳磊;計(jì)算機(jī)圍棋領(lǐng)域概念網(wǎng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 元丁;;令人驚訝的張冠李戴[J];新聞戰(zhàn)線;1992年09期
2 張文明;工作站環(huán)境中電路的蒙特卡洛分析[J];計(jì)算機(jī)應(yīng)用研究;1997年02期
3 程康萱;;憶訪棋王衛(wèi)冕戰(zhàn)——蒙特卡洛瑣記[J];新聞三昧;1995年03期
4 董寬;;再見(jiàn),蒙特卡洛——訪申辦2000年奧運(yùn)會(huì)決戰(zhàn)紀(jì)實(shí)[J];新聞三昧;1994年01期
5 閔濤;張帆;;參數(shù)反演的微分進(jìn)化蒙特卡洛算法[J];計(jì)算機(jī)工程與應(yīng)用;2012年07期
6 葛麗萍;鄂英杰;;運(yùn)用Crystal Ball & MS Project實(shí)現(xiàn)項(xiàng)目進(jìn)度的蒙特卡洛風(fēng)險(xiǎn)分析[J];電腦編程技巧與維護(hù);2013年08期
7 張建平;張鳳蓮;陶華;;基于混合蒙特卡洛算法的容差分配研究[J];計(jì)算機(jī)仿真;2009年10期
8 馬北北;;蒙特卡洛:舉世矚目的一天[J];青年記者;1994年01期
9 曲洪權(quán);龐麗萍;李運(yùn)澤;;序列蒙特卡洛濾波在衛(wèi)星傳熱反問(wèn)題中的應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2008年13期
10 錢(qián)鍵民;;雷達(dá)虛警概率模擬與重要采樣技術(shù)[J];火控雷達(dá)技術(shù);1984年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 程磊;房永智;王剛;;蒙特卡洛計(jì)算方法與作戰(zhàn)毀傷模擬決策分析[A];中國(guó)系統(tǒng)工程學(xué)會(huì)決策科學(xué)專(zhuān)業(yè)委員會(huì)第六屆學(xué)術(shù)年會(huì)論文集[C];2005年
2 周永宏;鄭大偉;廖新浩;;相關(guān)分析顯著水平的蒙特卡洛模擬檢驗(yàn)[A];中國(guó)地球物理學(xué)會(huì)年刊2002——中國(guó)地球物理學(xué)會(huì)第十八屆年會(huì)論文集[C];2002年
3 康曉巖;陳永義;;一種改進(jìn)的蒙特卡洛選擇算子[A];中國(guó)系統(tǒng)工程學(xué)會(huì)模糊數(shù)學(xué)與模糊系統(tǒng)委員會(huì)第十一屆年會(huì)論文選集[C];2002年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前6條
1 記者 王慶芳;[N];石家莊日?qǐng)?bào);2005年
2 梁麗娟;[N];人民日?qǐng)?bào)海外版;2008年
3 宋志堅(jiān);[N];福建日?qǐng)?bào);2007年
4 陽(yáng)映紅 編譯;[N];中國(guó)保險(xiǎn)報(bào);2014年
5 陽(yáng)映紅 編譯;[N];中國(guó)保險(xiǎn)報(bào);2014年
6 李雨萌;[N];大連日?qǐng)?bào);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 于永波;基于蒙特卡洛樹(shù)搜索的計(jì)算機(jī)圍棋博弈研究[D];大連海事大學(xué);2015年
2 祁建娟;CDO信用風(fēng)險(xiǎn)度量的蒙特卡洛算法優(yōu)化及應(yīng)用[D];上海交通大學(xué);2015年
3 鄧斌;基于蒙特卡洛算法的錨泊容量研究[D];大連海事大學(xué);2012年
4 徐麟;基于蒙特卡洛分析的港口項(xiàng)目財(cái)務(wù)風(fēng)險(xiǎn)研究[D];大連海事大學(xué);2008年
5 謝東;基于蒙特卡洛技術(shù)的中國(guó)移動(dòng)無(wú)線網(wǎng)優(yōu)項(xiàng)目時(shí)間管理研究[D];安徽大學(xué);2012年
6 夏勇;基于蒙特卡洛的動(dòng)態(tài)無(wú)線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)定位算法研究[D];遼寧科技大學(xué);2014年
7 肖峰;GPU高性能運(yùn)算在計(jì)算機(jī)圍棋博弈系統(tǒng)中的應(yīng)用研究及實(shí)驗(yàn)[D];北京郵電大學(xué);2011年
本文關(guān)鍵詞:基于蒙特卡洛樹(shù)搜索的計(jì)算機(jī)圍棋博弈研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):178381
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/178381.html