AlphaGo與AlphaZero原理和未來應用研究

發(fā)布時間：2023-04-03 22:18

　　人工智能長期以來的目標就是創(chuàng)造機器的完全主導領域,在人類生活中發(fā)揮作用。AlphaGo成為首個在圍棋中戰(zhàn)勝人類世界冠軍的系統(tǒng)。AlphaGo神經(jīng)網(wǎng)絡使用人類的棋盤數(shù)據(jù)進行學習訓練,同時也通過自我對弈進行強化學習。圍棋對于人工智能來說是最具有挑戰(zhàn)性的經(jīng)典博弈比賽,它的巨大的搜索空間,棋局和落子地點讓機器學習難以應對�？茖W家創(chuàng)造了一種新的人工智能程序系統(tǒng)AlphaGo,使用估值網(wǎng)絡來評估局勢以及使用策略網(wǎng)絡來選擇如何落子。這些深度神經(jīng)網(wǎng)絡被一種新的組合來訓練:使用了人類專業(yè)比賽數(shù)據(jù)的監(jiān)督學習,以及自我對弈的強化學習。AlphaZero沒有使用任何預測搜索的方法,神經(jīng)網(wǎng)絡搭配最先進的蒙特卡洛樹搜索算法讓程序達到了更加精確和智能的水準,這程序模擬了數(shù)以千計的自我對弈的隨機博弈。Alpha系列達到了99.8%的勝率,這是史上第一次計算機程序在全尺寸圍棋中擊敗人類職業(yè)棋手。通過對AlphaGo和AlphaZero原理學習,我們可以在掌握現(xiàn)有先進技術的基礎上,開拓創(chuàng)新,思考類似的人工智能在醫(yī)學,軍事等領域的未來應用可能性。

【文章頁數(shù)】：2 頁

【文章目錄】：
0 引言
1 蒙特卡洛搜索
2 AlphaGo與AlphaZero原理
2.1 AlphaGo原理
2.2 AlphaZero原理
3 AlphaGo與AlphaZero的未來應用前景
4 結論

本文編號：3781247

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3781247.html

上一篇：基于深度置信網(wǎng)絡的松動部件質(zhì)量估計方法研究
下一篇：基于布谷鳥搜索的模糊PID擁塞控制方法

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

AlphaGo與AlphaZero原理和未來應用研究