阿法狗圍棋系統(tǒng)的簡要分析
發(fā)布時間:2017-11-12 09:13
本文關鍵詞:阿法狗圍棋系統(tǒng)的簡要分析
更多相關文章: 深度學習 深度卷積神經(jīng)網(wǎng)絡 計算機圍棋 強化學習 阿法狗
【摘要】:谷歌的圍棋系統(tǒng)阿法狗(AlphaGo)在三月的比賽中以4:1的成績擊敗了圍棋世界冠軍李世石,大大超過了許多人對計算機圍棋程序何時能趕上人類職業(yè)高手的預期(約10~30年).本文在技術層面分析了阿法狗系統(tǒng)的組成部分,并基于它過去的公開對局預測了它可能的弱點.
【作者單位】: 臉書人工智能研究所;
【分類號】:TP18
【正文快照】: 引用格式田淵棟.阿法狗圍棋系統(tǒng)的簡要分析.自動化學報,2016,42(5):671-675Alpha Go這個系統(tǒng)[1]主要由幾個部分組成:1)走棋網(wǎng)絡(Policy network),給定當前局面,預測/采樣下一步的走棋.2)快速走子(Fast rollout),目標和走棋網(wǎng)絡一樣,但在適當犧牲走棋質(zhì)量的條件下,速度要比走棋,
本文編號:1175252
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1175252.html
最近更新
教材專著