天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

突破通過機(jī)器進(jìn)行學(xué)習(xí)的極限

發(fā)布時(shí)間:2018-04-06 03:15

  本文選題:強(qiáng)化學(xué)習(xí) 切入點(diǎn):深度學(xué)習(xí) 出處:《科學(xué)通報(bào)》2016年33期


【摘要】:學(xué)習(xí)能力是人類智能的根本特征.2016年3月,Google公司的Alpha Go把深度神經(jīng)網(wǎng)絡(luò)與蒙特卡羅樹形搜索結(jié)合起來,以4勝1負(fù)的成績(jī)戰(zhàn)勝了圍棋世界冠軍韓國(guó)的李世石.這一結(jié)果標(biāo)志人工智能取得了重大進(jìn)展.本文重點(diǎn)介紹Alpha Go采用的機(jī)器學(xué)習(xí)方法,包括強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí),分析存在的問題和最新的研究進(jìn)展.為了突破通過計(jì)算機(jī)進(jìn)行學(xué)習(xí)的極限,提出認(rèn)知機(jī)器學(xué)習(xí),列舉可能的研究方向開展研究,使機(jī)器智能不斷進(jìn)化,逐步達(dá)到人類水平.
[Abstract]:Learning ability is a fundamental feature of human intelligence. In March 2016, Alpha go combined depth neural networks with Monte Carlo tree search to win 4-1 against go world champion Lee Shih-shih of South Korea.This result marks a significant advance in artificial intelligence.This paper focuses on the machine learning methods used by Alpha go, including reinforcement learning, deep learning, deep reinforcement learning, analysis of existing problems and recent research progress.In order to break through the limit of learning by computer, this paper puts forward cognitive machine learning, enumerates the possible research directions and makes machine intelligence evolve continuously and gradually reach the human level.
【作者單位】: 中國(guó)科學(xué)院計(jì)算技術(shù)研究所;
【基金】:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(2013CB329502)資助
【分類號(hào)】:TP181

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 汪云九,姚國(guó)正;神經(jīng)系統(tǒng)中學(xué)習(xí)和記憶的數(shù)學(xué)模型[J];自然雜志;1987年11期

2 馮英偉;韓瑛;;基于Agent技術(shù)的網(wǎng)絡(luò)教育學(xué)習(xí)者分析[J];教育信息化;2006年20期

3 吳元斌;;單agent強(qiáng)化學(xué)習(xí)與多agent強(qiáng)化學(xué)習(xí)比較研究[J];電腦與信息技術(shù);2009年01期

4 汪國(guó)華;;CBR模式下個(gè)體進(jìn)行高效率學(xué)習(xí)的思考[J];數(shù)學(xué)通訊;2009年06期

5 王星;方濱興;張宏莉;何慧;趙蕾;;關(guān)系分類的學(xué)習(xí)界限研究[J];軟件學(xué)報(bào);2013年11期

6 張景祥;王士同;鄧趙紅;李奕;蔣亦樟;;具有協(xié)同約束的共生遷移學(xué)習(xí)算法研究[J];電子學(xué)報(bào);2014年03期

7 孫方平;符秀輝;;復(fù)雜環(huán)境下機(jī)器人的行為學(xué)習(xí)研究[J];儀器儀表學(xué)報(bào);2006年S3期

8 趙鳳飛;覃征;;一種多動(dòng)機(jī)強(qiáng)化學(xué)習(xí)框架[J];計(jì)算機(jī)研究與發(fā)展;2013年02期

9 余志剛,徐華中;變學(xué)習(xí)因子神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制研究[J];武漢汽車工業(yè)大學(xué)學(xué)報(bào);1997年02期

10 周浦城;洪炳昒;韓學(xué)東;郭聳;;基于多Agent的并行Q-學(xué)習(xí)算法[J];小型微型計(jì)算機(jī)系統(tǒng);2006年09期

相關(guān)博士學(xué)位論文 前1條

1 龍明盛;遷移學(xué)習(xí)問題與方法研究[D];清華大學(xué);2014年

相關(guān)碩士學(xué)位論文 前7條

1 李杰龍;基于主動(dòng)學(xué)習(xí)的多示例多標(biāo)簽學(xué)習(xí)算法研究[D];廣東工業(yè)大學(xué);2016年

2 謝江龍;面向張量數(shù)據(jù)的遷移學(xué)習(xí)研究與應(yīng)用[D];廣東工業(yè)大學(xué);2016年

3 焦夏;基于多Agent的移動(dòng)學(xué)習(xí)模型研究[D];寧波大學(xué);2013年

4 馬海鵬;泛在學(xué)習(xí)環(huán)境下一種學(xué)習(xí)控制模型的研究[D];陜西師范大學(xué);2014年

5 宋碧慧;基于多Agent協(xié)作強(qiáng)化學(xué)習(xí)的研究[D];湖南大學(xué);2013年

6 郭世碩;多源遷移學(xué)習(xí)的研究[D];西安電子科技大學(xué);2014年

7 陳春磊;學(xué)習(xí)設(shè)計(jì)中學(xué)習(xí)目標(biāo)的研究與應(yīng)用[D];湖南大學(xué);2007年



本文編號(hào):1717716

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1717716.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8d021***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com