大數(shù)據(jù)背景下的谷歌翻譯——現(xiàn)狀與挑戰(zhàn)
本文關鍵詞:大數(shù)據(jù)背景下的谷歌翻譯——現(xiàn)狀與挑戰(zhàn)
更多相關文章: 谷歌翻譯 統(tǒng)計機器翻譯 最大熵 最小誤差率損失
【摘要】:在大數(shù)據(jù)時代,如何通過數(shù)據(jù)分析挖掘事物的內(nèi)在規(guī)律是人們需要思考的問題。谷歌翻譯基于"最好的表達為出現(xiàn)頻率最高的表達"這樣的認識,將翻譯問題轉化為統(tǒng)計問題。本文以谷歌翻譯為案例,詳細分析了案例背景、實現(xiàn)過程,并給出案例反思。谷歌翻譯的成功之處在于,將實際問題巧妙地轉化為統(tǒng)計問題,并利用其強大的計算能力解決問題。其瓶頸在于,當前的方法只利用了大數(shù)據(jù)的少量信息,不能充分刻畫大數(shù)據(jù)的全部信息。谷歌翻譯對問題的轉化和處理方式是大數(shù)據(jù)應用的典范,對利用大數(shù)據(jù)解決實際問題有重要的借鑒意義。
【作者單位】: 杭州電子科技大學經(jīng)濟學院;中國人民大學;中國人民大學統(tǒng)計學院;中國人民大學統(tǒng)計咨詢研究中心;
【關鍵詞】: 谷歌翻譯 統(tǒng)計機器翻譯 最大熵 最小誤差率損失
【基金】:中國人民大學科學研究基金(中央高;究蒲袠I(yè)務費專項資金資助)項目“生物醫(yī)學大數(shù)據(jù)的統(tǒng)計方法巷砂研究”(15XN1011)的階段性成果
【分類號】:F49
【正文快照】: 一、背景谷歌翻譯是谷歌公司推出的針對文本、語音、圖像以及實時視頻的多語種翻譯服務。該項目始于2001年,上線初期采用其他同類型公司(例如雅虎)類似的機器翻譯系統(tǒng),但是翻譯精度并不理想[1]。譬如在2004年,上述機器翻譯系統(tǒng)機械地將總統(tǒng)候選人克里(Kerry)翻譯成“愛爾蘭的
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王家敏;方可成;;谷歌沖撞“傳統(tǒng)世界”[J];中國新聞周刊;2010年04期
2 張琛;韓多妮;于曉悠;Carrie Tsang;;拉廷根 谷歌取景要交錢[J];明日風尚;2010年02期
3 ;谷歌“地震”致G粉心理位移[J];中國西部;2010年Z4期
4 ;谷歌為何說退就退[J];競爭力.三聯(lián)財經(jīng);2010年04期
5 ;谷歌投靠安全局[J];競爭力.三聯(lián)財經(jīng);2010年03期
6 ;谷歌去留一場戲[J];競爭力.三聯(lián)財經(jīng);2010年03期
7 ;麻辣谷歌[J];競爭力(三聯(lián)財經(jīng));2010年05期
8 ;谷歌被跳脫衣舞[J];競爭力(三聯(lián)財經(jīng));2010年06期
9 ;谷歌又陷“拍照門”[J];競爭力.三聯(lián)財經(jīng);2010年01期
10 ;谷歌“退出中國”的戲劇始末[J];劍南文學(經(jīng)典閱讀);2010年03期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 侯艷蘭;;從谷歌的專利帝國淺析互聯(lián)網(wǎng)企業(yè)的建設[A];2014年中華全國專利代理人協(xié)會年會第五屆知識產(chǎn)權論壇論文集(第一部分)[C];2014年
2 經(jīng)淵;劉翔;;“谷歌一代”信息素質(zhì)分析[A];現(xiàn)代圖書館服務:浙江省圖書館學會第十一次學術研討會論文集[C];2008年
3 王學健;;數(shù)字時代就不進圖書館了嗎?[A];新觀點新學說學術沙龍文集24:數(shù)字時代圖書館的創(chuàng)新與共享[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 牧歌;谷歌的傲慢與偏見[N];中國經(jīng)濟導報;2010年
2 本報記者 李響;谷歌 四面楚歌[N];計算機世界;2010年
3 鄧文雷 編譯;湯姆在線將停止與谷歌合作[N];中國新聞出版報;2010年
4 邱林;谷歌真的想丟掉中國市場嗎[N];中華工商時報;2010年
5 王曉s,
本文編號:993639
本文鏈接:http://sikaile.net/jingjilunwen/xxjj/993639.html