天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于中軸語的統(tǒng)計機器翻譯研究

發(fā)布時間:2022-02-15 16:29
  機器翻譯是指利用計算機自動的將一種自然語言翻譯為另一種自然語言的技術(shù)。近年來,統(tǒng)計機器翻譯與神經(jīng)網(wǎng)絡(luò)機器翻譯已成為機器翻譯研究領(lǐng)域的主流。統(tǒng)計機器翻譯與神經(jīng)網(wǎng)絡(luò)機器翻譯的基本思想是利用學(xué)習(xí)算法,從大規(guī)模雙語句對中學(xué)習(xí)到翻譯規(guī)則。但是,并不是所有的語言對之間都存在大規(guī)模的雙語句對。為了解決機器翻譯中的數(shù)據(jù)稀疏問題,研究人員提出了中軸語的概念,即在源語言與目標(biāo)語中間引入中軸語,要求源語言與中軸語、中軸語與目標(biāo)語之間存在大規(guī)模雙語語料。本文針對基于中軸語的統(tǒng)計機器翻譯,重點研究以下幾個方面:1.中軸語翻譯的概率估計。目前,主流的中軸語翻譯研究建立在基于短語的統(tǒng)計機器翻譯基礎(chǔ)上,這些研究通過直接將源語言-中軸語、中軸語-目標(biāo)語的翻譯概率相乘得到源語言-目標(biāo)語的翻譯概率。然而,由于源語言-中軸語、中軸語-目標(biāo)語分布于兩個不同的概率空間,并且可能存在著領(lǐng)域差異,這會導(dǎo)致翻譯概率準(zhǔn)確率低。為此,本文提出基于短語對共現(xiàn)次數(shù)的中軸語短語翻譯模型,該方法首先抽取源語言-中軸語、中軸語-目標(biāo)語短語,然后基于上述短語對推導(dǎo)出相應(yīng)的源語言-目標(biāo)語短語,最后在推導(dǎo)出的源語言-目標(biāo)語短語對基礎(chǔ)上計算源語言-目標(biāo)語短... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省211工程院校985工程院校

【文章頁數(shù)】:125 頁

【學(xué)位級別】:博士

【部分圖文】:

基于中軸語的統(tǒng)計機器翻譯研究


不同損失函數(shù)的比較

【參考文獻】:
期刊論文
[1]神經(jīng)機器翻譯綜述[J]. 李亞超,熊德意,張民.  計算機學(xué)報. 2018(12)
[2]基于數(shù)據(jù)增強技術(shù)的神經(jīng)機器翻譯[J]. 蔡子龍,楊明明,熊德意.  中文信息學(xué)報. 2018(07)
[3]基于約束的神經(jīng)機器翻譯[J]. 熊德意,李軍輝,王星,張飚.  中國科學(xué):信息科學(xué). 2018(05)
[4]基于Transfer和Triangulation融合的中介語統(tǒng)計機器翻譯方法[J]. 王強,杜權(quán),肖桐,朱靖波.  中文信息學(xué)報. 2017(04)
[5]神經(jīng)機器翻譯前沿進展[J]. 劉洋.  計算機研究與發(fā)展. 2017(06)
[6]稀缺資源機器翻譯中改進的語料級和短語級中間語言方法研究[J]. 李強,王強,肖桐,朱靖波.  計算機學(xué)報. 2017(04)
[7]互聯(lián)網(wǎng)機器翻譯[J]. 王海峰,吳華,劉占一.  中文信息學(xué)報. 2011(06)
[8]統(tǒng)計機器翻譯綜述[J]. 劉群.  中文信息學(xué)報. 2003(04)

碩士論文
[1]融合多語編碼信息的神經(jīng)機器翻譯研究[D]. 劉笛.哈爾濱工業(yè)大學(xué) 2017
[2]基于三語平行語料的語義向量的機器翻譯研究[D]. 王曉雪.哈爾濱工業(yè)大學(xué) 2016



本文編號:3626954

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3626954.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9e26e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com