基于參考譯文圖的機(jī)器翻譯質(zhì)量評(píng)價(jià)方法研究
本文選題:機(jī)器翻譯 切入點(diǎn):自動(dòng)評(píng)價(jià) 出處:《南京大學(xué)》2017年碩士論文
【摘要】:隨著科技日新月異的發(fā)展,機(jī)器翻譯技術(shù)得到了越來(lái)越多人的關(guān)注,其理論研究以及實(shí)際應(yīng)用都已成為機(jī)器學(xué)習(xí)領(lǐng)域的一大熱點(diǎn)。與人工翻譯相比,機(jī)器翻譯在翻譯效率上有較明顯的提高,且代價(jià)較低,所以自動(dòng)化翻譯技術(shù)(機(jī)器翻譯技術(shù))的研究已經(jīng)成為一個(gè)非常重要的研究方向。隨著機(jī)器翻譯技術(shù)的飛速發(fā)展,機(jī)器翻譯質(zhì)量評(píng)價(jià)這一研究課題應(yīng)運(yùn)而生,對(duì)于機(jī)器翻譯系統(tǒng)產(chǎn)生的翻譯結(jié)果,我們需要衡量其翻譯質(zhì)量如何。完成機(jī)器翻譯本身并不是最終目的,我們希望知道機(jī)器譯文能夠在多大程度上幫助到人們,同時(shí),對(duì)機(jī)器譯文質(zhì)量有大致的評(píng)估,也有助于學(xué)習(xí)得到一個(gè)更好的機(jī)器翻譯系統(tǒng),這兩者相輔相成。對(duì)于機(jī)器譯文的評(píng)測(cè),傳統(tǒng)的方式是進(jìn)行人工評(píng)價(jià),但是這種方式由于其耗時(shí)、代價(jià)昂貴且結(jié)果不可重現(xiàn),現(xiàn)已被自動(dòng)評(píng)測(cè)方法部分取代。當(dāng)前主流的自動(dòng)評(píng)測(cè)方法,采用的都是相同的策略:將機(jī)器譯文與一個(gè)或是多個(gè)人工譯文(參考譯文)進(jìn)行比較,并且認(rèn)為一個(gè)與參考譯文非常相似的機(jī)器譯文肯定比那些與參考譯文有較大差異的譯文更準(zhǔn)確。但是,由于語(yǔ)義和表達(dá)方式的多樣性,源語(yǔ)言中的一個(gè)句子可能有很多不同的正確翻譯結(jié)果(即翻譯多樣性),而參考譯文是有限的,這就會(huì)導(dǎo)致在一些情況下,自動(dòng)評(píng)測(cè)方法不能準(zhǔn)確的對(duì)譯文質(zhì)量有一個(gè)評(píng)估,同時(shí)這一問(wèn)題也限制了機(jī)器翻譯系統(tǒng)的翻譯能力。在本文中,我們針對(duì)目前的自動(dòng)評(píng)測(cè)方法在翻譯多樣性方面的的缺陷做出了改進(jìn)。由于人工翻譯的昂貴代價(jià),我們能夠獲取到的參考譯文是有限的,因此,本文提出了一種從有限的資源中獲取到更多信息的自動(dòng)方法。首先,我們探索了不同的評(píng)價(jià)方法以及選擇不同的參考譯文對(duì)機(jī)器翻譯系統(tǒng)的影響;其次,對(duì)已有的參考譯文進(jìn)行拓展,對(duì)于部分存在多個(gè)參考譯文的數(shù)據(jù)集,通過(guò)構(gòu)建一個(gè)參考譯文圖以獲取更多的信息,對(duì)于大部分只存在一個(gè)參考譯文的數(shù)據(jù)集,利用外部單語(yǔ)資源英文復(fù)述表,對(duì)當(dāng)前的參考譯文進(jìn)行拓展,得到一個(gè)含有更加豐富信息的參考譯文圖;最后,通過(guò)從參考譯文圖中尋找最優(yōu)路徑以提高效率,并將該自動(dòng)方法應(yīng)用到已有的自動(dòng)評(píng)測(cè)方法中,幫助提升機(jī)器翻譯系統(tǒng)本身的翻譯能力。實(shí)驗(yàn)結(jié)果表明,本文提出的從有限的資源中獲取到更多信息的自動(dòng)方法能夠更快地獲取到更加豐富且多樣的參考譯文信息。對(duì)于多個(gè)參考譯文的拓展,能夠?qū)C(jī)器譯文作出更加準(zhǔn)確的評(píng)價(jià);對(duì)于單個(gè)參考譯文的拓展,不僅能夠更準(zhǔn)確地評(píng)價(jià)系統(tǒng)譯文,同時(shí)還減小了使用不同譯文帶來(lái)的系統(tǒng)性能的差異;將該方法應(yīng)用于翻譯系統(tǒng)的訓(xùn)練過(guò)程,有效的提高了翻譯系統(tǒng)能力。
[Abstract]:With the rapid development of science and technology, machine translation technology has been paid more and more attention. Its theoretical research and practical application have become a hot spot in the field of machine learning. The efficiency of machine translation has been improved obviously and the cost is low. Therefore, the research of automatic translation technology (machine translation technology) has become a very important research direction. With the rapid development of machine translation technology, The quality evaluation of machine translation has come into being. We need to measure the translation quality of the machine translation system, and it is not the ultimate goal to complete the machine translation. We want to know how much machine translation can help people, and at the same time, to have a general assessment of the quality of machine translation, and to learn about a better machine translation system. The traditional method of evaluating machine translations is manual evaluation, but because of its time-consuming, expensive and unrepeatable results, Has been partially replaced by automated evaluation methods. The current mainstream automated evaluation methods use the same strategy: compare machine translations to one or more manual translations (reference translations), And think that a machine translation that is very similar to the reference translation is certainly more accurate than those that differ greatly from the reference translation. However, due to the diversity of semantics and expressions, A sentence in the source language may have many different correct translation results (i.e., translation diversity, and the reference translation is limited, which can lead in some cases to an accurate assessment of the quality of the translation by automatic evaluation methods. At the same time, this problem also limits the translation ability of machine translation systems. In this paper, we make improvements to the shortcomings of the current automated evaluation methods in terms of translation diversity. The number of reference translations we can obtain is limited, so this paper proposes an automatic method for obtaining more information from limited resources. We explore the influence of different evaluation methods and the selection of different reference translations on the machine translation system. Secondly, we extend the existing reference translations to some data sets with multiple reference translations. By constructing a reference translation map to obtain more information, for most of the data sets where there is only one reference translation, the current reference translation can be extended by using the external monolingual resource English retelling table. A reference translation map with more information is obtained. Finally, by searching for the optimal path from the reference translation map to improve efficiency, the automatic method is applied to the existing automatic evaluation methods. Help to improve the translation capabilities of the machine translation system itself. The automatic method of obtaining more information from limited resources in this paper can obtain more abundant and diverse reference translation information more quickly. For the expansion of multiple reference translations, the machine translation can be evaluated more accurately. For the expansion of a single reference translation, it can not only evaluate the system translation more accurately, but also reduce the system performance difference caused by using different translation, and apply this method to the training process of translation system. Effectively improve the translation system ability.
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:H085
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳倩;謝旭升;;譯文質(zhì)量與譯者傳統(tǒng)角色的顛覆[J];伊犁師范學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2011年02期
2 肖安法;;論譯文質(zhì)量的檢驗(yàn)[J];常州工學(xué)院學(xué)報(bào)(社科版);2013年04期
3 徐盛桓;譯文質(zhì)量評(píng)估的數(shù)學(xué)模型[J];華南師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);1987年04期
4 熱外都拉,李培環(huán);對(duì)一些譯文的意見(jiàn)[J];語(yǔ)言與翻譯;1989年01期
5 李立達(dá);談“雅”及譯文的“雅”處理[J];內(nèi)江師范學(xué)院學(xué)報(bào);1990年01期
6 曾謝巖;談?wù)剣?guó)際會(huì)議通知的譯文質(zhì)量[J];中國(guó)科技翻譯;1993年02期
7 劉憲軍;地方外宣資料譯文質(zhì)量亟待提高[J];中國(guó)科技翻譯;1998年02期
8 姚雪梅;;文學(xué)譯文的翻譯策略分析:如何關(guān)照譯文的讀者[J];芒種;2012年13期
9 劉精香;一篇珠圓玉潤(rùn)的譯文——淺評(píng)How to Mark a Book的漢譯[J];大學(xué)英語(yǔ);1993年04期
10 韓子滿;過(guò)猶不及——淺論譯文的歸化問(wèn)題[J];外語(yǔ)教學(xué);2000年02期
相關(guān)會(huì)議論文 前9條
1 葉立林;;譯文質(zhì)量的主觀評(píng)價(jià)[A];貴州省翻譯工作者協(xié)會(huì)第6屆會(huì)員代表大會(huì)暨2007年翻譯學(xué)術(shù)年會(huì)論文集[C];2007年
2 侯敏;侯敞;;漢英機(jī)譯系統(tǒng)譯文質(zhì)量的評(píng)測(cè)[A];世紀(jì)之交的中國(guó)應(yīng)用語(yǔ)言學(xué)研究——第二屆全國(guó)語(yǔ)言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];1998年
3 朱憲超;;十年翻譯路(2000-2010)——談?wù)勎覍?duì)翻譯工作的幾點(diǎn)認(rèn)識(shí)[A];全國(guó)首屆翻譯碩士(MTI)教育與翻譯產(chǎn)業(yè)研討會(huì)論文集[C];2009年
4 周玲;;理解對(duì)譯者意味著什么[A];國(guó)際交流學(xué)院科研論文集(第四期)[C];1997年
5 董振東;董強(qiáng);;機(jī)譯研究中的一些誤區(qū)——從譯文質(zhì)量分析看[A];自然語(yǔ)言理解與機(jī)器翻譯——全國(guó)第六屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2001年
6 陳絳;;評(píng)《中國(guó)的現(xiàn)代化》的名詞翻譯——兼及若干譯本的譯名問(wèn)題[A];近代中國(guó)(第二輯)[C];1991年
7 陳可;;論高語(yǔ)速語(yǔ)境下中英同傳的簡(jiǎn)約處理[A];中國(guó)翻譯學(xué)學(xué)科建設(shè)高層論壇摘要[C];2013年
8 張霄軍;楊云峰;;英語(yǔ)否定句的四種機(jī)譯質(zhì)量評(píng)析[A];機(jī)器翻譯研究進(jìn)展——2002年全國(guó)機(jī)器翻譯研討會(huì)論文集[C];2002年
9 靳寧;賈德江;;再論關(guān)聯(lián)理論對(duì)翻譯的解釋力[A];中國(guó)英漢語(yǔ)比較研究會(huì)第七次全國(guó)學(xué)術(shù)研討會(huì)論文集[C];2006年
相關(guān)重要報(bào)紙文章 前9條
1 馮威;譯著質(zhì)量:一個(gè)死角?[N];中國(guó)新聞出版報(bào);2005年
2 林曉琴 福建師范大學(xué)外國(guó)語(yǔ)學(xué)院;生態(tài)翻譯學(xué):“三位一體”,譯者主導(dǎo)[N];中國(guó)社會(huì)科學(xué)報(bào);2012年
3 蔣一帆;郵集翻譯的質(zhì)量標(biāo)準(zhǔn)[N];中國(guó)集郵報(bào);2009年
4 張衛(wèi)族;《杰克·韋爾奇自傳》翻譯硬傷多得令人憂慮[N];中國(guó)新聞出版報(bào);2003年
5 王鳴陽(yáng);談科技翻譯質(zhì)量[N];中華讀書報(bào);2002年
6 本報(bào)記者 田小滿;學(xué)者解析當(dāng)下學(xué)術(shù)翻譯癥結(jié)[N];中國(guó)社會(huì)科學(xué)報(bào);2011年
7 葛崇岳;也說(shuō)文學(xué)翻譯信、達(dá)、雅[N];安徽日?qǐng)?bào);2004年
8 勿罔;翻譯大獎(jiǎng)外行勝內(nèi)行[N];中華讀書報(bào);2001年
9 林會(huì)敏(書評(píng)人);譯海里的夜行燈塔[N];中國(guó)圖書商報(bào);2006年
相關(guān)碩士學(xué)位論文 前10條
1 徐娟;“南京市電子地圖地名翻譯”項(xiàng)目審校報(bào)告[D];南京理工大學(xué);2015年
2 王淼;傳播學(xué)視角下的《易經(jīng)》翻譯研究[D];華北電力大學(xué);2015年
3 梁瑾璇;漢語(yǔ)博物館文本英譯問(wèn)題及其對(duì)策研究[D];山西大學(xué);2015年
4 奎地;論計(jì)算機(jī)輔助譯文質(zhì)量控制[D];青島科技大學(xué);2016年
5 丁國(guó)慶;視點(diǎn)轉(zhuǎn)換手法在《鹿王》視譯實(shí)踐中的運(yùn)用[D];吉林大學(xué);2016年
6 林新靖;英語(yǔ)節(jié)奏視角下的漢英筆譯效果研究[D];北京外國(guó)語(yǔ)大學(xué);2016年
7 徐夢(mèng)云;漢英同傳中脫離源語(yǔ)語(yǔ)言外殼對(duì)譯文質(zhì)量的影響[D];北京外國(guó)語(yǔ)大學(xué);2016年
8 馬瑞雪;不同耳機(jī)佩戴方式對(duì)英漢同傳質(zhì)量影響的比較研究[D];北京外國(guó)語(yǔ)大學(xué);2016年
9 李瑩;論發(fā)言人部分脫稿對(duì)英中帶稿和無(wú)稿同傳的影響[D];北京外國(guó)語(yǔ)大學(xué);2016年
10 王威;融合檢索技術(shù)的譯文推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2016年
,本文編號(hào):1662246
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/1662246.html