天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

英漢機(jī)器翻譯中的長(zhǎng)句切分處理問(wèn)題研究

發(fā)布時(shí)間:2017-05-24 02:06

  本文關(guān)鍵詞:英漢機(jī)器翻譯中的長(zhǎng)句切分處理問(wèn)題研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:機(jī)器翻譯一直是自然語(yǔ)言處理領(lǐng)域的重要研究方向之一。機(jī)器翻譯誕生于大約半個(gè)世紀(jì)以前。雖然歷經(jīng)了半個(gè)多世紀(jì)的發(fā)展,但目前機(jī)器翻譯的譯文質(zhì)量仍然不能令人滿(mǎn)意,尤其是在長(zhǎng)句的翻譯上,由于句子長(zhǎng)度過(guò)長(zhǎng)、句子成分復(fù)雜,譯文質(zhì)量往往會(huì)比普通句子的譯文差得多。如何針對(duì)長(zhǎng)句做適當(dāng)?shù)念A(yù)處理,已經(jīng)成為近年來(lái)機(jī)器翻譯研究者研究的熱點(diǎn)問(wèn)題。本文針對(duì)英漢機(jī)器翻譯的長(zhǎng)句預(yù)處理問(wèn)題,主要探究如何對(duì)英文長(zhǎng)句做適當(dāng)?shù)那蟹痔幚?通過(guò)把長(zhǎng)句切分為若干短句的方式,提升機(jī)器翻譯的譯文質(zhì)量。本文首先對(duì)英語(yǔ)長(zhǎng)句做了詳盡的分析,對(duì)英文長(zhǎng)句的特點(diǎn)及給機(jī)器翻譯系統(tǒng)翻譯帶來(lái)的困難等問(wèn)題做了探討,給出了針對(duì)本文工作的長(zhǎng)句的定量化定義,并且分析了漢語(yǔ)與英語(yǔ)在長(zhǎng)句使用上的不同。在以上分析的基礎(chǔ)上,針對(duì)現(xiàn)有的長(zhǎng)句切分方法難以處理含標(biāo)點(diǎn)符號(hào)少的長(zhǎng)句這一問(wèn)題,本文的主要思路是,借助在句中適當(dāng)位置添加逗號(hào)的方法切分句子。隨后,本文提出了一種基于多策略的英文長(zhǎng)句切分方法。該方法主要包括兩個(gè)模塊,一是基于依存句法的規(guī)則匹配切分方法,二是基于條件隨機(jī)場(chǎng)(CRF)序列標(biāo)注的切分方法;谝(guī)則匹配的切分方法主要使用句子的依存句法樹(shù)來(lái)識(shí)別句中的某些成分。該方法主要用于識(shí)別和處理句中較為明確、易于識(shí)別某些句子成分,并在這些句子成分的邊界添加逗號(hào)、切分句子。基于序列標(biāo)注的切分方法主要把“尋找句中合適的逗號(hào)位置”這一問(wèn)題轉(zhuǎn)化成一個(gè)序列標(biāo)注任務(wù),使用CRF對(duì)句中的逗號(hào)位置進(jìn)行建模,估計(jì)這些逗號(hào)在句中不同位置出現(xiàn)的概率,對(duì)句中合適的逗號(hào)位置進(jìn)行標(biāo)記。該方法主要針對(duì)難以使用規(guī)則識(shí)別、變化較多的現(xiàn)象和成分。以上兩個(gè)模塊主要采取平行處理的方式進(jìn)行集成,即二者分別對(duì)長(zhǎng)句進(jìn)行切分處理,得到兩組逗號(hào)添加位置,最后合并結(jié)果,在這些位置切分位置。兩個(gè)模塊相互補(bǔ)充,共同完成對(duì)長(zhǎng)句的切分。本文最后設(shè)計(jì)了兩組實(shí)驗(yàn),從不同的角度對(duì)本方法的有效性進(jìn)行驗(yàn)證。第一組實(shí)驗(yàn)是針對(duì)句子切分的有效性與合理性,第二組實(shí)驗(yàn)針對(duì)本文方法對(duì)于機(jī)器翻譯譯文質(zhì)量的影響。
【關(guān)鍵詞】:機(jī)器翻譯 長(zhǎng)句切分 預(yù)處理 條件隨機(jī)場(chǎng) CRF
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.2
【目錄】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第1章 緒論10-14
  • 1.1 課題背景及研究意義11-12
  • 1.2 本文主要工作12-13
  • 1.3 本文組織結(jié)構(gòu)13-14
  • 第2章 機(jī)器翻譯概述及相關(guān)研究現(xiàn)狀14-21
  • 2.1 概述14
  • 2.2 機(jī)器翻譯主要方法概述14-16
  • 2.2.1 基于規(guī)則的機(jī)器翻譯14-15
  • 2.2.2 基于統(tǒng)計(jì)的機(jī)器翻譯15-16
  • 2.3 長(zhǎng)句切分處理現(xiàn)有工作16-20
  • 2.3.1 基于規(guī)則的處理方法17-18
  • 2.3.2 基于統(tǒng)計(jì)的長(zhǎng)句分割處理方法18
  • 2.3.3 基于翻譯的長(zhǎng)句處理方法18-20
  • 2.4 本章小結(jié)20-21
  • 第3章 多策略英文長(zhǎng)句切分處理方法21-37
  • 3.1 概述21
  • 3.2 針對(duì)英文長(zhǎng)句的分析21-25
  • 3.2.1 英文長(zhǎng)句對(duì)機(jī)器翻譯質(zhì)量的影響21-23
  • 3.2.2 漢語(yǔ)與英語(yǔ)在使用長(zhǎng)句策略上的區(qū)別分析23-25
  • 3.3 基于依存句法的規(guī)則匹配切分方法25-31
  • 3.3.1 依存句法概述25-26
  • 3.3.2 規(guī)則匹配切分法適用的句子成分26-28
  • 3.3.3 規(guī)則匹配切分方法28-31
  • 3.4 基于CRF序列標(biāo)注的切分處理方法31-35
  • 3.4.1 條件隨機(jī)場(chǎng)(CRF)概述31-33
  • 3.4.2 基于CRF序列標(biāo)注的切分方法33-35
  • 3.5 本章小結(jié)35-37
  • 第4章 多策略長(zhǎng)句切分方法的實(shí)驗(yàn)37-48
  • 4.1 概述37
  • 4.2 原型系統(tǒng)的架構(gòu)設(shè)計(jì)37-40
  • 4.2.1 兩種切分方法的集成方式37-38
  • 4.2.2 條件隨機(jī)場(chǎng)模型的訓(xùn)練38-40
  • 4.3 句子切分實(shí)驗(yàn)40-43
  • 4.3.1 句子切分方面的有效性和合理性40-42
  • 4.3.2 訓(xùn)練集規(guī)模對(duì)性能的影響42-43
  • 4.4 機(jī)器翻譯預(yù)處理實(shí)驗(yàn)43-46
  • 4.4.1 實(shí)驗(yàn)設(shè)置43-44
  • 4.4.2 實(shí)驗(yàn)結(jié)果與分析44-46
  • 4.5 本章小結(jié)46-48
  • 第5章 總結(jié)與展望48-50
  • 5.1 本文工作總結(jié)48-49
  • 5.2 未來(lái)工作展望49-50
  • 參考文獻(xiàn)50-54
  • 攻讀碩士學(xué)位期間發(fā)表的論文54-55
  • 致謝55

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 金錫謨;;漫談長(zhǎng)句運(yùn)用中的弊病(三)[J];新聞與寫(xiě)作;1989年08期

2 施濟(jì)博;;“馬拉松”式的長(zhǎng)句[J];新聞業(yè)務(wù);1963年02期

3 王海泉;;廣播語(yǔ)言要變長(zhǎng)句為短句[J];新聞?dòng)浾?1986年02期

4 張蝶娜;;公安文書(shū)長(zhǎng)句運(yùn)用[J];政法學(xué)刊;1988年02期

5 金笙;;漫話(huà)長(zhǎng)句[J];新聞界;1989年03期

6 金錫謨;;漫談長(zhǎng)句運(yùn)用中的弊病(一)[J];新聞與寫(xiě)作;1989年06期

7 金錫謨;忌艱澀 求暢達(dá)(下)──文風(fēng)雜談之五[J];新聞與寫(xiě)作;1999年06期

8 白如江;楊振瑜;王效岳;;基于KeyGraph關(guān)鍵詞抽取的長(zhǎng)句查詢(xún)擴(kuò)展技術(shù)研究[J];情報(bào)理論與實(shí)踐;2014年06期

9 張秋菊;德語(yǔ)科技文獻(xiàn)中被動(dòng)語(yǔ)態(tài)和長(zhǎng)句的翻譯技巧[J];科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì);2002年04期

10 蔣曉紅;;把句子寫(xiě)短些[J];新聞戰(zhàn)線(xiàn);1984年10期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條

1 楊麗達(dá);;《大學(xué)英語(yǔ)》課文中的長(zhǎng)句翻譯[A];貴州省翻譯工作者協(xié)會(huì)2005年會(huì)暨學(xué)術(shù)交流會(huì)論文集[C];2005年

2 賀f ;李久進(jìn);;要處理好科技語(yǔ)體中長(zhǎng)句與短句的關(guān)系[A];慶祝中華人民共和國(guó)成立50周年編輯學(xué)論文集[C];1999年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條

1 肥城市實(shí)驗(yàn)中學(xué) 李海濱;認(rèn)清規(guī)律,注重方法,巧解閱讀[N];學(xué)知報(bào);2011年

2 孟州五中 張淑英;英語(yǔ)閱讀能力提高初探[N];學(xué)知報(bào);2011年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 張金寧;韓譯中長(zhǎng)句翻譯方法研究[D];煙臺(tái)大學(xué);2013年

2 孫娟;以交際為目標(biāo):長(zhǎng)句翻譯探討[D];蘭州大學(xué);2015年

3 鄭麗麗;《日本的職業(yè)教育—基于比較與過(guò)渡視點(diǎn)的職業(yè)教育學(xué)》(第五、六章)翻譯實(shí)踐報(bào)告[D];曲阜師范大學(xué);2015年

4 秦嘉藝;海上事故調(diào)查報(bào)告中長(zhǎng)句翻譯的實(shí)踐報(bào)告[D];大連海事大學(xué);2015年

5 杜培艷;《失去發(fā)言權(quán)的人》英譯漢翻譯實(shí)踐報(bào)告—英文長(zhǎng)句的翻譯與信息表達(dá)[D];新疆師范大學(xué);2015年

6 王慧榮;簡(jiǎn)析日語(yǔ)長(zhǎng)句翻譯方法[D];山西大學(xué);2015年

7 李亞湘;長(zhǎng)句的翻譯[D];廣東外語(yǔ)外貿(mào)大學(xué);2015年

8 劉君君;英譯漢中長(zhǎng)句的翻譯策略[D];山西大學(xué);2015年

9 邢嵐;關(guān)于長(zhǎng)句的翻譯技巧[D];哈爾濱師范大學(xué);2015年

10 任瑤瑤;日語(yǔ)長(zhǎng)句的漢譯技巧探索[D];吉林大學(xué);2015年


  本文關(guān)鍵詞:英漢機(jī)器翻譯中的長(zhǎng)句切分處理問(wèn)題研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):389578

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/389578.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)1673a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com