基于雙語平行語料庫的“V+到NP+”漢韓翻譯對比研究
構(gòu)建一個(gè)雙語平行語料庫的主要任務(wù)是雙語語料的加工和其對語料庫的組織。為了更好地進(jìn)行這兩項(xiàng)工作,首先需要保證語料庫的質(zhì)量和規(guī)模,之后再推進(jìn)語料庫的構(gòu)建。關(guān)于平行語料庫(parallelcorpus)的定義,主要有3種觀點(diǎn)。第一種觀點(diǎn)認(rèn)為平巧語料庫由取樣標(biāo)準(zhǔn)相同的單語語料庫構(gòu)成,即將"parallel"理解為語料取樣標(biāo)準(zhǔn)的一致性。第二種觀點(diǎn)認(rèn)為平行語料庫由原文文本以及與之對應(yīng)的譯文文本構(gòu)成,即將"parallel"理解為一種翻譯對應(yīng)關(guān)系。而第三種觀點(diǎn)比較折中,認(rèn)為以上兩種語料庫均屬于平行語料庫范疇。自然語言處理是利用計(jì)算機(jī)理解、生成、分析人類語言的一種人工智能技術(shù)。自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。自然語言處理并不是一般地研究自然語言,而是研制能有效地實(shí)現(xiàn)自然語言通信的計(jì)算機(jī)系統(tǒng),特別是其中的軟件系統(tǒng)。因而它是計(jì)算機(jī)科學(xué)的一部分。實(shí)現(xiàn)人機(jī)之間自然語言通信意味著要讓計(jì)算機(jī)既能理解自然語言文本的含義,也能以自然語言文本來表達(dá)給定的意圖、思想等。前者稱為自然語言理解,后者稱為自然語言生成。
......
第二章人民日報(bào)《中央日報(bào)"V+到+NP"對比分析
第一節(jié)《人民》的"V+到+NP"結(jié)構(gòu)分折
由〈表3>可知,在《人民日報(bào)》的"V+到+NP"結(jié)構(gòu)所使用的單音節(jié)動詞中,出現(xiàn)次數(shù)最多的動詞是"看、來、找",這3個(gè)動詞的出現(xiàn)次數(shù)都在100次以上。具體而言,動詞"看"的出現(xiàn)次數(shù)最多,使用"看"的句子共有312個(gè),動詞"看"占單音節(jié)動詞總數(shù)的21.3%。出現(xiàn)次數(shù)居第二位的動詞是"來",使用"來"的句子共有192個(gè),動詞"來"占單音節(jié)動詞總數(shù)的13.1%。動詞"找"的出現(xiàn)次數(shù)排在第三,使用"找"的句子共有105個(gè),動詞"找"占單音節(jié)動詞總數(shù)的7.2%。
第二節(jié)《中央》(漢鋒)的"V+到+NP"結(jié)構(gòu)分析
《中央日報(bào)》中使用"V+到+NP"結(jié)構(gòu)的句子共有3380個(gè),這些句子中所使用的動詞共有445個(gè)。首先,由單音節(jié)動詞構(gòu)成的句子共有20巧個(gè),頻度為59.6%,所使用的單音節(jié)動詞共有122個(gè),頻度為27.4%。其次,由雙音節(jié)動詞構(gòu)成的句子共有13化次,占"V+到+NP"結(jié)構(gòu)的句子總數(shù)的40.4%,所使用的雙音節(jié)動詞共有323個(gè),占整體動詞的72.6%。依據(jù)上述統(tǒng)計(jì)結(jié)果可知,和《人民日報(bào)》情況相同,《中央日報(bào)》中使用單音節(jié)動詞的"V+到+NP"結(jié)構(gòu)的句子占句子總數(shù)的一半以上,但是雙音節(jié)動詞在整體動詞中所占的比率是單音節(jié)動詞所占比率的2倍以上!吨醒肴請(bào)》中出現(xiàn)的"V+到+NP"結(jié)構(gòu)所使用的全體動詞的統(tǒng)計(jì)結(jié)果顯示在〈附錄3>、〈附錄4>中,將在句子總數(shù)中所占比例為0.03%的動詞排除在外。第三章、"V+到+NP"結(jié)構(gòu)的用例統(tǒng)計(jì).........21
第一節(jié)"V+到+NP(一般)"結(jié)構(gòu)分類..................14第二節(jié)"V+到+NP(處所)"結(jié)構(gòu)分類..........25
第三節(jié)"V+到+NP(時(shí)間)"結(jié)構(gòu)的分類..........30
第四節(jié)"V+到+NP(數(shù)量)"結(jié)構(gòu)的分類..........33
第四章、"V+到+NP"韓譯助詞與形態(tài)功能分析..........67
第五章中韓機(jī)器翻譯"V+到+NP"對比分析..........87
第一節(jié)機(jī)器翻譯偏誤類型..........87
第二節(jié)"V+到+NP"四種類型的人機(jī)翻譯對比分析..........95
第五章中韓機(jī)器翻譯"V+到+NP"對比分析
第一節(jié)機(jī)器翻鋒偏誤類型
與統(tǒng)計(jì)方式相比,基于實(shí)例的機(jī)器翻譯方法是通過雙語語料庫在翻譯的過程中還要查詢并利用語解庫。在基于實(shí)例的機(jī)器翻譯中,實(shí)例是從真實(shí)存在的翻譯語料庫中抽取而來的。其基本思想由日本著名的機(jī)器翻譯專家長尾真提出,其分析外語初學(xué)者的基本模式,發(fā)現(xiàn)初學(xué)外語的人總是先記住最基本的英語句子和對應(yīng)的日語句子,而后做替換練習(xí)。其翻譯過程是首先將源語言正確分解為句子,然后分解為短語碎片,使用類比的方法把這些短語碎片譯成目標(biāo)語言短語,最后把該些短語合并成長句的結(jié)構(gòu)。但是,因?yàn)槭芟抻谡Z料庫規(guī)模,這種方法很難達(dá)到較高的匹配率。所以只有限定在比較窄的或者專業(yè)的領(lǐng)域時(shí),翻譯效果才能達(dá)到使用者的要求。因而到目前為止,還很少有機(jī)器翻譯系統(tǒng)采用純粹的基于實(shí)例的方法。第二節(jié)"V+到+NP"四種類型的人機(jī)葡譯對比分析
本論文以平行語料庫的"V+到+NP"結(jié)構(gòu)的四種類型為重點(diǎn),對人機(jī)翻譯進(jìn)行對比研究。下面將首先限定本論文的研究范圍。(一)研究對象不包括沒有得到機(jī)器翻譯譯文的句子。這是因?yàn)槿舴治龃祟惥渥?則在對比人機(jī)翻譯時(shí),不能掌捏正確的統(tǒng)計(jì)、對比、分析結(jié)果。(二)研究對象不包括機(jī)器翻譯中的嚴(yán)重病句。由于機(jī)器翻譯本身的局限性,在翻譯過程中,經(jīng)常會出現(xiàn)嚴(yán)重病句。對于此類不能判別源語言和目標(biāo)語言之間關(guān)系的病句,本論文將其排除在研究范圍之外。(三)在由2-3個(gè)句子組成的復(fù)雜長句中,僅截取包含"V+到+NP"結(jié)構(gòu)的部分進(jìn)行分析。本論文所使用的語料庫中存在很多以逗號連接而成的復(fù)合句。此類情況和(一)(二)的情況相似,無法對人工翻譯和機(jī)器翻譯的所有句子進(jìn)行對比。因而本論文只選取包含"V+到+NP"結(jié)構(gòu)的部分進(jìn)行研究。本論文搜集了《人民日報(bào)》和《中央日報(bào)》兩年期間的中文語料和韓文語料,構(gòu)建了語料庫,以語料庫為基礎(chǔ)捜羅包含"V+到+NP"結(jié)構(gòu)的所有句子,構(gòu)建了雙語平行語料庫。........
本論文的研究目的在于通過雙語平行語料,全面研究、闡明和"V+到+NP"結(jié)構(gòu)互相對應(yīng)的所有韓語語法形態(tài)。迄今為止,有關(guān)"V+到+NP"結(jié)構(gòu)的研究主要是針對"到"的詞性的研究和針對"V+到+NP"結(jié)構(gòu)的類型及語法意義的研究。然而和前述的既有研究相比,有關(guān)"V+到+NP"結(jié)構(gòu)漢韓翻譯的硏究非常之少,尤其很難找到有關(guān)"V+到+NP"結(jié)構(gòu)和韓文句子對應(yīng)情況的研究。本論文將基于雙語平行語料庫,以分析"V+到+NP"結(jié)構(gòu)的漢韓翻譯惰況,闡明"V+到+NP"結(jié)構(gòu)和韓文的對應(yīng)形式為研究目的。
........
參考文獻(xiàn)(略)
,
本文編號:98593
本文鏈接:http://sikaile.net/wenshubaike/lwfw/98593.html