用于統(tǒng)計(jì)機(jī)器翻譯的上下文感知的雙語(yǔ)限制遞歸自編碼器
發(fā)布時(shí)間:2020-09-10 18:35
學(xué)習(xí)高質(zhì)量的短語(yǔ)表示一直是統(tǒng)計(jì)機(jī)器翻譯(SMT)中一個(gè)研究熱點(diǎn)。隨著單語(yǔ)短語(yǔ)表示學(xué)習(xí)研究的成功,許多方法被提出來(lái)用于雙語(yǔ)短語(yǔ)的表示學(xué)習(xí)。究其本質(zhì),這些方法的出發(fā)點(diǎn)都是建立在一個(gè)短語(yǔ)及其對(duì)應(yīng)的翻譯表示的語(yǔ)義是相同的。所以,在相同的語(yǔ)義空間中,一個(gè)短語(yǔ)及其對(duì)應(yīng)的翻譯應(yīng)該盡量接近。然而,現(xiàn)有的工作只考慮了短語(yǔ)內(nèi)部詞之間的組合關(guān)系。短語(yǔ)的語(yǔ)義受到其所在上下文的影響,對(duì)短語(yǔ)外部的信息的忽略會(huì)影響到短評(píng)語(yǔ)表示的學(xué)習(xí)。我們提出了一種融入主題信息的雙語(yǔ)短語(yǔ)的表示學(xué)習(xí)方法。通過(guò)將上下文信息融入到雙語(yǔ)短語(yǔ)的表示學(xué)習(xí)中,我們解決了上面提到的問(wèn)題。具體地,一方面,我們將短語(yǔ)所在文檔的主題分布和由遞歸自編碼器學(xué)習(xí)到的短語(yǔ)表示融合,得到帶有上下文信息的短語(yǔ)表示。另一方面,由主題模型得到的詞的主題分布反映了詞在主題空間的語(yǔ)義,我們將得到的詞的主題分布用于約束詞和主題表示的學(xué)習(xí)中。通過(guò)這種方式,我們希望具有相似主題分布的詞在語(yǔ)義空間中盡量接近,從而進(jìn)一步提高學(xué)習(xí)到的短語(yǔ)表示的質(zhì)量。與之前的雙語(yǔ)短語(yǔ)的表示學(xué)習(xí)方法相比,我們不但考慮了短語(yǔ)所在的上下文,而且建模了詞和主題之間的關(guān)系來(lái)約束模型的學(xué)習(xí)。在中文到英文機(jī)器翻譯上的試驗(yàn)結(jié)果表明我們的模型顯著提高了翻譯質(zhì)量。
【學(xué)位單位】:廈門(mén)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:TP391.1;H085
【部分圖文】:
谷歌翻譯
圖2.3:有道翻譯逡逑一個(gè)具體的翻譯例子。對(duì)于中文的詞“北”被翻譯成英文的“north”,我們可以在兩者逡逑之間話一條線。像這樣的連線關(guān)系,被稱(chēng)為對(duì)齊。圖對(duì)應(yīng)的對(duì)齊結(jié)果如圖2.5所示。逡逑詞的翻譯經(jīng)常是有歧義的。比如我們也可以將中的“北”翻譯成英文的“northern逡逑同樣的,對(duì)于同樣一個(gè)詞被翻譯成不同語(yǔ)義的詞的情況也很常見(jiàn),正確的翻譯需要逡逑依賴(lài)上下文。從圖2.5中也可以看出,對(duì)齊的詞之間的位置可能是不相同的?傮w來(lái)逡逑說(shuō),翻譯可以看成是先對(duì)詞進(jìn)行翻譯,然后對(duì)翻譯結(jié)果進(jìn)行調(diào)序的過(guò)程。逡逑However邋,邋the邋sky邋remained邋clear邋under邋the邋strong邋north邋wind邋.逡逑雖然邋北邋風(fēng)邋呼嘯,但天空依然邋十分邋m哄。辶x賢跡玻矗夯鞣肜渝義希齲錚鰨澹觶澹蟈,邋the邋sky邋}澹恚幔椋睿澹溴澹悖歟澹幔蟈澹酰睿洌澹蟈澹簦瑁邋澹螅簦潁錚睿玨澹睿錚潁簦楨澹鰨椋睿溴澹義纖淙槐狽綰糶ィ煒找廊皇智宄。辶x賢跡玻擔(dān)捍識(shí)云肜渝義隙雜諂叫芯潿裕ǎ
本文編號(hào):2816169
【學(xué)位單位】:廈門(mén)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:TP391.1;H085
【部分圖文】:
谷歌翻譯
圖2.3:有道翻譯逡逑一個(gè)具體的翻譯例子。對(duì)于中文的詞“北”被翻譯成英文的“north”,我們可以在兩者逡逑之間話一條線。像這樣的連線關(guān)系,被稱(chēng)為對(duì)齊。圖對(duì)應(yīng)的對(duì)齊結(jié)果如圖2.5所示。逡逑詞的翻譯經(jīng)常是有歧義的。比如我們也可以將中的“北”翻譯成英文的“northern逡逑同樣的,對(duì)于同樣一個(gè)詞被翻譯成不同語(yǔ)義的詞的情況也很常見(jiàn),正確的翻譯需要逡逑依賴(lài)上下文。從圖2.5中也可以看出,對(duì)齊的詞之間的位置可能是不相同的?傮w來(lái)逡逑說(shuō),翻譯可以看成是先對(duì)詞進(jìn)行翻譯,然后對(duì)翻譯結(jié)果進(jìn)行調(diào)序的過(guò)程。逡逑However邋,邋the邋sky邋remained邋clear邋under邋the邋strong邋north邋wind邋.逡逑雖然邋北邋風(fēng)邋呼嘯,但天空依然邋十分邋m哄。辶x賢跡玻矗夯鞣肜渝義希齲錚鰨澹觶澹蟈,邋the邋sky邋}澹恚幔椋睿澹溴澹悖歟澹幔蟈澹酰睿洌澹蟈澹簦瑁邋澹螅簦潁錚睿玨澹睿錚潁簦楨澹鰨椋睿溴澹義纖淙槐狽綰糶ィ煒找廊皇智宄。辶x賢跡玻擔(dān)捍識(shí)云肜渝義隙雜諂叫芯潿裕ǎ
本文編號(hào):2816169
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2816169.html
最近更新
教材專(zhuān)著