融合語言特征的印度英語-漢語神經(jīng)機(jī)器翻譯研究
發(fā)布時間:2021-12-12 12:05
隨著互聯(lián)網(wǎng)以及信息技術(shù)的飛速發(fā)展,人工智能領(lǐng)域越來越受到人們的重視,吸引了大批的研究人員和開發(fā)人員。機(jī)器翻譯是人工智能領(lǐng)域研究的熱點(diǎn),具有重要的理論意義和極大的應(yīng)用價值。本文研究旨在探究如何構(gòu)建印度英語-漢語的雙語語料庫,如何在通用英語-漢語神經(jīng)機(jī)器翻譯模型基礎(chǔ)上通過遷移學(xué)習(xí)訓(xùn)練印度英語-漢語神經(jīng)機(jī)器翻譯模型,如何把印度英語的語言特征與神經(jīng)網(wǎng)絡(luò)結(jié)合起來,如何設(shè)計并實(shí)現(xiàn)印度英語-漢語的神經(jīng)機(jī)器翻譯系統(tǒng)。針對上述問題,本文的主要工作如下:1、社交媒體印度英語語料的獲取。印度英語是一種典型的英語變體,受到印度歷史、地理、政治、經(jīng)濟(jì)、文化等多方面影響而帶有顯著的區(qū)別性特征,尤其是自然口語風(fēng)格的社交媒體語言,所以我們選取了一些社交媒體網(wǎng)站,通過爬蟲程序獲取網(wǎng)頁上的文本,再把文本處理之后得到語料。2、印度英語語言特征的研究。印度英語與美國英語、英國英語有所不同,有自己的一些語言特征,要把語言特征和神經(jīng)網(wǎng)絡(luò)很好地結(jié)合起來,就必須深入研究印度英語的語言特征,抓住了印度英語的語言特征,才有可能把語言特征融入到神經(jīng)網(wǎng)絡(luò)中,從而改善神經(jīng)機(jī)器翻譯模型的性能,提高譯文的質(zhì)量。3、遷移學(xué)習(xí)的運(yùn)用。與國際性的美國英...
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
機(jī)器翻譯金字塔RBMT方法能夠直接表達(dá)語言學(xué)的知識,能夠很好地從語言學(xué)的角度去解釋機(jī)器翻譯的運(yùn)
圖 2.2 循環(huán)神經(jīng)網(wǎng)絡(luò),左圖是 RNN 模型未展開的示意圖,展開后呈右圖所示。RNN 一共有三層入層,也就是 x,第二層是隱藏層也就是 h,第三層是輸出層 o。對于展開后的示其中的符號解釋如下: 是在 t 時刻訓(xùn)練樣本的輸入。 是在 t 時刻模型的隱藏狀態(tài), 由 和 共同決定。 是在 t 時刻模型的輸出, 只由模型當(dāng)前的隱藏狀態(tài) 決定。 是在 t 時刻模型的損失函數(shù)。 是在 t 時刻的訓(xùn)練輸出。U,W,V 這三個矩陣是模型的線性關(guān)系參數(shù)。多種技術(shù)混合以及改進(jìn)翻譯的主流技術(shù)主要有基于規(guī)則的機(jī)器翻譯技術(shù),基于實(shí)例的機(jī)器翻譯技術(shù)機(jī)器翻譯技術(shù)以及基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù)。從近幾年機(jī)器翻譯的發(fā)展一個技術(shù)單獨(dú)用于機(jī)器翻譯系統(tǒng)的做法十分少見,如果我們對我們構(gòu)建機(jī)器翻較高,那么我們就應(yīng)該結(jié)合其中兩種或兩種以上機(jī)器翻譯技術(shù)來構(gòu)建機(jī)器翻
樹的機(jī)器翻譯方法,其二是基于依存樹的機(jī)器翻譯方法。短語結(jié)構(gòu)樹的機(jī)器翻譯方法首先是建立了短語結(jié)構(gòu)語法樹,模型在翻譯的結(jié)構(gòu)語法樹作為外部知識引入模型中,從而完成翻譯;诙陶Z結(jié)構(gòu)樹的到串的機(jī)器翻譯模型為主,這種模型的復(fù)雜度比較低,只需要某一端的語這對于一些缺乏句法分析的語言來說無疑是一件好事。例如我們想做一個的機(jī)器翻譯系統(tǒng),那么在我們構(gòu)建機(jī)器翻譯時,是不需要對這些小語種做因為我們對英語的句法分析已經(jīng)足夠多了;跇涞酱P偷臋C(jī)器翻譯模比較突出,譯文質(zhì)量也相對較好。于依存樹的機(jī)器翻譯方法在詞與詞之間建立了依存關(guān)系,模型在翻譯時把并完成翻譯,翻譯的過程不僅關(guān)注統(tǒng)計的概率,也關(guān)注詞與詞之間的句法加了模型的知識,使得模型在翻譯時不再只是從概率去翻譯句子。和短語依存語法從依存的角度對句子進(jìn)行分析,對句子的分析更深入、更完整,譯。
【參考文獻(xiàn)】:
期刊論文
[1]融合單詞翻譯的神經(jīng)機(jī)器翻譯[J]. 韓冬,李軍輝,周國棟. 中文信息學(xué)報. 2019(07)
[2]印度英語特征研究[J]. 唐小寶. 海外英語. 2019(02)
[3]基于RNN的中文二分結(jié)構(gòu)句法分析[J]. 谷波,王瑞波,李濟(jì)洪,李國臣. 中文信息學(xué)報. 2019(01)
[4]基于神經(jīng)網(wǎng)絡(luò)的維漢翻譯系統(tǒng)實(shí)現(xiàn)[J]. 張勝剛,艾山·吾買爾,吐爾根·依布拉音,買合木提·買買提,米爾夏提·力提甫. 現(xiàn)代電子技術(shù). 2018(24)
[5]基于注意力卷積的神經(jīng)機(jī)器翻譯[J]. 汪琪,段湘煜. 計算機(jī)科學(xué). 2018(11)
[6]機(jī)器翻譯技術(shù)的研究和發(fā)展[J]. 王子航. 電子制作. 2018(22)
[7]基于LSTM的蒙漢機(jī)器翻譯的研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 計算機(jī)工程與科學(xué). 2018(10)
[8]基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)詞性標(biāo)注的蒙漢機(jī)器翻譯研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 中文信息學(xué)報. 2018(08)
[9]基于RNN和CNN的蒙漢神經(jīng)機(jī)器翻譯研究[J]. 包烏格德勒,趙小兵. 中文信息學(xué)報. 2018(08)
[10]RNN編碼器-解碼器在維漢機(jī)器翻譯中的應(yīng)用[J]. 帕麗旦·木合塔爾,吾守爾·斯拉木,買買提阿依甫,努爾麥麥提·尤魯瓦斯. 計算機(jī)工程與應(yīng)用. 2018(15)
博士論文
[1]融合結(jié)構(gòu)信息的神經(jīng)機(jī)器翻譯模型研究[D]. 王星.蘇州大學(xué) 2018
[2]基于神經(jīng)網(wǎng)絡(luò)的句法分析研究[D]. 周浩.南京大學(xué) 2017
碩士論文
[1]融合翻譯知識的漢越神經(jīng)機(jī)器翻譯研究與實(shí)現(xiàn)[D]. 王卓.昆明理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的漢語句法分析研究[D]. 王冰.杭州電子科技大學(xué) 2018
[3]基于深度學(xué)習(xí)的自然語言句法分析研究[D]. 周青宇.哈爾濱工業(yè)大學(xué) 2016
[4]基于深度學(xué)習(xí)的漢語詞義消歧方法研究[D]. 張晶瑩.黑龍江大學(xué) 2016
[5]基于循環(huán)神經(jīng)網(wǎng)絡(luò)的依存句法分析模型研究[D]. 張俊馳.湖北大學(xué) 2016
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 陳先昌.浙江工商大學(xué) 2014
本文編號:3536646
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
機(jī)器翻譯金字塔RBMT方法能夠直接表達(dá)語言學(xué)的知識,能夠很好地從語言學(xué)的角度去解釋機(jī)器翻譯的運(yùn)
圖 2.2 循環(huán)神經(jīng)網(wǎng)絡(luò),左圖是 RNN 模型未展開的示意圖,展開后呈右圖所示。RNN 一共有三層入層,也就是 x,第二層是隱藏層也就是 h,第三層是輸出層 o。對于展開后的示其中的符號解釋如下: 是在 t 時刻訓(xùn)練樣本的輸入。 是在 t 時刻模型的隱藏狀態(tài), 由 和 共同決定。 是在 t 時刻模型的輸出, 只由模型當(dāng)前的隱藏狀態(tài) 決定。 是在 t 時刻模型的損失函數(shù)。 是在 t 時刻的訓(xùn)練輸出。U,W,V 這三個矩陣是模型的線性關(guān)系參數(shù)。多種技術(shù)混合以及改進(jìn)翻譯的主流技術(shù)主要有基于規(guī)則的機(jī)器翻譯技術(shù),基于實(shí)例的機(jī)器翻譯技術(shù)機(jī)器翻譯技術(shù)以及基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù)。從近幾年機(jī)器翻譯的發(fā)展一個技術(shù)單獨(dú)用于機(jī)器翻譯系統(tǒng)的做法十分少見,如果我們對我們構(gòu)建機(jī)器翻較高,那么我們就應(yīng)該結(jié)合其中兩種或兩種以上機(jī)器翻譯技術(shù)來構(gòu)建機(jī)器翻
樹的機(jī)器翻譯方法,其二是基于依存樹的機(jī)器翻譯方法。短語結(jié)構(gòu)樹的機(jī)器翻譯方法首先是建立了短語結(jié)構(gòu)語法樹,模型在翻譯的結(jié)構(gòu)語法樹作為外部知識引入模型中,從而完成翻譯;诙陶Z結(jié)構(gòu)樹的到串的機(jī)器翻譯模型為主,這種模型的復(fù)雜度比較低,只需要某一端的語這對于一些缺乏句法分析的語言來說無疑是一件好事。例如我們想做一個的機(jī)器翻譯系統(tǒng),那么在我們構(gòu)建機(jī)器翻譯時,是不需要對這些小語種做因為我們對英語的句法分析已經(jīng)足夠多了;跇涞酱P偷臋C(jī)器翻譯模比較突出,譯文質(zhì)量也相對較好。于依存樹的機(jī)器翻譯方法在詞與詞之間建立了依存關(guān)系,模型在翻譯時把并完成翻譯,翻譯的過程不僅關(guān)注統(tǒng)計的概率,也關(guān)注詞與詞之間的句法加了模型的知識,使得模型在翻譯時不再只是從概率去翻譯句子。和短語依存語法從依存的角度對句子進(jìn)行分析,對句子的分析更深入、更完整,譯。
【參考文獻(xiàn)】:
期刊論文
[1]融合單詞翻譯的神經(jīng)機(jī)器翻譯[J]. 韓冬,李軍輝,周國棟. 中文信息學(xué)報. 2019(07)
[2]印度英語特征研究[J]. 唐小寶. 海外英語. 2019(02)
[3]基于RNN的中文二分結(jié)構(gòu)句法分析[J]. 谷波,王瑞波,李濟(jì)洪,李國臣. 中文信息學(xué)報. 2019(01)
[4]基于神經(jīng)網(wǎng)絡(luò)的維漢翻譯系統(tǒng)實(shí)現(xiàn)[J]. 張勝剛,艾山·吾買爾,吐爾根·依布拉音,買合木提·買買提,米爾夏提·力提甫. 現(xiàn)代電子技術(shù). 2018(24)
[5]基于注意力卷積的神經(jīng)機(jī)器翻譯[J]. 汪琪,段湘煜. 計算機(jī)科學(xué). 2018(11)
[6]機(jī)器翻譯技術(shù)的研究和發(fā)展[J]. 王子航. 電子制作. 2018(22)
[7]基于LSTM的蒙漢機(jī)器翻譯的研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 計算機(jī)工程與科學(xué). 2018(10)
[8]基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)詞性標(biāo)注的蒙漢機(jī)器翻譯研究[J]. 劉婉婉,蘇依拉,烏尼爾,仁慶道爾吉. 中文信息學(xué)報. 2018(08)
[9]基于RNN和CNN的蒙漢神經(jīng)機(jī)器翻譯研究[J]. 包烏格德勒,趙小兵. 中文信息學(xué)報. 2018(08)
[10]RNN編碼器-解碼器在維漢機(jī)器翻譯中的應(yīng)用[J]. 帕麗旦·木合塔爾,吾守爾·斯拉木,買買提阿依甫,努爾麥麥提·尤魯瓦斯. 計算機(jī)工程與應(yīng)用. 2018(15)
博士論文
[1]融合結(jié)構(gòu)信息的神經(jīng)機(jī)器翻譯模型研究[D]. 王星.蘇州大學(xué) 2018
[2]基于神經(jīng)網(wǎng)絡(luò)的句法分析研究[D]. 周浩.南京大學(xué) 2017
碩士論文
[1]融合翻譯知識的漢越神經(jīng)機(jī)器翻譯研究與實(shí)現(xiàn)[D]. 王卓.昆明理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的漢語句法分析研究[D]. 王冰.杭州電子科技大學(xué) 2018
[3]基于深度學(xué)習(xí)的自然語言句法分析研究[D]. 周青宇.哈爾濱工業(yè)大學(xué) 2016
[4]基于深度學(xué)習(xí)的漢語詞義消歧方法研究[D]. 張晶瑩.黑龍江大學(xué) 2016
[5]基于循環(huán)神經(jīng)網(wǎng)絡(luò)的依存句法分析模型研究[D]. 張俊馳.湖北大學(xué) 2016
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 陳先昌.浙江工商大學(xué) 2014
本文編號:3536646
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/3536646.html
最近更新
教材專著