基于神經(jīng)網(wǎng)絡(luò)的彝漢翻譯研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-12-26 22:14
溝通是人類社會生活的潤滑劑,良好的溝通可以提高工作效率,促進(jìn)社會和諧發(fā)展。而我們能良好溝通的前提是我們懂得對方的語言。中國是一個(gè)多民族多語言的國家。很多時(shí)候,兩個(gè)語言不同、又沒學(xué)過對方語言的人很難直接溝通。為了促進(jìn)各民族之間的相互了解,我們有必要研究各民族語言間的翻譯。同時(shí)還能保護(hù)和發(fā)揚(yáng)少數(shù)民族傳統(tǒng)文化,助力早日實(shí)現(xiàn)偉大復(fù)興的中國夢。彝族是分布在我國西南地區(qū)的一個(gè)少數(shù)民族,彝文也是我國的古老文字之一。為了解決彝族地區(qū)民族融合過程中存在的交流溝通困難問題,促進(jìn)彝族地區(qū)的經(jīng)濟(jì)文化發(fā)展。同時(shí)為了更好地發(fā)揚(yáng)優(yōu)秀的彝族傳統(tǒng)文化。借助近幾年發(fā)展迅速的深度學(xué)習(xí)技術(shù),本文開展了彝文相關(guān)的神經(jīng)機(jī)器翻譯研究工作,實(shí)現(xiàn)了從彝語到漢語的神經(jīng)機(jī)器翻譯。本文的主要工作分為以下三個(gè)部分:(1)為了完成彝漢神經(jīng)機(jī)器翻譯任務(wù),本文系統(tǒng)學(xué)習(xí)了神經(jīng)機(jī)器翻譯相關(guān)技術(shù)。鑒于沒有相關(guān)的彝文語料庫。本文收集整理彝文資料做成20萬的彝語單語語料,基于詞和彝文古詩的7萬對彝漢互譯語料庫。然后用收集的彝文詞匯在彝文單語語料上統(tǒng)計(jì)詞頻制作詞頻表,根據(jù)頻數(shù)權(quán)重抽取彝文詞匯構(gòu)造帶標(biāo)簽的偽彝文句子,訓(xùn)練雙向LSTM模型用來預(yù)測句子標(biāo)簽,最后結(jié)合...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
用戶界面展示
電子科技大學(xué)碩士學(xué)位論文58圖5-7用戶界面展示5.5.2翻譯效果展示為了展示本系統(tǒng)的翻譯效果,本文選用《漢彝翻譯技巧探微》中的兩個(gè)漢彝翻譯示例,通過系統(tǒng)譯文和參考譯文對比的方式來展現(xiàn)。翻譯示例一(如圖5-8所示):輸入彝文:,,,。系統(tǒng)譯文:兔子喜歡吃綠色食物,像青草,蔬菜,蘿卜。參考譯文:兔子喜吃綠色植物,如青草、蔬菜、蘿卜等。圖5-8彝語翻譯示例(一)翻譯示例二(如圖5-9所示):
第五章機(jī)器翻譯系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)59輸入彝文:40℃,,,,,。系統(tǒng)譯文:小孩皮膚熱40℃以上,抽筋容易,這樣在醫(yī)生話指引下,馬上應(yīng)該找皮膚熱壓的方法,像旁邊冷毛巾貼上,皮膚熱打針這樣。參考譯文:嬰幼兒發(fā)熱到40℃左右,容易引起抽筋,應(yīng)在醫(yī)生指導(dǎo)下及早采取有效的退熱方法,如頭上敷冷毛巾、打退熱針等。圖5-9彝語翻譯示例(二)從兩個(gè)翻譯示例可以看出,本系統(tǒng)對簡短語句的翻譯具有一定的可靠性。對于長語句,雖然能夠提供一定的源語信息,但由于彝漢語的語法結(jié)構(gòu)等方面存在較大差異,翻譯結(jié)果不盡如人意。當(dāng)對彝漢翻譯準(zhǔn)確性要求不是很高的時(shí)候,可以運(yùn)用本系統(tǒng)來獲取彝文信息。本章小結(jié)本章利用第三章提出的結(jié)合復(fù)值詞嵌入法、基于TransformerXL的雙編碼器雙解碼器翻譯模型,根據(jù)第四章翻譯對比試驗(yàn),采取翻譯效果最好的弱監(jiān)督學(xué)習(xí)方式訓(xùn)練的模型實(shí)現(xiàn)彝語到漢語的翻譯。詳細(xì)描述了彝漢神經(jīng)機(jī)器翻譯系統(tǒng)的實(shí)現(xiàn)過程。從系統(tǒng)總體架構(gòu)各層次的劃分及功能定義,各層次包含的功能模塊以及模塊之間的邏輯關(guān)系。到系統(tǒng)開發(fā)所用的功能軟件以及翻譯系統(tǒng)的部署、翻譯高效性和魯棒性測試,最后對翻譯系統(tǒng)的翻譯界面進(jìn)行展示。
【參考文獻(xiàn)】:
期刊論文
[1]基于Bi-LSTM-6Tags的智能中文分詞方法[J]. 王瑋. 計(jì)算機(jī)應(yīng)用. 2018(S2)
[2]彝文信息處理自動分詞技術(shù)的研究現(xiàn)狀與難點(diǎn)分析[J]. 王成平. 電腦知識與技術(shù). 2012(04)
[3]統(tǒng)計(jì)機(jī)器翻譯綜述[J]. 劉群. 中文信息學(xué)報(bào). 2003(04)
[4]機(jī)器翻譯的歷史和現(xiàn)狀[J]. 馮志偉. 國外自動化. 1984(04)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的維漢翻譯研究與實(shí)現(xiàn)[D]. 楊洋.電子科技大學(xué) 2019
[2]基于句法規(guī)則的彝漢雙語調(diào)序模型研究[D]. 王正麗.貴州大學(xué) 2016
[3]基于機(jī)器學(xué)習(xí)的少數(shù)民族語言翻譯關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 文佳勝.電子科技大學(xué) 2016
[4]基于最大熵的機(jī)器翻譯研究與實(shí)現(xiàn)[D]. 應(yīng)志野.電子科技大學(xué) 2016
本文編號:2940542
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
用戶界面展示
電子科技大學(xué)碩士學(xué)位論文58圖5-7用戶界面展示5.5.2翻譯效果展示為了展示本系統(tǒng)的翻譯效果,本文選用《漢彝翻譯技巧探微》中的兩個(gè)漢彝翻譯示例,通過系統(tǒng)譯文和參考譯文對比的方式來展現(xiàn)。翻譯示例一(如圖5-8所示):輸入彝文:,,,。系統(tǒng)譯文:兔子喜歡吃綠色食物,像青草,蔬菜,蘿卜。參考譯文:兔子喜吃綠色植物,如青草、蔬菜、蘿卜等。圖5-8彝語翻譯示例(一)翻譯示例二(如圖5-9所示):
第五章機(jī)器翻譯系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)59輸入彝文:40℃,,,,,。系統(tǒng)譯文:小孩皮膚熱40℃以上,抽筋容易,這樣在醫(yī)生話指引下,馬上應(yīng)該找皮膚熱壓的方法,像旁邊冷毛巾貼上,皮膚熱打針這樣。參考譯文:嬰幼兒發(fā)熱到40℃左右,容易引起抽筋,應(yīng)在醫(yī)生指導(dǎo)下及早采取有效的退熱方法,如頭上敷冷毛巾、打退熱針等。圖5-9彝語翻譯示例(二)從兩個(gè)翻譯示例可以看出,本系統(tǒng)對簡短語句的翻譯具有一定的可靠性。對于長語句,雖然能夠提供一定的源語信息,但由于彝漢語的語法結(jié)構(gòu)等方面存在較大差異,翻譯結(jié)果不盡如人意。當(dāng)對彝漢翻譯準(zhǔn)確性要求不是很高的時(shí)候,可以運(yùn)用本系統(tǒng)來獲取彝文信息。本章小結(jié)本章利用第三章提出的結(jié)合復(fù)值詞嵌入法、基于TransformerXL的雙編碼器雙解碼器翻譯模型,根據(jù)第四章翻譯對比試驗(yàn),采取翻譯效果最好的弱監(jiān)督學(xué)習(xí)方式訓(xùn)練的模型實(shí)現(xiàn)彝語到漢語的翻譯。詳細(xì)描述了彝漢神經(jīng)機(jī)器翻譯系統(tǒng)的實(shí)現(xiàn)過程。從系統(tǒng)總體架構(gòu)各層次的劃分及功能定義,各層次包含的功能模塊以及模塊之間的邏輯關(guān)系。到系統(tǒng)開發(fā)所用的功能軟件以及翻譯系統(tǒng)的部署、翻譯高效性和魯棒性測試,最后對翻譯系統(tǒng)的翻譯界面進(jìn)行展示。
【參考文獻(xiàn)】:
期刊論文
[1]基于Bi-LSTM-6Tags的智能中文分詞方法[J]. 王瑋. 計(jì)算機(jī)應(yīng)用. 2018(S2)
[2]彝文信息處理自動分詞技術(shù)的研究現(xiàn)狀與難點(diǎn)分析[J]. 王成平. 電腦知識與技術(shù). 2012(04)
[3]統(tǒng)計(jì)機(jī)器翻譯綜述[J]. 劉群. 中文信息學(xué)報(bào). 2003(04)
[4]機(jī)器翻譯的歷史和現(xiàn)狀[J]. 馮志偉. 國外自動化. 1984(04)
碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的維漢翻譯研究與實(shí)現(xiàn)[D]. 楊洋.電子科技大學(xué) 2019
[2]基于句法規(guī)則的彝漢雙語調(diào)序模型研究[D]. 王正麗.貴州大學(xué) 2016
[3]基于機(jī)器學(xué)習(xí)的少數(shù)民族語言翻譯關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D]. 文佳勝.電子科技大學(xué) 2016
[4]基于最大熵的機(jī)器翻譯研究與實(shí)現(xiàn)[D]. 應(yīng)志野.電子科技大學(xué) 2016
本文編號:2940542
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2940542.html
最近更新
教材專著