天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 外語論文 > 小語種論文 >

漢語—泰語的跨語言查詢翻譯和擴(kuò)展

發(fā)布時(shí)間:2020-06-09 20:47
【摘要】:近年來,隨著中國和泰國關(guān)系的發(fā)展,兩國之間在文化、經(jīng)濟(jì)、政治等各個(gè)方面的交流也不斷深入。由于漢語和泰語屬于兩種不同的語言,為網(wǎng)絡(luò)信息交流和溝通帶來了很多的障礙。為了更好的分享互聯(lián)網(wǎng)信息,促進(jìn)中泰網(wǎng)絡(luò)信息交流,跨語言信息檢索技術(shù)的研究被提上了日程,它可以很好的解決此語言交流問題。為了提高漢語-泰語的跨語言信息檢索的性能,本文研究了漢泰跨語言查詢翻譯和查詢擴(kuò)展。目前在漢-泰雙語語言信息化研究方面,主要集中在泰語或漢語本身的詞法、句法、及語義方面的研究,而專門針對(duì)漢語和泰語之間的信息處理方面,如漢語與泰語之間的機(jī)器翻譯、查詢擴(kuò)展等方面的研究工作開展的工作還比較少。在漢語到泰語的翻譯研究中,當(dāng)前沒有合適的雙語詞典作為翻譯工具,而且很多未登錄詞和命名實(shí)體也無法用詞典翻譯,同時(shí)也容易產(chǎn)生翻譯歧義的問題;由于沒有合適的知識(shí)庫作為擴(kuò)展詞的來源,對(duì)泰語擴(kuò)展詞的研究帶來了一定的難度。針對(duì)以上問題,主要完成了以下研究工作:(1)基于Word2Vec的漢語查詢語句的翻譯方法針對(duì)漢語查詢語句的翻譯,本文提出了一種基于深度學(xué)習(xí)工具Word2Vec的漢泰翻譯方法。該方法首先需要將漢泰可比語料庫中的詞,利用Word2Vec工具訓(xùn)練成詞向量的形式,以此可以方便挖掘出漢語和泰語詞與詞之間的線性映射關(guān)系,此線性映射關(guān)系體現(xiàn)在將不同語言中,概念相似的詞的詞向量映射到向量空間中其空間分布是相似的。本文利用這種相似分布關(guān)系訓(xùn)練出漢泰的翻譯矩陣,并通過翻譯矩陣獲取到泰語翻譯候選詞。(2)泰語翻譯候選詞的選取針對(duì)翻譯歧義問題,本文利用漢語和泰語雙語之間的詞與詞之間的翻譯概率關(guān)系,結(jié)合單語詞與詞之間的關(guān)聯(lián)關(guān)系,提出了一種泰語翻譯候選詞的篩選方法,用來消除翻譯歧義并得到最優(yōu)的翻譯泰語詞。(3)泰語查詢擴(kuò)展模型的構(gòu)建為了提高檢索系統(tǒng)的性能,本文提出了一種基于偽相關(guān)反饋法的泰語查詢擴(kuò)展方法。該方法的核心思想主要是應(yīng)用Lucene檢索技術(shù)檢索返回相關(guān)文檔集,并將返回的相關(guān)文檔作為擴(kuò)展詞的來源,再利用將KL距離和詞共現(xiàn)兩種擴(kuò)展技術(shù)通過Borda Count排序法相結(jié)合的方法,計(jì)算得出查詢擴(kuò)展詞。最后,將擴(kuò)展詞添加到原查詢語句中,最終可得到泰語查詢擴(kuò)展語句。(4)設(shè)計(jì)并實(shí)現(xiàn)漢泰跨語言查詢翻譯和擴(kuò)展的原型系統(tǒng),為進(jìn)一步研究漢泰跨語言信息檢索提供了平臺(tái),為以后的跨語言查詢擴(kuò)展的研究做好堅(jiān)實(shí)的基礎(chǔ)。
【學(xué)位授予單位】:昆明理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:H412

【相似文獻(xiàn)】

相關(guān)會(huì)議論文 前10條

1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴(kuò)展的數(shù)字檔案檢索策略[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年

2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴(kuò)展[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

3 林建方;李生;鄭德權(quán);;基于詞語搭配關(guān)系的查詢擴(kuò)展方法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

4 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

5 李東園;白宇;蔡?hào)|風(fēng);;基于用戶日志分析的查詢擴(kuò)展研究[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年

6 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯二[C];2010年

7 王秉卿;張奇;吳立德;黃萱菁;;機(jī)器學(xué)習(xí)的查詢擴(kuò)展在博客檢索中的應(yīng)用[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年

8 王秉卿;黃萱菁;;基于線性模型的查詢擴(kuò)展方法[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

9 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

10 郭文;史曉東;陳毅東;;跨語言信息檢索中的查詢擴(kuò)展[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年

相關(guān)重要報(bào)紙文章 前1條

1 鐘威 何擁軍;數(shù)字檔案信息擴(kuò)展查詢功能需求分析及實(shí)現(xiàn)方式[N];中國檔案報(bào);2011年

相關(guān)博士學(xué)位論文 前3條

1 郭曉黎;煤礦安全事件本體及其在查詢擴(kuò)展中的應(yīng)用研究[D];中國礦業(yè)大學(xué)(北京);2016年

2 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年

3 王俊義;正負(fù)相關(guān)反饋與查詢擴(kuò)展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 吳德鈺;基于標(biāo)簽篩選的文檔排序方法研究[D];華中師范大學(xué);2015年

2 李維銀;基于有監(jiān)督學(xué)習(xí)的查詢擴(kuò)展技術(shù)研究[D];北京理工大學(xué);2015年

3 鐘廷偉;生物醫(yī)學(xué)文本的標(biāo)注與檢索研究[D];電子科技大學(xué);2015年

4 王宇;煤礦安全事件本體構(gòu)建及其查詢擴(kuò)展的研究與應(yīng)用[D];北京工業(yè)大學(xué);2015年

5 崔倩倩;基于文檔重構(gòu)的查詢擴(kuò)展[D];北京工業(yè)大學(xué);2015年

6 陳建榮;基于用戶反饋的智能查詢擴(kuò)展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年

7 燕澤權(quán);基于主題模型的查詢擴(kuò)展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年

8 鄭永軍;基于DMLS的語音關(guān)鍵詞檢測(cè)技術(shù)研究[D];解放軍信息工程大學(xué);2014年

9 李云飛;基于查詢?nèi)罩镜膭?dòng)態(tài)查詢擴(kuò)展研究[D];內(nèi)蒙古大學(xué);2016年

10 楊振瑜;基于概念語義相似度的長(zhǎng)句查詢擴(kuò)展研究[D];山東理工大學(xué);2013年

,

本文編號(hào):2705233

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/waiyulunwen/zhichangyingyu/2705233.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶db46d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com