天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

藏漢跨語言話題模型構(gòu)建及對齊方法研究

發(fā)布時間:2018-11-14 08:54
【摘要】:如何獲取藏文話題在其他語種中的相關(guān)信息,對于促進少數(shù)民族地區(qū)的社會管理科學化水平、維護民族團結(jié)和國家統(tǒng)一、構(gòu)建和諧社會具有重要意義。目前大多數(shù)研究集中在英漢跨語言信息處理方面,針對藏漢跨語言研究較少。如何根據(jù)藏語、漢語的特點,并結(jié)合目前藏語信息處理的研究現(xiàn)狀,實現(xiàn)藏漢多角度的社會網(wǎng)絡(luò)關(guān)系關(guān)聯(lián),同步發(fā)現(xiàn)關(guān)注話題并進行數(shù)據(jù)比較,是迫切需要解決的問題。該文在藏漢可比語料的基礎(chǔ)上,利用詞向量對文本詞語進行語義擴展,進而構(gòu)建LDA話題模型,并利用Gibbs sampling進行模型參數(shù)的估計,抽取出藏語和漢語話題。在LDA話題模型生成的文檔-話題分布的基礎(chǔ)上,提出一種基于余弦相似度、歐氏距離、Hellinger距離和KL距離四種相似度算法的投票方法,來實現(xiàn)藏漢話題的對齊。
[Abstract]:How to obtain the relevant information of Tibetan topics in other languages is of great significance to promote the scientific level of social management in minority areas, maintain national unity and national unity, and build a harmonious society. At present, most researches focus on English and Chinese cross-language information processing, but few on Tibetan and Chinese. According to the characteristics of Tibetan and Chinese and the current research situation of Tibetan information processing, it is urgent to solve the problem that how to realize the social network relation of Tibetan and Chinese, find the topic of concern and compare the data simultaneously. On the basis of Tibetan and Chinese comparable corpus, this paper uses word vector to extend the semantic of text words, and then constructs LDA topic model, and estimates the parameters of the model by using Gibbs sampling to extract Tibetan and Chinese topics. On the basis of document-topic distribution generated by LDA topic model, a voting method based on four similarity algorithms, cosine similarity, Euclidean distance, Hellinger distance and KL distance, is proposed to achieve the alignment of Tibetan and Chinese topics.
【作者單位】: 中央民族大學信息工程學院;國家語言資源監(jiān)測與研究中心少數(shù)民族語言分中心;
【基金】:國家自然科學基金(61501529,61331013) 國家語委項目(ZDI125-36,YB125-139)
【分類號】:H214;H136;TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 鄭張尚芳;;補《敦煌〈藏漢對照詞語〉殘卷考辨訂誤》[J];民族語文;1992年04期

2 金家新;蘭英;;論“中華民族多元一體”視閾下的藏漢雙語教育[J];民族教育研究;2009年03期

3 李雙劍 ,曲尼;從藏漢諺語比較看藏漢民族的友好關(guān)系[J];中央民族學院學報;1987年01期

4 才讓措;;關(guān)于藏漢翻譯中的文化差異淺析[J];商;2014年04期

5 扎雅·洛桑普赤;從語言哲學的角度思考藏漢互譯的可能性問題[J];西藏研究;2003年03期

6 扎洛;;藏區(qū)藏漢雙語學生類型及學校類型研究[J];青海師范大學學報(哲學社會科學版);2008年06期

7 慈仁翁姆;淺談藏漢翻譯中專班的實踐教學:實習[J];康定學刊;1996年03期

8 土登達杰;;淺談藏漢互譯對西藏社會的貢獻[J];西藏科技;2014年07期

9 尼瑪卓瑪;;藏漢民族的文化差異對翻譯的影響[J];文學教育(中);2012年07期

10 洛松澤仁;;藏漢互譯中的文化差異的探討[J];青年文學家;2011年18期

相關(guān)會議論文 前1條

1 華卻才讓;;藏漢句子局部對齊策略的研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年

相關(guān)重要報紙文章 前4條

1 記者 陳彥玲;地區(qū)多措并舉推進藏漢“雙語”活動深入開展[N];林芝報(漢);2014年

2 記者 何龍 石志安;吳德剛來我州調(diào)研基層干部藏漢“雙語”培訓工作[N];甘南日報(漢文版);2014年

3 安微 記者 松濤 周前進;藏漢雙語培訓以口語基本會話為主[N];四川日報;2013年

4 藺以光;云南迪慶推行藏漢雙語教育初見成效[N];中國民族報;2008年

相關(guān)碩士學位論文 前9條

1 萬瑪吉;藏語辭藻及其翻譯研究[D];西北民族大學;2015年

2 楊忠措;藏漢顏色詞譯法研究[D];西藏大學;2016年

3 丁子牙;藏漢思維方式與翻譯研究[D];西北民族大學;2011年

4 伊澤卓瑪;略談藏翻譯之政論文的翻譯[D];西藏大學;2015年

5 拉毛卓瑪;藏漢常用詞匯比較[D];青海師范大學;2012年

6 尼瑪卓瑪;藏漢單句翻譯研究[D];西藏大學;2013年

7 卡毛姐;論藏漢翻譯中的歸化與異化問題[D];西北民族大學;2005年

8 關(guān)卻才郎;談藏漢歷史文獻中的譯名對當代人名翻譯之影響[D];西藏大學;2013年

9 吾見才讓;試論藏漢翻譯的虛詞翻譯方法[D];西北民族大學;2006年

,

本文編號:2330709

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/2330709.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6f11d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com