藏漢跨語言話題模型構(gòu)建及對齊方法研究
[Abstract]:How to obtain the relevant information of Tibetan topics in other languages is of great significance to promote the scientific level of social management in minority areas, maintain national unity and national unity, and build a harmonious society. At present, most researches focus on English and Chinese cross-language information processing, but few on Tibetan and Chinese. According to the characteristics of Tibetan and Chinese and the current research situation of Tibetan information processing, it is urgent to solve the problem that how to realize the social network relation of Tibetan and Chinese, find the topic of concern and compare the data simultaneously. On the basis of Tibetan and Chinese comparable corpus, this paper uses word vector to extend the semantic of text words, and then constructs LDA topic model, and estimates the parameters of the model by using Gibbs sampling to extract Tibetan and Chinese topics. On the basis of document-topic distribution generated by LDA topic model, a voting method based on four similarity algorithms, cosine similarity, Euclidean distance, Hellinger distance and KL distance, is proposed to achieve the alignment of Tibetan and Chinese topics.
【作者單位】: 中央民族大學信息工程學院;國家語言資源監(jiān)測與研究中心少數(shù)民族語言分中心;
【基金】:國家自然科學基金(61501529,61331013) 國家語委項目(ZDI125-36,YB125-139)
【分類號】:H214;H136;TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 鄭張尚芳;;補《敦煌〈藏漢對照詞語〉殘卷考辨訂誤》[J];民族語文;1992年04期
2 金家新;蘭英;;論“中華民族多元一體”視閾下的藏漢雙語教育[J];民族教育研究;2009年03期
3 李雙劍 ,曲尼;從藏漢諺語比較看藏漢民族的友好關(guān)系[J];中央民族學院學報;1987年01期
4 才讓措;;關(guān)于藏漢翻譯中的文化差異淺析[J];商;2014年04期
5 扎雅·洛桑普赤;從語言哲學的角度思考藏漢互譯的可能性問題[J];西藏研究;2003年03期
6 扎洛;;藏區(qū)藏漢雙語學生類型及學校類型研究[J];青海師范大學學報(哲學社會科學版);2008年06期
7 慈仁翁姆;淺談藏漢翻譯中專班的實踐教學:實習[J];康定學刊;1996年03期
8 土登達杰;;淺談藏漢互譯對西藏社會的貢獻[J];西藏科技;2014年07期
9 尼瑪卓瑪;;藏漢民族的文化差異對翻譯的影響[J];文學教育(中);2012年07期
10 洛松澤仁;;藏漢互譯中的文化差異的探討[J];青年文學家;2011年18期
相關(guān)會議論文 前1條
1 華卻才讓;;藏漢句子局部對齊策略的研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
相關(guān)重要報紙文章 前4條
1 記者 陳彥玲;地區(qū)多措并舉推進藏漢“雙語”活動深入開展[N];林芝報(漢);2014年
2 記者 何龍 石志安;吳德剛來我州調(diào)研基層干部藏漢“雙語”培訓工作[N];甘南日報(漢文版);2014年
3 安微 記者 松濤 周前進;藏漢雙語培訓以口語基本會話為主[N];四川日報;2013年
4 藺以光;云南迪慶推行藏漢雙語教育初見成效[N];中國民族報;2008年
相關(guān)碩士學位論文 前9條
1 萬瑪吉;藏語辭藻及其翻譯研究[D];西北民族大學;2015年
2 楊忠措;藏漢顏色詞譯法研究[D];西藏大學;2016年
3 丁子牙;藏漢思維方式與翻譯研究[D];西北民族大學;2011年
4 伊澤卓瑪;略談藏翻譯之政論文的翻譯[D];西藏大學;2015年
5 拉毛卓瑪;藏漢常用詞匯比較[D];青海師范大學;2012年
6 尼瑪卓瑪;藏漢單句翻譯研究[D];西藏大學;2013年
7 卡毛姐;論藏漢翻譯中的歸化與異化問題[D];西北民族大學;2005年
8 關(guān)卻才郎;談藏漢歷史文獻中的譯名對當代人名翻譯之影響[D];西藏大學;2013年
9 吾見才讓;試論藏漢翻譯的虛詞翻譯方法[D];西北民族大學;2006年
,本文編號:2330709
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/2330709.html