基于主題模型的中文詞義歸納
本文選題:詞義歸納 切入點(diǎn):主題模型 出處:《四川大學(xué)學(xué)報(bào)(自然科學(xué)版)》2016年06期
【摘要】:詞義歸納是在給定包含多義詞語(yǔ)料的條件下,識(shí)別出多義詞詞義的過(guò)程,通常是采用聚類的方法.本文提出了基于主題模型的方法來(lái)解決中文詞義歸納問(wèn)題,基于主題模型的詞義歸納方法關(guān)鍵之處在于使用文檔的主題概率分布來(lái)推斷多義詞的詞義分布.實(shí)驗(yàn)結(jié)果表明,本文方法在測(cè)試數(shù)據(jù)上獲得了77.58%FScore值.
[Abstract]:Semantic induction is the process of recognizing the meaning of polysemous words under the given condition of containing polysemous words, usually by clustering. This paper proposes a method based on topic model to solve the problem of Chinese word meaning induction. The key point of the topic model-based word meaning induction method is to use the topic probability distribution of the document to infer the word meaning distribution of polysemous words. The experimental results show that the method has obtained the 77.58%FScore value on the test data.
【作者單位】: 四川大學(xué)電子信息學(xué)院;保密通信重點(diǎn)實(shí)驗(yàn)室;
【基金】:保密通信重點(diǎn)實(shí)驗(yàn)室基金(9140C110401140C11053)
【分類號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前7條
1 賴裕平;周亞建;丁洪偉;郭玉翠;郭春;楊義先;;混合逆狄利克雷分布的變分學(xué)習(xí)及應(yīng)用[J];電子學(xué)報(bào);2014年07期
2 溫臘;芮建武;何婷婷;郭亮;;利用并行GPU對(duì)分層分布式狄利克雷分布算法加速[J];計(jì)算機(jī)應(yīng)用;2013年12期
3 余傳明;張小青;陳雷;;基于LDA模型的評(píng)論熱點(diǎn)挖掘:原理與實(shí)現(xiàn)[J];情報(bào)理論與實(shí)踐;2010年05期
4 陳廣福;蔡國(guó)永;林航;王瑞麗;劉國(guó)賓;;多Agent系統(tǒng)中基于狄利克雷分布的信任模型[J];計(jì)算機(jī)工程;2011年14期
5 王旭仁;姚葉鵬;冉春風(fēng);何發(fā)鎂;;一種并行LDA主題模型建立方法研究[J];北京理工大學(xué)學(xué)報(bào);2013年06期
6 張彭成;翟玉慶;;基于可信機(jī)制的云服務(wù)提供商選擇模型[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2013年02期
7 ;[J];;年期
相關(guān)會(huì)議論文 前1條
1 林琛;汪衛(wèi);;Web論壇上的垃圾貼過(guò)濾[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
相關(guān)碩士學(xué)位論文 前4條
1 曹賴平;基于LDA聚類的語(yǔ)義Web服務(wù)發(fā)現(xiàn)[D];南京大學(xué);2016年
2 李云之;基于文本分析的標(biāo)簽推薦研究及實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
3 黃;;基于用戶概貌和評(píng)分序列的混合托攻擊檢測(cè)[D];重慶大學(xué);2014年
4 陳陽(yáng)平;基于概率生成主題模型的圖像場(chǎng)景分類方法研究[D];西安電子科技大學(xué);2014年
,本文編號(hào):1691779
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1691779.html