基于層次狄利克雷過程的交互式主題建模
本文關(guān)鍵詞:基于層次狄利克雷過程的交互式主題建模
更多相關(guān)文章: 文本可視化 主題模型 文本分析 層次狄利克雷過程
【摘要】:隨著信息技術(shù)的快速發(fā)展,大量的文本數(shù)據(jù)產(chǎn)生、被收集和存儲(chǔ).主題模型是文本分析的重要工具之一,被廣泛地應(yīng)用于分析大規(guī)模文本集.然而,主題模型通常無法直觀而有效地結(jié)合用戶的領(lǐng)域?qū)I(yè)知識(shí)對(duì)模型結(jié)果進(jìn)行修正.針對(duì)這一問題,提出了一個(gè)交互式可視分析系統(tǒng),幫助用戶對(duì)主題模型進(jìn)行交互修正.首先對(duì)層次狄利克雷過程進(jìn)行了改進(jìn),使其支持單詞約束;然后,使用矩陣視圖對(duì)主題模型進(jìn)行展示,并使用語義相關(guān)的詞云布局幫助用戶尋找單詞約束,用戶通過添加單詞約束迭代優(yōu)化主題模型;最后,通過案例分析及用戶研究來評(píng)價(jià)該系統(tǒng)的可用性.
【作者單位】: CAD&CG國家重點(diǎn)實(shí)驗(yàn)室(浙江大學(xué));
【基金】:國家自然科學(xué)基金(61472354) 國家高技術(shù)研究發(fā)展計(jì)劃(863)(2012AA12A404)~~
【分類號(hào)】:TP391.1
【正文快照】: 隨著技術(shù)的發(fā)展,大量的文本數(shù)據(jù)產(chǎn)生、被收集和存儲(chǔ).特別是近些年社交媒體的發(fā)展,每天都會(huì)產(chǎn)生大量的文本數(shù)據(jù).由于文本數(shù)據(jù)具有數(shù)據(jù)量巨大和非結(jié)構(gòu)化的特點(diǎn),從文本數(shù)據(jù)中挖掘出對(duì)用戶有價(jià)值的信息變得越來越具有挑戰(zhàn)性.在眾多的文本分析方法中,主題模型(topic model)可以從文
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 許珠香;江弋;;基于潛在狄利克雷分配模型的醫(yī)療數(shù)據(jù)研究[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年03期
2 許兩有;許珠香;;潛在狄利克雷分配模型在網(wǎng)絡(luò)日志的應(yīng)用[J];廈門大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
3 李湘東;巴志超;黃莉;;基于加權(quán)隱含狄利克雷分配模型的新聞話題挖掘方法[J];計(jì)算機(jī)應(yīng)用;2014年05期
4 楊賽;趙春霞;;基于隱含狄利克雷分配模型的圖像分類算法[J];計(jì)算機(jī)工程;2012年14期
5 李冬睿;李梅;;基于潛在狄利克雷分配的圖像多層視覺表示方法[J];計(jì)算機(jī)應(yīng)用;2013年08期
6 尹麗麗;張麗萍;王春暉;涂穎;劉東升;;基于潛在狄利克雷分配模型預(yù)測(cè)克隆代碼不一致變化的可能性[J];計(jì)算機(jī)應(yīng)用;2014年06期
7 董元元;陳基漓;唐小俠;;基于潛在狄利克雷分配模型和互信息的無監(jiān)督特征選取法[J];計(jì)算機(jī)應(yīng)用;2012年08期
8 江雨燕;李平;王清;;用于多標(biāo)簽分類的改進(jìn)Labeled LDA模型[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年04期
9 ;[J];;年期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 梁鎮(zhèn)鋒;基于狄利克雷混合過程半監(jiān)督分類模型研究[D];中山大學(xué);2013年
,本文編號(hào):1254366
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1254366.html