一種面向詞匯突發(fā)的連續(xù)時(shí)間主題模型
發(fā)布時(shí)間:2017-12-14 20:31
本文關(guān)鍵詞:一種面向詞匯突發(fā)的連續(xù)時(shí)間主題模型
更多相關(guān)文章: 主題模型 潛在Dirichlet分配 詞匯突發(fā) Dirichlet組合多項(xiàng)式 Gibbs采樣 不動(dòng)點(diǎn)迭代法
【摘要】:針對(duì)傳統(tǒng)基于多項(xiàng)式分布的主題模型不能較好地刻畫文檔中詞匯突發(fā)的現(xiàn)象,綜合考慮文本集固有的時(shí)間信息,提出一種面向詞匯突發(fā)的Dirichlet組合多項(xiàng)式(DCM)連續(xù)時(shí)間主題模型。采用DCM分布對(duì)文本集中的詞匯突發(fā)現(xiàn)象進(jìn)行建模,利用Beta分布刻畫文本集中的時(shí)間特征,通過(guò)Gibbs采樣和不動(dòng)點(diǎn)迭代法實(shí)現(xiàn)模型參數(shù)的估計(jì)。實(shí)驗(yàn)結(jié)果表明,在預(yù)設(shè)主題數(shù)目較少的情況下,與To T和DCMLDA模型相比,該模型具有明顯的泛化性能優(yōu)勢(shì),并且可以有效揭示出文本集中潛在的主題演化趨勢(shì)。
【作者單位】: 海南大學(xué)信息科學(xué)技術(shù)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61462022)
【分類號(hào)】:TP391.1
【正文快照】: 中文引用格式:劉良選,黃夢(mèng)醒.一種面向詞匯突發(fā)的連續(xù)時(shí)間主題模型[J].計(jì)算機(jī)工程,2016,42(11):195-201.英文引用格式:Liu Liangxuan,Huang Mengxing.A Continuous-time Topic Model for Word Burstiness[J].ComputerEngineering,2016,42(11):195-201.0概述隨著信息技術(shù)的快速,
本文編號(hào):1289303
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1289303.html
最近更新
教材專著