基于LDA的主題演化模型研究及應(yīng)用
發(fā)布時間:2021-03-08 07:11
隨著互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,呈爆炸性增長的數(shù)據(jù)資源給人們帶來嚴(yán)重的信息過載問題.挖掘文本數(shù)據(jù)中的主題信息隨時間變化的情況,可以幫助人們更好地從海量數(shù)據(jù)中獲取有效信息.基于LDA的主題演化模型通過結(jié)合時間特征對文本數(shù)據(jù)進(jìn)行分析,能夠及時發(fā)現(xiàn)熱點主題,并反映熱點主題的演化趨勢,為解決信息過載問題提供了一個很好的途徑.本文研究細(xì)粒度主題發(fā)現(xiàn)及演化模型,旨在分析時序文本中目標(biāo)主題的演化情況.區(qū)別于傳統(tǒng)的粗粒度主題演化模型,本文基于LDA主題模型的一種擴展模型TTM,對人們感興趣的主題進(jìn)行演化趨勢分析.本文的主要研究成果如下:1.提出一種基于TTM的先離散式主題演化方法.該方法能對目標(biāo)主題的內(nèi)容進(jìn)行演化關(guān)系分析.并利用有效的主題關(guān)聯(lián)過濾規(guī)則解決不同時間窗口上主題難以對齊的問題.2.提出一種基于TTM的后離散式主題演化方法.該方法能進(jìn)行有針對性的目標(biāo)主題建模,并反映目標(biāo)主題的強度演化趨勢.3.提出一種嵌入式目標(biāo)主題演化模型TTOT.該模型通過針板先驗對目標(biāo)主題進(jìn)行稀疏建模,并利用服從貝塔分布的時間變量分析目標(biāo)主題隨時間的變化情況.因此TTOT模型能夠同時進(jìn)行目標(biāo)主題發(fā)現(xiàn)及其演化分析,而無須將文本數(shù)據(jù)...
【文章來源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
LDA的圖模型
TTM的圖模型
NIPS論文數(shù)據(jù)分布圖
本文編號:3070639
【文章來源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
LDA的圖模型
TTM的圖模型
NIPS論文數(shù)據(jù)分布圖
本文編號:3070639
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3070639.html
最近更新
教材專著