基于Q-LDA主題模型的網(wǎng)絡(luò)健康社區(qū)主題挖掘研究
發(fā)布時間:2024-02-03 16:45
【目的】信息質(zhì)量是主題發(fā)現(xiàn)的重要影響因素,通過構(gòu)建Q-LDA模型進行網(wǎng)絡(luò)健康社區(qū)主題挖掘,彌補LDA主題模型在網(wǎng)絡(luò)信息質(zhì)量方面的不足,并增強模型的主題表示能力!痉椒ā垦芯烤W(wǎng)絡(luò)健康信息質(zhì)量評價體系,并對網(wǎng)絡(luò)健康信息進行質(zhì)量加權(quán),在LDA主題模型的基礎(chǔ)上建立Q-LDA主題挖掘模型,利用實際數(shù)據(jù)對模型進行驗證!窘Y(jié)果】Q-LDA模型的結(jié)果可解釋性和主題表達能力優(yōu)于傳統(tǒng)的LDA主題模型,其主題挖掘效率提高16%,能夠更有效地挖掘網(wǎng)絡(luò)健康社區(qū)信息所隱藏的主題!揪窒蕖恐贿x取網(wǎng)絡(luò)健康社區(qū)內(nèi)某一種疾病版塊的文本數(shù)據(jù),其代表性可能存在不足!窘Y(jié)論】在考慮網(wǎng)絡(luò)健康信息質(zhì)量的情況下進行主題挖掘,其結(jié)果能更好地滿足網(wǎng)絡(luò)健康社區(qū)用戶的需求。
【文章頁數(shù)】:8 頁
【部分圖文】:
本文編號:3894425
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1基于Q-LDA主題模型的知識發(fā)現(xiàn)模型
如何挖掘數(shù)據(jù)背后隱藏的信息以滿足社區(qū)用戶的健康信息需求是網(wǎng)絡(luò)健康數(shù)據(jù)研究的重點[29]。為充分滿足具有不同認知能力的社區(qū)用戶的健康知識需求,利用主題挖掘模型可以直觀表達網(wǎng)絡(luò)健康社區(qū)內(nèi)用戶關(guān)注的熱點主題,有利于用戶快速找到自己需要的健康信息。本文設(shè)計的主題挖掘模型如圖1所示。整個主....
圖2Q-LDA模型中隨主題數(shù)量變化的困惑度分布
由于主題表示結(jié)果的優(yōu)劣受到主題數(shù)量影響,為確定最優(yōu)主題數(shù)量,本文引入困惑度指標。困惑度是衡量主題建模結(jié)果的常用指標,能夠判斷出主題模型對于不確定數(shù)據(jù)的預(yù)測能力,其數(shù)值越小,表示主題的預(yù)測能力越好,模型在不同主題數(shù)進行實驗的困惑度值如圖2所示。隨著主題數(shù)的不斷增加,困惑度的數(shù)值會隨....
本文編號:3894425
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3894425.html
最近更新
教材專著