基于Q-LDA主題模型的網(wǎng)絡(luò)健康社區(qū)主題挖掘研究
發(fā)布時(shí)間:2024-02-03 16:45
【目的】信息質(zhì)量是主題發(fā)現(xiàn)的重要影響因素,通過(guò)構(gòu)建Q-LDA模型進(jìn)行網(wǎng)絡(luò)健康社區(qū)主題挖掘,彌補(bǔ)LDA主題模型在網(wǎng)絡(luò)信息質(zhì)量方面的不足,并增強(qiáng)模型的主題表示能力!痉椒ā垦芯烤W(wǎng)絡(luò)健康信息質(zhì)量評(píng)價(jià)體系,并對(duì)網(wǎng)絡(luò)健康信息進(jìn)行質(zhì)量加權(quán),在LDA主題模型的基礎(chǔ)上建立Q-LDA主題挖掘模型,利用實(shí)際數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證!窘Y(jié)果】Q-LDA模型的結(jié)果可解釋性和主題表達(dá)能力優(yōu)于傳統(tǒng)的LDA主題模型,其主題挖掘效率提高16%,能夠更有效地挖掘網(wǎng)絡(luò)健康社區(qū)信息所隱藏的主題!揪窒蕖恐贿x取網(wǎng)絡(luò)健康社區(qū)內(nèi)某一種疾病版塊的文本數(shù)據(jù),其代表性可能存在不足!窘Y(jié)論】在考慮網(wǎng)絡(luò)健康信息質(zhì)量的情況下進(jìn)行主題挖掘,其結(jié)果能更好地滿足網(wǎng)絡(luò)健康社區(qū)用戶的需求。
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
本文編號(hào):3894425
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
圖1基于Q-LDA主題模型的知識(shí)發(fā)現(xiàn)模型
如何挖掘數(shù)據(jù)背后隱藏的信息以滿足社區(qū)用戶的健康信息需求是網(wǎng)絡(luò)健康數(shù)據(jù)研究的重點(diǎn)[29]。為充分滿足具有不同認(rèn)知能力的社區(qū)用戶的健康知識(shí)需求,利用主題挖掘模型可以直觀表達(dá)網(wǎng)絡(luò)健康社區(qū)內(nèi)用戶關(guān)注的熱點(diǎn)主題,有利于用戶快速找到自己需要的健康信息。本文設(shè)計(jì)的主題挖掘模型如圖1所示。整個(gè)主....
圖2Q-LDA模型中隨主題數(shù)量變化的困惑度分布
由于主題表示結(jié)果的優(yōu)劣受到主題數(shù)量影響,為確定最優(yōu)主題數(shù)量,本文引入困惑度指標(biāo)。困惑度是衡量主題建模結(jié)果的常用指標(biāo),能夠判斷出主題模型對(duì)于不確定數(shù)據(jù)的預(yù)測(cè)能力,其數(shù)值越小,表示主題的預(yù)測(cè)能力越好,模型在不同主題數(shù)進(jìn)行實(shí)驗(yàn)的困惑度值如圖2所示。隨著主題數(shù)的不斷增加,困惑度的數(shù)值會(huì)隨....
本文編號(hào):3894425
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3894425.html
最近更新
教材專著