天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Q-LDA主題模型的網(wǎng)絡(luò)健康社區(qū)主題挖掘研究

發(fā)布時間:2024-02-03 16:45
  【目的】信息質(zhì)量是主題發(fā)現(xiàn)的重要影響因素,通過構(gòu)建Q-LDA模型進行網(wǎng)絡(luò)健康社區(qū)主題挖掘,彌補LDA主題模型在網(wǎng)絡(luò)信息質(zhì)量方面的不足,并增強模型的主題表示能力!痉椒ā垦芯烤W(wǎng)絡(luò)健康信息質(zhì)量評價體系,并對網(wǎng)絡(luò)健康信息進行質(zhì)量加權(quán),在LDA主題模型的基礎(chǔ)上建立Q-LDA主題挖掘模型,利用實際數(shù)據(jù)對模型進行驗證!窘Y(jié)果】Q-LDA模型的結(jié)果可解釋性和主題表達能力優(yōu)于傳統(tǒng)的LDA主題模型,其主題挖掘效率提高16%,能夠更有效地挖掘網(wǎng)絡(luò)健康社區(qū)信息所隱藏的主題!揪窒蕖恐贿x取網(wǎng)絡(luò)健康社區(qū)內(nèi)某一種疾病版塊的文本數(shù)據(jù),其代表性可能存在不足!窘Y(jié)論】在考慮網(wǎng)絡(luò)健康信息質(zhì)量的情況下進行主題挖掘,其結(jié)果能更好地滿足網(wǎng)絡(luò)健康社區(qū)用戶的需求。

【文章頁數(shù)】:8 頁

【部分圖文】:

圖1基于Q-LDA主題模型的知識發(fā)現(xiàn)模型

圖1基于Q-LDA主題模型的知識發(fā)現(xiàn)模型

如何挖掘數(shù)據(jù)背后隱藏的信息以滿足社區(qū)用戶的健康信息需求是網(wǎng)絡(luò)健康數(shù)據(jù)研究的重點[29]。為充分滿足具有不同認知能力的社區(qū)用戶的健康知識需求,利用主題挖掘模型可以直觀表達網(wǎng)絡(luò)健康社區(qū)內(nèi)用戶關(guān)注的熱點主題,有利于用戶快速找到自己需要的健康信息。本文設(shè)計的主題挖掘模型如圖1所示。整個主....


圖2Q-LDA模型中隨主題數(shù)量變化的困惑度分布

圖2Q-LDA模型中隨主題數(shù)量變化的困惑度分布

由于主題表示結(jié)果的優(yōu)劣受到主題數(shù)量影響,為確定最優(yōu)主題數(shù)量,本文引入困惑度指標。困惑度是衡量主題建模結(jié)果的常用指標,能夠判斷出主題模型對于不確定數(shù)據(jù)的預(yù)測能力,其數(shù)值越小,表示主題的預(yù)測能力越好,模型在不同主題數(shù)進行實驗的困惑度值如圖2所示。隨著主題數(shù)的不斷增加,困惑度的數(shù)值會隨....



本文編號:3894425

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3894425.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd7a8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com