天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主題模型的突發(fā)話題檢測(cè)與追蹤方法研究

發(fā)布時(shí)間:2022-12-04 15:04
  近年來(lái),隨著Web2.0社交網(wǎng)絡(luò)的興起,微博憑借其簡(jiǎn)單方便等突出的優(yōu)點(diǎn)迅速普及,已成為人們發(fā)布和接收信息的重要方式,同時(shí)也為人們共享信息提供了重要的公共平臺(tái)。微博每時(shí)每刻都在產(chǎn)生數(shù)以億計(jì)的文本信息流,而這些海量的文本流中蘊(yùn)含著豐富的潛在知識(shí)。在微博中,用戶可以瀏覽感興趣的話題并且閱讀討論與該話題有關(guān)的文本內(nèi)容。當(dāng)人們關(guān)心的話題發(fā)生時(shí),與之相關(guān)的微博數(shù)量就會(huì)在短時(shí)間內(nèi)呈現(xiàn)迸發(fā)激增的狀態(tài)。微博的突發(fā)話題即為在短時(shí)間內(nèi)對(duì)用戶以及社會(huì)產(chǎn)生強(qiáng)烈影響的新興網(wǎng)絡(luò)話題。因此,如果能夠在海量的微博數(shù)據(jù)中及時(shí)檢測(cè)出突發(fā)話題,了解人們對(duì)突發(fā)話題的各種觀點(diǎn)和感受,既可以應(yīng)用于政府和其他相關(guān)部門對(duì)互聯(lián)網(wǎng)輿情的控制,也可以幫助企業(yè)及時(shí)制定服務(wù)于商業(yè)領(lǐng)域的有效策略;同時(shí)分析微博用戶對(duì)突發(fā)話題的關(guān)注行為還有益于改善個(gè)性化的用戶服務(wù)?梢,從微博短文本流中檢測(cè)并追蹤突發(fā)話題具有重要的應(yīng)用價(jià)值。然而,微博文本流屬于短文本流,從短文本流中檢測(cè)突發(fā)話題更具挑戰(zhàn)性。為此,本文從以下三個(gè)方面對(duì)微博突發(fā)話題檢測(cè)與追蹤的方法進(jìn)行了分析與研究:(1)充分利用微博文本中的突發(fā)特征,提出了一種基于BTM主題模型的微博突發(fā)話題檢測(cè)方法。該方... 

【文章頁(yè)數(shù)】:82 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景與研究意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 主題模型研究現(xiàn)狀
        1.2.2 突發(fā)話題檢測(cè)研究現(xiàn)狀
        1.2.3 突發(fā)話題演化追蹤研究現(xiàn)狀
    1.3 本文研究?jī)?nèi)容
    1.4 論文組織結(jié)構(gòu)
    1.5 本章小結(jié)
第2章 相關(guān)理論基礎(chǔ)和技術(shù)
    2.1 主題模型
        2.1.1 概率潛在語(yǔ)義索引模型PLSI
        2.1.2 隱含狄利克雷分布主題模型LDA
        2.1.3 稀疏主題模型BTM
    2.2 聚類算法分析概述
    2.3 概率分布相似度概述
    2.4 本章小結(jié)
第3章 基于BTM模型的微博突發(fā)話題檢測(cè)方法
    3.1 引言
    3.2 基于時(shí)間窗口的微博文本獲取
    3.3 微博突發(fā)特征的提取
        3.3.1 候選突發(fā)特征的提取
        3.3.2 重復(fù)偽突發(fā)特征的有效過(guò)濾
        3.3.3 傳統(tǒng)物理動(dòng)力學(xué)模型的改進(jìn)
    3.4 基于BTM模型的突發(fā)話題主題建模
        3.4.1 BTM主題模型
        3.4.2 基于BTM主題模型的話題分類
    3.5 實(shí)驗(yàn)及結(jié)果分析
        3.5.1 實(shí)驗(yàn)環(huán)境
        3.5.2 實(shí)驗(yàn)數(shù)據(jù)
        3.5.3 實(shí)驗(yàn)結(jié)果與分析
        3.5.4 對(duì)比實(shí)驗(yàn)
    3.6 本章小結(jié)
第4章 基于BTM模型的微博突發(fā)話題的演化追蹤方法
    4.1 引言
    4.2 微博突發(fā)話題演化的數(shù)據(jù)預(yù)處理
    4.3 微博突發(fā)話題演化模型
        4.3.1 微博突發(fā)話題演化的參數(shù)判斷方法
        4.3.2 微博突發(fā)話題演化主題發(fā)現(xiàn)算法
    4.4 演化模型的參數(shù)估計(jì)
    4.5 微博突發(fā)話題演化追蹤分析
    4.6 實(shí)驗(yàn)結(jié)果與分析
        4.6.1 實(shí)驗(yàn)環(huán)境
        4.6.2 實(shí)驗(yàn)數(shù)據(jù)
        4.6.3 微博突發(fā)話題演化追蹤結(jié)果分析
        4.6.4 對(duì)比實(shí)驗(yàn)
    4.7 本章小結(jié)
第5章 微博突發(fā)話題檢測(cè)方法的應(yīng)用與分析
    5.1 引言
    5.2 工作流程設(shè)計(jì)
        5.2.1 數(shù)據(jù)模塊
        5.2.2 預(yù)處理模塊
        5.2.3 突發(fā)話題檢測(cè)模塊
        5.2.4 突發(fā)話題演化追蹤模塊
    5.3 系統(tǒng)實(shí)現(xiàn)
        5.3.1 開發(fā)平臺(tái)與開發(fā)工具
        5.3.2 基本功能實(shí)現(xiàn)
    5.4 本章小結(jié)
第6章 總結(jié)與展望
    6.1 本文總結(jié)
    6.2 工作展望
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝


【參考文獻(xiàn)】:
期刊論文
[1]微博網(wǎng)絡(luò)地域Top-k突發(fā)事件檢測(cè)[J]. 仲兆滿,管燕,李存華,劉宗田.  計(jì)算機(jī)學(xué)報(bào). 2018(07)
[2]一種融合用戶關(guān)系的自適應(yīng)微博話題跟蹤方法[J]. 柏文言,張闖,徐克付,張志明.  電子學(xué)報(bào). 2017(06)
[3]基于轉(zhuǎn)發(fā)關(guān)系的微博話題演化算法[J]. 徐偉,趙斌,吉根林.  計(jì)算機(jī)科學(xué). 2016(02)
[4]面向動(dòng)態(tài)主題數(shù)的話題演化分析[J]. 方瑩,黃河燕,辛欣,魏驍馳,莊琨.  中文信息學(xué)報(bào). 2014(03)
[5]微博信息傳播網(wǎng)絡(luò)的結(jié)構(gòu)屬性分析[J]. 王曉明,王莉,楊敬宗.  中文信息學(xué)報(bào). 2014(03)
[6]一種基于特征演變的新聞話題演化挖掘方法[J]. 趙旭劍,楊春明,李波,張暉,金培權(quán),岳麗華,戴文鍇.  計(jì)算機(jī)學(xué)報(bào). 2014(04)
[7]基于突發(fā)詞聚類的微博突發(fā)事件檢測(cè)方法[J]. 郭跇秀,呂學(xué)強(qiáng),李卓.  計(jì)算機(jī)應(yīng)用. 2014(02)
[8]在線社會(huì)網(wǎng)絡(luò)中信息擴(kuò)散[J]. 李棟,徐志明,李生,劉挺,王秀文.  計(jì)算機(jī)學(xué)報(bào). 2014(01)
[9]一種面向微博主題挖掘的改進(jìn)LDA模型[J]. 謝昊,江紅.  華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(06)
[10]微博中基于統(tǒng)計(jì)特征與雙向投票的垃圾用戶發(fā)現(xiàn)[J]. 丁兆云,周斌,賈焰,汪祥.  計(jì)算機(jī)研究與發(fā)展. 2013(11)

碩士論文
[1]基于GPU并行聚類的加密分組密碼算法的研究及實(shí)現(xiàn)[D]. 付騰達(dá).南京理工大學(xué) 2013
[2]聚類分析的算法及應(yīng)用[D]. 許麗利.吉林大學(xué) 2010



本文編號(hào):3708486

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3708486.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶294c9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com