基于微博平臺(tái)的新興熱點(diǎn)話(huà)題檢測(cè)研究
發(fā)布時(shí)間:2023-12-12 20:20
微博,一個(gè)基于用戶(hù)社交關(guān)系為用戶(hù)提供信息獲取、分享以及傳播服務(wù)的新型社交網(wǎng)絡(luò)平臺(tái),是隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,以及用戶(hù)的實(shí)際需求應(yīng)運(yùn)而生的。目前,基于微博平臺(tái)數(shù)據(jù)的信息挖掘,商務(wù)產(chǎn)品的微博營(yíng)銷(xiāo),公眾輿論情感挖掘等研究層出不窮,旨在通過(guò)利用微博平臺(tái)上的海量數(shù)據(jù)挖掘有價(jià)值的信息,實(shí)現(xiàn)政法部門(mén)的社會(huì)監(jiān)管,實(shí)現(xiàn)企業(yè)產(chǎn)品的市場(chǎng)推廣,實(shí)現(xiàn)智慧城市的發(fā)展。本文的主要研究?jī)?nèi)容是基于微博用戶(hù)和文本數(shù)據(jù)挖掘出指定時(shí)間段內(nèi)的新興熱點(diǎn)話(huà)題。主要流程如下:首先,借鑒Page Rank算法基本思想基于用戶(hù)關(guān)注關(guān)系網(wǎng)絡(luò)計(jì)算用戶(hù)權(quán)威值;然后,基于關(guān)鍵詞建立生命周期模型,并通過(guò)用戶(hù)的權(quán)威值和關(guān)鍵詞的權(quán)重計(jì)算關(guān)鍵詞的營(yíng)養(yǎng)值,再引入時(shí)間框架將營(yíng)養(yǎng)值轉(zhuǎn)化為能量值,挖掘出新興熱點(diǎn)關(guān)鍵詞;最后,利用關(guān)鍵詞之間的語(yǔ)義關(guān)系構(gòu)建話(huà)題圖,并以新興熱點(diǎn)關(guān)鍵詞為語(yǔ)義中心利用圖的遍歷算法找出一組與之語(yǔ)義相關(guān)的關(guān)鍵詞作為話(huà)題集,計(jì)算話(huà)題的能量值挖掘出新興熱點(diǎn)話(huà)題。本文的最后一部分使用真實(shí)的微博數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證算法的有效性。本文的主要貢獻(xiàn)有:1.提出了一種基于關(guān)鍵詞的能量值計(jì)算方法和基于PageRank思想的用戶(hù)權(quán)威值計(jì)算方法。本文將話(huà)題細(xì)化為一組...
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 微博關(guān)鍵技術(shù)分析
2.1 話(huà)題與微博平臺(tái)
2.1.1 微博文本特征
2.1.2 用戶(hù)特征
2.1.3 信息傳播特征
2.2 話(huà)題檢測(cè)的相關(guān)技術(shù)
2.2.1 微博數(shù)據(jù)抓取與預(yù)處理
2.2.2 基于TF*PDF的向量模型
2.2.3 文本相似度
2.2.4 PageRank算法
2.2.5 基于老化理論的生命周期模型
2.3 本章小結(jié)
第三章 新興熱點(diǎn)話(huà)題檢測(cè)
3.1 微博文本向量表示
3.2 基于用戶(hù)關(guān)系網(wǎng)絡(luò)的用戶(hù)權(quán)威值計(jì)算
3.3 基于老化理論的關(guān)鍵詞熱量計(jì)算
3.3.1 基于用戶(hù)權(quán)威性的關(guān)鍵詞營(yíng)養(yǎng)值計(jì)算
3.3.2 關(guān)鍵詞能量值計(jì)算與新興熱點(diǎn)詞的選擇
3.4 基于語(yǔ)義關(guān)聯(lián)的新興熱點(diǎn)話(huà)題檢測(cè)
3.4.1 關(guān)鍵詞的相關(guān)向量
3.4.2 基于關(guān)鍵詞的語(yǔ)義關(guān)聯(lián)結(jié)構(gòu)圖與新興熱點(diǎn)話(huà)題檢測(cè)算法 .. 29
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)環(huán)境及平臺(tái)
4.2 實(shí)驗(yàn)數(shù)據(jù)說(shuō)明
4.3 實(shí)驗(yàn)過(guò)程及結(jié)果
4.4 本章小結(jié)
結(jié)論與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號(hào):3873572
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 微博關(guān)鍵技術(shù)分析
2.1 話(huà)題與微博平臺(tái)
2.1.1 微博文本特征
2.1.2 用戶(hù)特征
2.1.3 信息傳播特征
2.2 話(huà)題檢測(cè)的相關(guān)技術(shù)
2.2.1 微博數(shù)據(jù)抓取與預(yù)處理
2.2.2 基于TF*PDF的向量模型
2.2.3 文本相似度
2.2.4 PageRank算法
2.2.5 基于老化理論的生命周期模型
2.3 本章小結(jié)
第三章 新興熱點(diǎn)話(huà)題檢測(cè)
3.1 微博文本向量表示
3.2 基于用戶(hù)關(guān)系網(wǎng)絡(luò)的用戶(hù)權(quán)威值計(jì)算
3.3 基于老化理論的關(guān)鍵詞熱量計(jì)算
3.3.1 基于用戶(hù)權(quán)威性的關(guān)鍵詞營(yíng)養(yǎng)值計(jì)算
3.3.2 關(guān)鍵詞能量值計(jì)算與新興熱點(diǎn)詞的選擇
3.4 基于語(yǔ)義關(guān)聯(lián)的新興熱點(diǎn)話(huà)題檢測(cè)
3.4.1 關(guān)鍵詞的相關(guān)向量
3.4.2 基于關(guān)鍵詞的語(yǔ)義關(guān)聯(lián)結(jié)構(gòu)圖與新興熱點(diǎn)話(huà)題檢測(cè)算法 .. 29
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)環(huán)境及平臺(tái)
4.2 實(shí)驗(yàn)數(shù)據(jù)說(shuō)明
4.3 實(shí)驗(yàn)過(guò)程及結(jié)果
4.4 本章小結(jié)
結(jié)論與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
附件
本文編號(hào):3873572
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3873572.html
最近更新
教材專(zhuān)著