中文微博的話題相關(guān)性分析研究
發(fā)布時間:2021-01-24 03:15
隨著Web2.0的發(fā)展,微博等社交媒體逐步成為了人們獲取網(wǎng)絡(luò)信息、了解社會動態(tài)的主要平臺。微博信息主要由個人用戶發(fā)布、信息通過人與人的社會交互共享,這使得微博呈現(xiàn)出數(shù)據(jù)規(guī)模大、信息質(zhì)量參差不齊、話題實時更新等特點。如何在這些龐大冗余的微博信息中篩選出熱門話題、摘取出有價值的信息片段,對于面向互聯(lián)網(wǎng)絡(luò)的信息處理具有重要的意義。本文首先研究了Hashtag話題相關(guān)性分析問題。Hashtag是微博文本中的一種主題標(biāo)簽,發(fā)布者可以利用Hashtag機制標(biāo)注微博涉及的話題。微博平臺基于Hashtag聚合微博,能幫助用戶在海量微博數(shù)據(jù)中發(fā)現(xiàn)熱點話題。但Hashtag由用戶創(chuàng)建的特性使得不同的Hashtag可能代表著同一個話題,挖掘Hashtag之間的話題相關(guān)性將有助于熱點話題發(fā)現(xiàn)。因此在分析了微博內(nèi)容特征及結(jié)構(gòu)特點的基礎(chǔ)上,本文抽取了Hashtag文本特征、微博內(nèi)容、Hashtag出現(xiàn)次數(shù)-時間分布以及Hashtag共現(xiàn)等一系列特征,用于分析Hashtag之間的話題相關(guān)性。在新浪微博數(shù)據(jù)上的實驗結(jié)果顯示,這一系列特征組合能較好地幫助Hashtag話題相關(guān)性分析。為了摘取出有價值的信息片段幫助用戶快...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.1.1 微博的發(fā)展
1.1.2 社交媒體上熱點話題研究的意義
1.1.3 Hashtag的作用以及不足
1.1.4 研究意義
1.2 重要概念介紹
1.2.1 事件
1.2.2 話題
1.2.3 Hashtag
1.2.4 標(biāo)簽云
1.3 研究內(nèi)容
1.3.1 Hashtag話題相關(guān)性分析
1.3.2 微博集合的子話題分析
1.4 論文結(jié)構(gòu)
第二章 國內(nèi)外相關(guān)技術(shù)研究現(xiàn)狀
2.1 引言
2.2 話題發(fā)現(xiàn)與跟蹤技術(shù)研究現(xiàn)狀
2.2.1 話題發(fā)現(xiàn)跟蹤的研究歷史
2.2.2 文本的表示模型
2.2.3 相似度的計算
2.2.4 聚類算法
2.3 微博文本話題分析的相關(guān)研究現(xiàn)狀
2.3.1 微博內(nèi)容簡短
2.3.2 微博噪音數(shù)據(jù)多、用詞不規(guī)范
2.3.3 實時性、時效性強
2.4 關(guān)鍵詞抽取的研究現(xiàn)狀
2.4.1 有監(jiān)督的關(guān)鍵詞抽取算法
2.4.2 無監(jiān)督的關(guān)鍵詞抽取算法
2.4.3 關(guān)鍵詞抽取算法的核心思想
2.5 本章小結(jié)
第三章 Hashtag話題相關(guān)性分析
3.1 引言
3.2 相關(guān)工作
3.3 問題描述
3.4 特征設(shè)計
3.4.1 Hashtag文本特征(Jaccard Of Hashtag)
3.4.2 包含Hashtag的微博內(nèi)容(Weibo Text)
3.4.3 Hashtag的出現(xiàn)次數(shù)-時間分布(Time)
3.4.4 Hashtag的共現(xiàn)(Co-Occurrence)
3.5 Hashtag相關(guān)性分析模型的構(gòu)造
3.6 實驗構(gòu)造與結(jié)果分析
3.6.1 實驗語料
3.6.2 機器學(xué)習(xí)模型的選擇
3.6.3 實驗評價方法
3.6.4 實驗設(shè)置
3.6.5 實驗結(jié)果及分析
3.7 本章小結(jié)
第四章 微博集合的子話題分析
4.1 引言
4.2 微博集合子話題分析系統(tǒng)的構(gòu)造
4.2.1 微博集合子話題分析系統(tǒng)的算法流程
4.2.2 聚類算法流程
4.2.3 關(guān)鍵詞抽取
4.2.4 標(biāo)簽云技術(shù)
4.3 實驗結(jié)果與分析
4.3.1 整體話題信息的展示
4.3.2 子話題信息的展示
4.4 本章小結(jié)
第五章 總結(jié)及展望
5.1 工作總結(jié)
5.2 展望
致謝
參考文獻
作者在學(xué)期間取得的學(xué)術(shù)成果
本文編號:2996456
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.1.1 微博的發(fā)展
1.1.2 社交媒體上熱點話題研究的意義
1.1.3 Hashtag的作用以及不足
1.1.4 研究意義
1.2 重要概念介紹
1.2.1 事件
1.2.2 話題
1.2.3 Hashtag
1.2.4 標(biāo)簽云
1.3 研究內(nèi)容
1.3.1 Hashtag話題相關(guān)性分析
1.3.2 微博集合的子話題分析
1.4 論文結(jié)構(gòu)
第二章 國內(nèi)外相關(guān)技術(shù)研究現(xiàn)狀
2.1 引言
2.2 話題發(fā)現(xiàn)與跟蹤技術(shù)研究現(xiàn)狀
2.2.1 話題發(fā)現(xiàn)跟蹤的研究歷史
2.2.2 文本的表示模型
2.2.3 相似度的計算
2.2.4 聚類算法
2.3 微博文本話題分析的相關(guān)研究現(xiàn)狀
2.3.1 微博內(nèi)容簡短
2.3.2 微博噪音數(shù)據(jù)多、用詞不規(guī)范
2.3.3 實時性、時效性強
2.4 關(guān)鍵詞抽取的研究現(xiàn)狀
2.4.1 有監(jiān)督的關(guān)鍵詞抽取算法
2.4.2 無監(jiān)督的關(guān)鍵詞抽取算法
2.4.3 關(guān)鍵詞抽取算法的核心思想
2.5 本章小結(jié)
第三章 Hashtag話題相關(guān)性分析
3.1 引言
3.2 相關(guān)工作
3.3 問題描述
3.4 特征設(shè)計
3.4.1 Hashtag文本特征(Jaccard Of Hashtag)
3.4.2 包含Hashtag的微博內(nèi)容(Weibo Text)
3.4.3 Hashtag的出現(xiàn)次數(shù)-時間分布(Time)
3.4.4 Hashtag的共現(xiàn)(Co-Occurrence)
3.5 Hashtag相關(guān)性分析模型的構(gòu)造
3.6 實驗構(gòu)造與結(jié)果分析
3.6.1 實驗語料
3.6.2 機器學(xué)習(xí)模型的選擇
3.6.3 實驗評價方法
3.6.4 實驗設(shè)置
3.6.5 實驗結(jié)果及分析
3.7 本章小結(jié)
第四章 微博集合的子話題分析
4.1 引言
4.2 微博集合子話題分析系統(tǒng)的構(gòu)造
4.2.1 微博集合子話題分析系統(tǒng)的算法流程
4.2.2 聚類算法流程
4.2.3 關(guān)鍵詞抽取
4.2.4 標(biāo)簽云技術(shù)
4.3 實驗結(jié)果與分析
4.3.1 整體話題信息的展示
4.3.2 子話題信息的展示
4.4 本章小結(jié)
第五章 總結(jié)及展望
5.1 工作總結(jié)
5.2 展望
致謝
參考文獻
作者在學(xué)期間取得的學(xué)術(shù)成果
本文編號:2996456
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2996456.html
最近更新
教材專著