基于微博的熱點事件挖掘與情感分析
發(fā)布時間:2021-10-10 12:04
隨著計算機技術(shù)的不斷發(fā)展,微博從各個方面滲透并影響著人們的生活,已經(jīng)成為人們分享信息、交流情感的一個重要平臺。每天微博上都有大量有價值的文本產(chǎn)生,這些文本或是對當(dāng)前熱點時事、重要事件的描述,或是這些熱點事件、話題的評論信息。對于一些熱點事件,微博的便捷性、實時性等特點更使得微博可以先一步傳統(tǒng)媒體發(fā)布相關(guān)信息并做出反應(yīng)。及時了解這些事件信息并分析相關(guān)情感信息對于更好的應(yīng)對一些突發(fā)事件、把握輿論導(dǎo)向都具有重要意義。當(dāng)前微博信息挖掘技術(shù)是一個研究熱點,涉及學(xué)科范圍也很廣,本文主要就微博熱點事件抽取和情感分析兩方面做了研究。熱點事件抽取方面主要是首先對微博數(shù)據(jù)進行預(yù)處理,去除數(shù)據(jù)中噪聲信息;然后通過對句子中的命名實體識別、觸發(fā)詞以及時間等信息的識別,得到事件的關(guān)鍵詞信息;根據(jù)事件關(guān)鍵詞信息,計算各個事件之間的相關(guān)度,得到事件相關(guān)微博量占總微博的比例;最后再根據(jù)事件相關(guān)微博的發(fā)布時間分布找出相關(guān)熱點事件。對于情感分析,本文提出了一個對微博中評論信息的主觀情感進行分類的方法,主要是利用微博文本中表情動畫、動詞以及句型等特征信息來構(gòu)造特征集;再根據(jù)這個特征集,生成特征向量;最后通過SVM分類器生成情...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文結(jié)構(gòu)
1.5 小結(jié)
第二章 中文微博信息抽取技術(shù)
2.1 微博文本特征
2.2 信息抽取的基本原理
2.2.1 信息抽取體系結(jié)構(gòu)
2.2.2 信息抽取實現(xiàn)常用方法
2.2.3 信息抽取的評測標(biāo)準(zhǔn)
2.3 信息抽取相關(guān)技術(shù)
2.3.1 命名實體識別技術(shù)
2.3.2 指代消解
2.4 信息抽取與信息檢索的區(qū)別
2.5 本章小結(jié)
第三章 微博熱點事件抽取
3.1 研究意義
3.2 系統(tǒng)框架
3.3 熱點事件抽取關(guān)鍵技術(shù)
3.3.1 中文微博文本預(yù)處理
3.3.2 命名實體識別技術(shù)
3.3.3 觸發(fā)詞抽取規(guī)則
3.3.4 時間抽取規(guī)則
3.3.5 事件相關(guān)度計算
3.4 熱點事件抽取方法
3.4.1 事件抽取及分類
3.4.2 微博熱點事件抽取
3.5 實驗結(jié)果與分析
3.5.1 實驗步驟與結(jié)果
3.5.2 系統(tǒng)性能分析
3.6 本章小結(jié)
第四章 中文微博情感分析
4.1 研究意義
4.2 系統(tǒng)模型體系結(jié)構(gòu)
4.3 具體實現(xiàn)
4.3.1 特征選取
4.3.2 特征向量生成
4.3.3 系統(tǒng)模型實現(xiàn)
4.4 實驗結(jié)果與系統(tǒng)性能分析
4.4.1 特征個數(shù)對實驗結(jié)果的影響
4.4.2 訓(xùn)練集大小對結(jié)果的影響
4.4.3 數(shù)據(jù)來源對結(jié)果的影響
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 工作總結(jié)
5.2 展望
參考文獻
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻】:
期刊論文
[1]EDM:高效的微博事件檢測算法[J]. 童薇,陳威,孟小峰. 計算機科學(xué)與探索. 2012(12)
[2]基于特定領(lǐng)域的中文微博熱點話題挖掘系統(tǒng)BTopicMiner[J]. 李勁,張華,吳浩雄,向軍. 計算機應(yīng)用. 2012(08)
[3]基于情緒知識的中文微博情感分類方法[J]. 龐磊,李壽山,周國棟. 計算機工程. 2012(13)
[4]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項亮,劉明榮,楊青. 模式識別與人工智能. 2012(03)
[5]基于中心化的微博熱點發(fā)現(xiàn)方法[J]. 蔡淑琴,張靜,王旸,馬玉濤,林勇. 管理學(xué)報. 2012(06)
[6]一種中文微博新聞話題檢測的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計算機科學(xué). 2012(01)
[7]基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松. 中文信息學(xué)報. 2012(01)
[8]基于機器學(xué)習(xí)的中文微博情感分類實證研究[J]. 劉志明,劉魯. 計算機工程與應(yīng)用. 2012(01)
本文編號:3428345
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文結(jié)構(gòu)
1.5 小結(jié)
第二章 中文微博信息抽取技術(shù)
2.1 微博文本特征
2.2 信息抽取的基本原理
2.2.1 信息抽取體系結(jié)構(gòu)
2.2.2 信息抽取實現(xiàn)常用方法
2.2.3 信息抽取的評測標(biāo)準(zhǔn)
2.3 信息抽取相關(guān)技術(shù)
2.3.1 命名實體識別技術(shù)
2.3.2 指代消解
2.4 信息抽取與信息檢索的區(qū)別
2.5 本章小結(jié)
第三章 微博熱點事件抽取
3.1 研究意義
3.2 系統(tǒng)框架
3.3 熱點事件抽取關(guān)鍵技術(shù)
3.3.1 中文微博文本預(yù)處理
3.3.2 命名實體識別技術(shù)
3.3.3 觸發(fā)詞抽取規(guī)則
3.3.4 時間抽取規(guī)則
3.3.5 事件相關(guān)度計算
3.4 熱點事件抽取方法
3.4.1 事件抽取及分類
3.4.2 微博熱點事件抽取
3.5 實驗結(jié)果與分析
3.5.1 實驗步驟與結(jié)果
3.5.2 系統(tǒng)性能分析
3.6 本章小結(jié)
第四章 中文微博情感分析
4.1 研究意義
4.2 系統(tǒng)模型體系結(jié)構(gòu)
4.3 具體實現(xiàn)
4.3.1 特征選取
4.3.2 特征向量生成
4.3.3 系統(tǒng)模型實現(xiàn)
4.4 實驗結(jié)果與系統(tǒng)性能分析
4.4.1 特征個數(shù)對實驗結(jié)果的影響
4.4.2 訓(xùn)練集大小對結(jié)果的影響
4.4.3 數(shù)據(jù)來源對結(jié)果的影響
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 工作總結(jié)
5.2 展望
參考文獻
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻】:
期刊論文
[1]EDM:高效的微博事件檢測算法[J]. 童薇,陳威,孟小峰. 計算機科學(xué)與探索. 2012(12)
[2]基于特定領(lǐng)域的中文微博熱點話題挖掘系統(tǒng)BTopicMiner[J]. 李勁,張華,吳浩雄,向軍. 計算機應(yīng)用. 2012(08)
[3]基于情緒知識的中文微博情感分類方法[J]. 龐磊,李壽山,周國棟. 計算機工程. 2012(13)
[4]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項亮,劉明榮,楊青. 模式識別與人工智能. 2012(03)
[5]基于中心化的微博熱點發(fā)現(xiàn)方法[J]. 蔡淑琴,張靜,王旸,馬玉濤,林勇. 管理學(xué)報. 2012(06)
[6]一種中文微博新聞話題檢測的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計算機科學(xué). 2012(01)
[7]基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松. 中文信息學(xué)報. 2012(01)
[8]基于機器學(xué)習(xí)的中文微博情感分類實證研究[J]. 劉志明,劉魯. 計算機工程與應(yīng)用. 2012(01)
本文編號:3428345
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3428345.html
最近更新
教材專著