基于微博的熱點(diǎn)事件挖掘與情感分析
發(fā)布時(shí)間:2021-10-10 12:04
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,微博從各個(gè)方面滲透并影響著人們的生活,已經(jīng)成為人們分享信息、交流情感的一個(gè)重要平臺(tái)。每天微博上都有大量有價(jià)值的文本產(chǎn)生,這些文本或是對(duì)當(dāng)前熱點(diǎn)時(shí)事、重要事件的描述,或是這些熱點(diǎn)事件、話題的評(píng)論信息。對(duì)于一些熱點(diǎn)事件,微博的便捷性、實(shí)時(shí)性等特點(diǎn)更使得微博可以先一步傳統(tǒng)媒體發(fā)布相關(guān)信息并做出反應(yīng)。及時(shí)了解這些事件信息并分析相關(guān)情感信息對(duì)于更好的應(yīng)對(duì)一些突發(fā)事件、把握輿論導(dǎo)向都具有重要意義。當(dāng)前微博信息挖掘技術(shù)是一個(gè)研究熱點(diǎn),涉及學(xué)科范圍也很廣,本文主要就微博熱點(diǎn)事件抽取和情感分析兩方面做了研究。熱點(diǎn)事件抽取方面主要是首先對(duì)微博數(shù)據(jù)進(jìn)行預(yù)處理,去除數(shù)據(jù)中噪聲信息;然后通過對(duì)句子中的命名實(shí)體識(shí)別、觸發(fā)詞以及時(shí)間等信息的識(shí)別,得到事件的關(guān)鍵詞信息;根據(jù)事件關(guān)鍵詞信息,計(jì)算各個(gè)事件之間的相關(guān)度,得到事件相關(guān)微博量占總微博的比例;最后再根據(jù)事件相關(guān)微博的發(fā)布時(shí)間分布找出相關(guān)熱點(diǎn)事件。對(duì)于情感分析,本文提出了一個(gè)對(duì)微博中評(píng)論信息的主觀情感進(jìn)行分類的方法,主要是利用微博文本中表情動(dòng)畫、動(dòng)詞以及句型等特征信息來構(gòu)造特征集;再根據(jù)這個(gè)特征集,生成特征向量;最后通過SVM分類器生成情...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)
1.5 小結(jié)
第二章 中文微博信息抽取技術(shù)
2.1 微博文本特征
2.2 信息抽取的基本原理
2.2.1 信息抽取體系結(jié)構(gòu)
2.2.2 信息抽取實(shí)現(xiàn)常用方法
2.2.3 信息抽取的評(píng)測(cè)標(biāo)準(zhǔn)
2.3 信息抽取相關(guān)技術(shù)
2.3.1 命名實(shí)體識(shí)別技術(shù)
2.3.2 指代消解
2.4 信息抽取與信息檢索的區(qū)別
2.5 本章小結(jié)
第三章 微博熱點(diǎn)事件抽取
3.1 研究意義
3.2 系統(tǒng)框架
3.3 熱點(diǎn)事件抽取關(guān)鍵技術(shù)
3.3.1 中文微博文本預(yù)處理
3.3.2 命名實(shí)體識(shí)別技術(shù)
3.3.3 觸發(fā)詞抽取規(guī)則
3.3.4 時(shí)間抽取規(guī)則
3.3.5 事件相關(guān)度計(jì)算
3.4 熱點(diǎn)事件抽取方法
3.4.1 事件抽取及分類
3.4.2 微博熱點(diǎn)事件抽取
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 實(shí)驗(yàn)步驟與結(jié)果
3.5.2 系統(tǒng)性能分析
3.6 本章小結(jié)
第四章 中文微博情感分析
4.1 研究意義
4.2 系統(tǒng)模型體系結(jié)構(gòu)
4.3 具體實(shí)現(xiàn)
4.3.1 特征選取
4.3.2 特征向量生成
4.3.3 系統(tǒng)模型實(shí)現(xiàn)
4.4 實(shí)驗(yàn)結(jié)果與系統(tǒng)性能分析
4.4.1 特征個(gè)數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響
4.4.2 訓(xùn)練集大小對(duì)結(jié)果的影響
4.4.3 數(shù)據(jù)來源對(duì)結(jié)果的影響
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 工作總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
期刊論文
[1]EDM:高效的微博事件檢測(cè)算法[J]. 童薇,陳威,孟小峰. 計(jì)算機(jī)科學(xué)與探索. 2012(12)
[2]基于特定領(lǐng)域的中文微博熱點(diǎn)話題挖掘系統(tǒng)BTopicMiner[J]. 李勁,張華,吳浩雄,向軍. 計(jì)算機(jī)應(yīng)用. 2012(08)
[3]基于情緒知識(shí)的中文微博情感分類方法[J]. 龐磊,李壽山,周國(guó)棟. 計(jì)算機(jī)工程. 2012(13)
[4]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項(xiàng)亮,劉明榮,楊青. 模式識(shí)別與人工智能. 2012(03)
[5]基于中心化的微博熱點(diǎn)發(fā)現(xiàn)方法[J]. 蔡淑琴,張靜,王旸,馬玉濤,林勇. 管理學(xué)報(bào). 2012(06)
[6]一種中文微博新聞話題檢測(cè)的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計(jì)算機(jī)科學(xué). 2012(01)
[7]基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松. 中文信息學(xué)報(bào). 2012(01)
[8]基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J]. 劉志明,劉魯. 計(jì)算機(jī)工程與應(yīng)用. 2012(01)
本文編號(hào):3428345
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 論文結(jié)構(gòu)
1.5 小結(jié)
第二章 中文微博信息抽取技術(shù)
2.1 微博文本特征
2.2 信息抽取的基本原理
2.2.1 信息抽取體系結(jié)構(gòu)
2.2.2 信息抽取實(shí)現(xiàn)常用方法
2.2.3 信息抽取的評(píng)測(cè)標(biāo)準(zhǔn)
2.3 信息抽取相關(guān)技術(shù)
2.3.1 命名實(shí)體識(shí)別技術(shù)
2.3.2 指代消解
2.4 信息抽取與信息檢索的區(qū)別
2.5 本章小結(jié)
第三章 微博熱點(diǎn)事件抽取
3.1 研究意義
3.2 系統(tǒng)框架
3.3 熱點(diǎn)事件抽取關(guān)鍵技術(shù)
3.3.1 中文微博文本預(yù)處理
3.3.2 命名實(shí)體識(shí)別技術(shù)
3.3.3 觸發(fā)詞抽取規(guī)則
3.3.4 時(shí)間抽取規(guī)則
3.3.5 事件相關(guān)度計(jì)算
3.4 熱點(diǎn)事件抽取方法
3.4.1 事件抽取及分類
3.4.2 微博熱點(diǎn)事件抽取
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 實(shí)驗(yàn)步驟與結(jié)果
3.5.2 系統(tǒng)性能分析
3.6 本章小結(jié)
第四章 中文微博情感分析
4.1 研究意義
4.2 系統(tǒng)模型體系結(jié)構(gòu)
4.3 具體實(shí)現(xiàn)
4.3.1 特征選取
4.3.2 特征向量生成
4.3.3 系統(tǒng)模型實(shí)現(xiàn)
4.4 實(shí)驗(yàn)結(jié)果與系統(tǒng)性能分析
4.4.1 特征個(gè)數(shù)對(duì)實(shí)驗(yàn)結(jié)果的影響
4.4.2 訓(xùn)練集大小對(duì)結(jié)果的影響
4.4.3 數(shù)據(jù)來源對(duì)結(jié)果的影響
4.5 本章小結(jié)
第五章 結(jié)論與展望
5.1 工作總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
期刊論文
[1]EDM:高效的微博事件檢測(cè)算法[J]. 童薇,陳威,孟小峰. 計(jì)算機(jī)科學(xué)與探索. 2012(12)
[2]基于特定領(lǐng)域的中文微博熱點(diǎn)話題挖掘系統(tǒng)BTopicMiner[J]. 李勁,張華,吳浩雄,向軍. 計(jì)算機(jī)應(yīng)用. 2012(08)
[3]基于情緒知識(shí)的中文微博情感分類方法[J]. 龐磊,李壽山,周國(guó)棟. 計(jì)算機(jī)工程. 2012(13)
[4]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項(xiàng)亮,劉明榮,楊青. 模式識(shí)別與人工智能. 2012(03)
[5]基于中心化的微博熱點(diǎn)發(fā)現(xiàn)方法[J]. 蔡淑琴,張靜,王旸,馬玉濤,林勇. 管理學(xué)報(bào). 2012(06)
[6]一種中文微博新聞話題檢測(cè)的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦. 計(jì)算機(jī)科學(xué). 2012(01)
[7]基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松. 中文信息學(xué)報(bào). 2012(01)
[8]基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J]. 劉志明,劉魯. 計(jì)算機(jī)工程與應(yīng)用. 2012(01)
本文編號(hào):3428345
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3428345.html
最近更新
教材專著