基于情感識別的案件輿情統(tǒng)計分析
發(fā)布時間:2023-01-08 15:38
突發(fā)和爭議案件容易激發(fā)公眾的好奇心,引起社會公眾的關(guān)注.公眾關(guān)注的同時就會形成諸多的網(wǎng)絡(luò)輿情,公眾的憤慨、焦慮等負(fù)面情緒也容易隨之?dāng)U散、爆發(fā).隨著社交網(wǎng)絡(luò)的成熟,微博成為信息的載體.微博用戶發(fā)表的信息包含不同的情感特征,挖掘這些特征對于輿情預(yù)警、公眾情緒引導(dǎo)、案件網(wǎng)絡(luò)管控等有重要的意義.本文主要以李心草溺亡案件為例,基于微博數(shù)據(jù)進(jìn)行案件的情感分析和輿情分析.在案件的情感分析方面,首先采用爬蟲技術(shù)爬取微博上相關(guān)案件的新聞、用戶評論內(nèi)容及用戶信息等數(shù)據(jù).其次是對爬取的數(shù)據(jù)進(jìn)行預(yù)處理,將與本文研究內(nèi)容無關(guān)的雜亂數(shù)據(jù)刪除.然后使用現(xiàn)有分詞工具進(jìn)行分詞,去停用詞等操作,在此基礎(chǔ)上進(jìn)行案件關(guān)鍵詞的提取,最后建立詞向量模型,采用支持向量機和長短時記憶網(wǎng)絡(luò)(Long Short-Term Memory)算法對公眾的情感傾向進(jìn)行建模訓(xùn)練,通過查準(zhǔn)率、召回率、AUC(Area Under the Curve)等分類評價指標(biāo)進(jìn)行比較發(fā)現(xiàn),LSTM算法較支持向量機算法有較大的提升,能夠達(dá)到預(yù)測公眾情感傾向的目的;在案件的輿情分析方面,主要從輿情傳播途徑走勢、評論用戶信息、評論內(nèi)容等角度對案件進(jìn)行統(tǒng)計分析,總結(jié)...
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景與研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 論文結(jié)構(gòu)及研究方法
1.3.1 研究方法
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 網(wǎng)絡(luò)爬蟲技術(shù)
2.1.1 網(wǎng)絡(luò)爬蟲框架介紹
2.1.2 網(wǎng)絡(luò)爬蟲技術(shù)介紹
2.2 文本特征提取和關(guān)鍵詞提取技術(shù)
2.2.1 Word2Vec詞向量模型的工作原理
2.2.2 基于TF-IDF的關(guān)鍵詞提取技術(shù)
2.3 基于機器學(xué)習(xí)的文本分類模型
2.3.1 支持向量機模型原理
2.3.2 遞歸神經(jīng)網(wǎng)絡(luò)模型原理
2.3.3 長短期記憶網(wǎng)絡(luò)模型原理
2.4 文本處理技術(shù)
2.4.1 分詞處理方法
2.4.2 停用詞處理
2.4.3 數(shù)據(jù)增強技術(shù)
第3章 基于機器學(xué)習(xí)的微博情感分析
3.1 微博情感的特征提取
3.1.1 微博情感文本預(yù)處理
3.1.2 基于Word2vec的微博文本特征提取
3.2 基于微博情感文本的情感分類模型
3.2.1 構(gòu)建基于支持向量機的微博情感分類模型
3.2.2 構(gòu)建基于LSTM的微博情感分類模型
3.3 情感分類模型流程與評價指標(biāo)
第4章 李心草溺亡案件分析
4.1 案件背景及過程介紹
4.2 案件情感分析
4.2.1 數(shù)據(jù)集準(zhǔn)備
4.2.2 數(shù)據(jù)預(yù)處理
4.2.3 關(guān)鍵詞提取結(jié)果
4.2.4 基于模型的案件情感分析
4.3 案件輿情分析
4.3.1 傳播過程分析
4.3.2 微博評論博主信息分析
4.3.3 評論內(nèi)容分析
總結(jié)與展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]中文文獻(xiàn)引文情感語料庫構(gòu)建[J]. 徐琳宏,丁堃,陳娜,李冰. 情報學(xué)報. 2020(01)
[2]CNNIC發(fā)布第44次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》[J]. 于朝暉. 網(wǎng)信軍民融合. 2019(09)
[3]基于文本情感分析的文化綜藝節(jié)目綜合評價——以央視文化類綜藝節(jié)目《國家寶藏》為例[J]. 周娜,何潤奇. 中南民族大學(xué)學(xué)報(人文社會科學(xué)版). 2019(05)
[4]基于微博的細(xì)粒度情感分析[J]. 敦欣卉,張云秋,楊鎧西. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(07)
[5]在線中文用戶評論研究綜述:基于情感計算的視角[J]. 吳應(yīng)良,黃媛,王選飛. 情報科學(xué). 2017(06)
[6]一種基于改進(jìn)的TF-IDF和支持向量機的中文文本分類研究[J]. 郭太勇. 軟件. 2016(12)
[7]Mining microblog user interests based on TextRank with TF-IDF factor[J]. Tu Shouzhong,Huang Minlie. The Journal of China Universities of Posts and Telecommunications. 2016(05)
[8]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計算機科學(xué). 2016(06)
[9]基于字符串匹配的中文分詞算法的研究[J]. 常建秋,沈煒. 工業(yè)控制計算機. 2016(02)
[10]一種基于類別不平衡數(shù)據(jù)的層次分類模型[J]. 施培蓓,劉貴全,汪中,衛(wèi)兵. 中國科學(xué)技術(shù)大學(xué)學(xué)報. 2015(01)
碩士論文
[1]基于深度學(xué)習(xí)的微博短文本情感傾向分析[D]. 李維森.湘潭大學(xué) 2019
[2]危機傳播視角下事故災(zāi)難事件微博輿情引導(dǎo)研究[D]. 喬田.長春工業(yè)大學(xué) 2019
[3]基于分類模型的電商用戶復(fù)購行為預(yù)測研究[D]. 杜世民.杭州師范大學(xué) 2019
[4]基于深度學(xué)習(xí)的用戶評論情感分析[D]. 鄭爽.重慶郵電大學(xué) 2019
[5]政法系統(tǒng)突發(fā)事件網(wǎng)絡(luò)輿情應(yīng)對機制研究[D]. 賈佳轄.中央民族大學(xué) 2019
[6]基于生成對抗網(wǎng)絡(luò)的中文語言模型數(shù)據(jù)增強技術(shù)[D]. 趙鵬飛.哈爾濱工業(yè)大學(xué) 2018
[7]基于Selenium的一種Web自動化測試系統(tǒng)的設(shè)計與實現(xiàn)[D]. 張競帆.北京交通大學(xué) 2017
[8]基于統(tǒng)計方法的中文文本分類[D]. 殷越.華中師范大學(xué) 2017
[9]基于Scrapy的分布式網(wǎng)絡(luò)新聞抓取系統(tǒng)設(shè)計與實現(xiàn)[D]. 馬聯(lián)帥.西安電子科技大學(xué) 2015
[10]基于文本數(shù)據(jù)挖掘的微博情感分析與監(jiān)控系統(tǒng)[D]. 繆茹一.浙江工業(yè)大學(xué) 2015
本文編號:3728731
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景與研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 論文結(jié)構(gòu)及研究方法
1.3.1 研究方法
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 網(wǎng)絡(luò)爬蟲技術(shù)
2.1.1 網(wǎng)絡(luò)爬蟲框架介紹
2.1.2 網(wǎng)絡(luò)爬蟲技術(shù)介紹
2.2 文本特征提取和關(guān)鍵詞提取技術(shù)
2.2.1 Word2Vec詞向量模型的工作原理
2.2.2 基于TF-IDF的關(guān)鍵詞提取技術(shù)
2.3 基于機器學(xué)習(xí)的文本分類模型
2.3.1 支持向量機模型原理
2.3.2 遞歸神經(jīng)網(wǎng)絡(luò)模型原理
2.3.3 長短期記憶網(wǎng)絡(luò)模型原理
2.4 文本處理技術(shù)
2.4.1 分詞處理方法
2.4.2 停用詞處理
2.4.3 數(shù)據(jù)增強技術(shù)
第3章 基于機器學(xué)習(xí)的微博情感分析
3.1 微博情感的特征提取
3.1.1 微博情感文本預(yù)處理
3.1.2 基于Word2vec的微博文本特征提取
3.2 基于微博情感文本的情感分類模型
3.2.1 構(gòu)建基于支持向量機的微博情感分類模型
3.2.2 構(gòu)建基于LSTM的微博情感分類模型
3.3 情感分類模型流程與評價指標(biāo)
第4章 李心草溺亡案件分析
4.1 案件背景及過程介紹
4.2 案件情感分析
4.2.1 數(shù)據(jù)集準(zhǔn)備
4.2.2 數(shù)據(jù)預(yù)處理
4.2.3 關(guān)鍵詞提取結(jié)果
4.2.4 基于模型的案件情感分析
4.3 案件輿情分析
4.3.1 傳播過程分析
4.3.2 微博評論博主信息分析
4.3.3 評論內(nèi)容分析
總結(jié)與展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]中文文獻(xiàn)引文情感語料庫構(gòu)建[J]. 徐琳宏,丁堃,陳娜,李冰. 情報學(xué)報. 2020(01)
[2]CNNIC發(fā)布第44次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》[J]. 于朝暉. 網(wǎng)信軍民融合. 2019(09)
[3]基于文本情感分析的文化綜藝節(jié)目綜合評價——以央視文化類綜藝節(jié)目《國家寶藏》為例[J]. 周娜,何潤奇. 中南民族大學(xué)學(xué)報(人文社會科學(xué)版). 2019(05)
[4]基于微博的細(xì)粒度情感分析[J]. 敦欣卉,張云秋,楊鎧西. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(07)
[5]在線中文用戶評論研究綜述:基于情感計算的視角[J]. 吳應(yīng)良,黃媛,王選飛. 情報科學(xué). 2017(06)
[6]一種基于改進(jìn)的TF-IDF和支持向量機的中文文本分類研究[J]. 郭太勇. 軟件. 2016(12)
[7]Mining microblog user interests based on TextRank with TF-IDF factor[J]. Tu Shouzhong,Huang Minlie. The Journal of China Universities of Posts and Telecommunications. 2016(05)
[8]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計算機科學(xué). 2016(06)
[9]基于字符串匹配的中文分詞算法的研究[J]. 常建秋,沈煒. 工業(yè)控制計算機. 2016(02)
[10]一種基于類別不平衡數(shù)據(jù)的層次分類模型[J]. 施培蓓,劉貴全,汪中,衛(wèi)兵. 中國科學(xué)技術(shù)大學(xué)學(xué)報. 2015(01)
碩士論文
[1]基于深度學(xué)習(xí)的微博短文本情感傾向分析[D]. 李維森.湘潭大學(xué) 2019
[2]危機傳播視角下事故災(zāi)難事件微博輿情引導(dǎo)研究[D]. 喬田.長春工業(yè)大學(xué) 2019
[3]基于分類模型的電商用戶復(fù)購行為預(yù)測研究[D]. 杜世民.杭州師范大學(xué) 2019
[4]基于深度學(xué)習(xí)的用戶評論情感分析[D]. 鄭爽.重慶郵電大學(xué) 2019
[5]政法系統(tǒng)突發(fā)事件網(wǎng)絡(luò)輿情應(yīng)對機制研究[D]. 賈佳轄.中央民族大學(xué) 2019
[6]基于生成對抗網(wǎng)絡(luò)的中文語言模型數(shù)據(jù)增強技術(shù)[D]. 趙鵬飛.哈爾濱工業(yè)大學(xué) 2018
[7]基于Selenium的一種Web自動化測試系統(tǒng)的設(shè)計與實現(xiàn)[D]. 張競帆.北京交通大學(xué) 2017
[8]基于統(tǒng)計方法的中文文本分類[D]. 殷越.華中師范大學(xué) 2017
[9]基于Scrapy的分布式網(wǎng)絡(luò)新聞抓取系統(tǒng)設(shè)計與實現(xiàn)[D]. 馬聯(lián)帥.西安電子科技大學(xué) 2015
[10]基于文本數(shù)據(jù)挖掘的微博情感分析與監(jiān)控系統(tǒng)[D]. 繆茹一.浙江工業(yè)大學(xué) 2015
本文編號:3728731
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3728731.html
最近更新
教材專著