基于在線社會網(wǎng)絡(luò)的用戶情感分析研究與實現(xiàn)
發(fā)布時間:2022-10-30 13:42
隨著計算機技術(shù)的高速發(fā)展以及網(wǎng)絡(luò)的普及,人與人之間的交流不再受到時間和空間的限制。相較于傳統(tǒng)的溝通方式,人們更傾向于使用在線社會網(wǎng)絡(luò)分享自己的生活,表達自己的觀點。由此誕生出大量的社交應(yīng)用,其中新浪微博以信息涵蓋面廣、數(shù)據(jù)傳播速度快及人人均可參與的特點成為最受用戶歡迎的社交媒體。在日常生活中,用戶通過微博分享生活,并就新鮮事物表達自己的觀點,因此微博文本數(shù)據(jù)很大程度上帶有情感色彩。對于此類數(shù)據(jù)的分析可以把握用戶的情緒狀態(tài)及興趣點,在分析輿論導(dǎo)向、政府決策或是商業(yè)領(lǐng)域均有較高的研究價值。本文主要研究為設(shè)計一套完整的微博情感識別方案。該方案主要通過情感詞典匹配的方式實現(xiàn)微博情感分析。本文提出情感識別總體設(shè)計方案分為數(shù)據(jù)采集、文本處理和情感識別等部分。本文首先對目前流行的數(shù)據(jù)采集方法進行介紹,比較其優(yōu)缺點,結(jié)合微博的特點選擇網(wǎng)絡(luò)爬蟲作為數(shù)據(jù)采集方法。接著通過對微博數(shù)據(jù)的分析,設(shè)計文本預(yù)處理和中文分詞方案。隨后本文分析了傳統(tǒng)的情感詞典應(yīng)用于微博文本情感識別的不足之處,提出了通過引入網(wǎng)絡(luò)新詞詞典、微博表情詞典以及微博領(lǐng)域情感詞典,結(jié)合傳統(tǒng)的情感詞典,構(gòu)建出應(yīng)用于微博的綜合情感詞典進行情感識別的方...
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.2.3 現(xiàn)有研究的不足
1.3本文的主要工作及組織結(jié)構(gòu)
第二章 相關(guān)概述與技術(shù)介紹
2.1 微博相關(guān)概述
2.1.1 微博發(fā)展現(xiàn)狀
2.1.2 微博文本數(shù)據(jù)特點
2.2 微博數(shù)據(jù)獲取
2.2.1 微博API接口
2.2.2 網(wǎng)絡(luò)爬蟲
2.3 文本預(yù)處理
2.4 中文分詞
2.4.1 基于詞典匹配的分詞算法
2.4.2 基于統(tǒng)計模型的分詞算法
2.4.3 基于理解的分詞算法
2.4.4 優(yōu)缺點比較
2.5 特征選擇方法
2.5.1 常用的特征選擇算法
2.5.2 各方法的優(yōu)缺點
2.6 本章小結(jié)
第三章 基于情感詞典的情感識別方法
3.1 情感詞典介紹
3.1.1 基礎(chǔ)情感詞典
3.1.2 程度副詞詞典
3.1.3 否定詞典
3.1.4 連詞詞典
3.2 擴充情感詞典
3.3 領(lǐng)域情感詞典的構(gòu)建
3.3.1 SO-PMI算法
3.3.2 基于擴展SO-PMI算法的領(lǐng)域情感詞典構(gòu)建方法
3.3.3 微博領(lǐng)域情感詞典構(gòu)建流程
3.4 實驗結(jié)果與分析
3.5 本章小結(jié)
第四章 用戶微博情感識別系統(tǒng)的設(shè)計與實現(xiàn)
4.1 可行性分析
4.2 需求分析
4.2.1 系統(tǒng)功能性需求
4.2.2 系統(tǒng)非功能性需求
4.3 系統(tǒng)設(shè)計
4.3.1 基礎(chǔ)模塊設(shè)計
4.3.2 爬蟲模塊設(shè)計
4.3.3 文本預(yù)處理模塊設(shè)計
4.3.4 情感分析與展示模塊設(shè)計
4.3.5 數(shù)據(jù)存儲模塊設(shè)計
4.4 系統(tǒng)實現(xiàn)
4.4.1 微博數(shù)據(jù)采集及展示
4.4.2 系統(tǒng)結(jié)果展示
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 展望及后續(xù)工作
參考文獻
附錄1 攻讀碩士學位期間申請的專利
附錄2 攻讀碩士學位期間參加的科研項目
致謝
【參考文獻】:
期刊論文
[1]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計算機應(yīng)用與軟件. 2019(09)
[2]基于領(lǐng)域詞典和機器學習的影評情感分析[J]. 徐善山. 電腦知識與技術(shù). 2019(23)
[3]基于短文本情感分析的微博輿情分析[J]. 張志勛,王娟. 中國新通信. 2019(14)
[4]基于共詞分析的國內(nèi)文本情感分析研究[J]. 陳紅琳,魏瑞斌,張瑋,張宇航. 現(xiàn)代情報. 2019(06)
[5]在線社會網(wǎng)絡(luò)無偏采樣技術(shù)[J]. 王棟,李振宇,謝高崗. 計算機研究與發(fā)展. 2016(05)
[6]基于用戶行為特征的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 劉瑋,賀敏,王麗宏,劉悅,沈華偉,程學旗. 計算機學報. 2016(10)
[7]情感詞權(quán)值研究及在情感極性分析中的應(yīng)用[J]. 陽林. 計算機應(yīng)用. 2015(S2)
[8]基于SVM和CRF多特征組合的微博情感分析[J]. 李婷婷,姬東鴻. 計算機應(yīng)用研究. 2015(04)
[9]基于微博表情符號的情感詞典構(gòu)建研究[J]. 桂斌,楊小平,張中夏,肖文韜. 北京理工大學學報. 2014(05)
[10]基于用戶行為的微博用戶社會影響力分析[J]. 毛佳昕,劉奕群,張敏,馬少平. 計算機學報. 2014(04)
碩士論文
[1]微博文本的細致情感分析研究[D]. 郝苗苗.大連理工大學 2019
[2]基于自定義詞典的網(wǎng)絡(luò)文本情感分析方法[D]. 何博.電子科技大學 2019
[3]基于文本情感的微博輿情分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 楊康.西北大學 2018
[4]基于微博表情符號的中文情感詞典構(gòu)建方法研究[D]. 賈一凡.蘭州理工大學 2018
[5]基于擴展詞典和規(guī)則的中文微博情感分析[D]. 李繼東.北京交通大學 2018
[6]漢語連詞的語義語用分析[D]. 肖涵.武漢大學 2017
本文編號:3698992
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.2.3 現(xiàn)有研究的不足
1.3本文的主要工作及組織結(jié)構(gòu)
第二章 相關(guān)概述與技術(shù)介紹
2.1 微博相關(guān)概述
2.1.1 微博發(fā)展現(xiàn)狀
2.1.2 微博文本數(shù)據(jù)特點
2.2 微博數(shù)據(jù)獲取
2.2.1 微博API接口
2.2.2 網(wǎng)絡(luò)爬蟲
2.3 文本預(yù)處理
2.4 中文分詞
2.4.1 基于詞典匹配的分詞算法
2.4.2 基于統(tǒng)計模型的分詞算法
2.4.3 基于理解的分詞算法
2.4.4 優(yōu)缺點比較
2.5 特征選擇方法
2.5.1 常用的特征選擇算法
2.5.2 各方法的優(yōu)缺點
2.6 本章小結(jié)
第三章 基于情感詞典的情感識別方法
3.1 情感詞典介紹
3.1.1 基礎(chǔ)情感詞典
3.1.2 程度副詞詞典
3.1.3 否定詞典
3.1.4 連詞詞典
3.2 擴充情感詞典
3.3 領(lǐng)域情感詞典的構(gòu)建
3.3.1 SO-PMI算法
3.3.2 基于擴展SO-PMI算法的領(lǐng)域情感詞典構(gòu)建方法
3.3.3 微博領(lǐng)域情感詞典構(gòu)建流程
3.4 實驗結(jié)果與分析
3.5 本章小結(jié)
第四章 用戶微博情感識別系統(tǒng)的設(shè)計與實現(xiàn)
4.1 可行性分析
4.2 需求分析
4.2.1 系統(tǒng)功能性需求
4.2.2 系統(tǒng)非功能性需求
4.3 系統(tǒng)設(shè)計
4.3.1 基礎(chǔ)模塊設(shè)計
4.3.2 爬蟲模塊設(shè)計
4.3.3 文本預(yù)處理模塊設(shè)計
4.3.4 情感分析與展示模塊設(shè)計
4.3.5 數(shù)據(jù)存儲模塊設(shè)計
4.4 系統(tǒng)實現(xiàn)
4.4.1 微博數(shù)據(jù)采集及展示
4.4.2 系統(tǒng)結(jié)果展示
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 展望及后續(xù)工作
參考文獻
附錄1 攻讀碩士學位期間申請的專利
附錄2 攻讀碩士學位期間參加的科研項目
致謝
【參考文獻】:
期刊論文
[1]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計算機應(yīng)用與軟件. 2019(09)
[2]基于領(lǐng)域詞典和機器學習的影評情感分析[J]. 徐善山. 電腦知識與技術(shù). 2019(23)
[3]基于短文本情感分析的微博輿情分析[J]. 張志勛,王娟. 中國新通信. 2019(14)
[4]基于共詞分析的國內(nèi)文本情感分析研究[J]. 陳紅琳,魏瑞斌,張瑋,張宇航. 現(xiàn)代情報. 2019(06)
[5]在線社會網(wǎng)絡(luò)無偏采樣技術(shù)[J]. 王棟,李振宇,謝高崗. 計算機研究與發(fā)展. 2016(05)
[6]基于用戶行為特征的微博轉(zhuǎn)發(fā)預(yù)測研究[J]. 劉瑋,賀敏,王麗宏,劉悅,沈華偉,程學旗. 計算機學報. 2016(10)
[7]情感詞權(quán)值研究及在情感極性分析中的應(yīng)用[J]. 陽林. 計算機應(yīng)用. 2015(S2)
[8]基于SVM和CRF多特征組合的微博情感分析[J]. 李婷婷,姬東鴻. 計算機應(yīng)用研究. 2015(04)
[9]基于微博表情符號的情感詞典構(gòu)建研究[J]. 桂斌,楊小平,張中夏,肖文韜. 北京理工大學學報. 2014(05)
[10]基于用戶行為的微博用戶社會影響力分析[J]. 毛佳昕,劉奕群,張敏,馬少平. 計算機學報. 2014(04)
碩士論文
[1]微博文本的細致情感分析研究[D]. 郝苗苗.大連理工大學 2019
[2]基于自定義詞典的網(wǎng)絡(luò)文本情感分析方法[D]. 何博.電子科技大學 2019
[3]基于文本情感的微博輿情分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 楊康.西北大學 2018
[4]基于微博表情符號的中文情感詞典構(gòu)建方法研究[D]. 賈一凡.蘭州理工大學 2018
[5]基于擴展詞典和規(guī)則的中文微博情感分析[D]. 李繼東.北京交通大學 2018
[6]漢語連詞的語義語用分析[D]. 肖涵.武漢大學 2017
本文編號:3698992
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3698992.html
最近更新
教材專著