基于機器學(xué)習的網(wǎng)絡(luò)輿情情感傾向分析研究
發(fā)布時間:2021-08-02 08:19
近年來,隨著移動終端技術(shù)的不斷發(fā)展,人們可以愈發(fā)便捷地通過微博、論壇等載體來表達個人的情緒及觀點。用戶通過這些載體發(fā)布的信息中往往包含著一定程度的情感傾向、意見傾向特征,通過情感傾向分析技術(shù)挖掘這些特征對于輿情分析、輿情監(jiān)控等有著十分重要的意義。本文以論壇文本數(shù)據(jù)為研究對象,使用基于機器學(xué)習的情感傾向分析方法進行了相關(guān)研究,具體研究內(nèi)容如下:首先,介紹了針對論壇數(shù)據(jù)進行輿論傾向性研究的背景及意義,闡述了業(yè)內(nèi)使用機器學(xué)習技術(shù)進行情感分析的相關(guān)研究現(xiàn)狀。同時,針對情感傾向分析的流程和相關(guān)技術(shù)進行了介紹,包括文本采集技術(shù)、文本預(yù)處理技術(shù)、文本表示技術(shù)、性能評估指標等。而后,研究使用樸素貝葉斯技術(shù)以及字典法針對論壇文本進行情感傾向性分析,經(jīng)過算法適用性比較,最終選擇了效果更優(yōu)的字典法。通過擴充分詞庫、擴充極性詞庫、構(gòu)建面向突發(fā)事件的情感傾向詞典等方式對算法進行了四次優(yōu)化,最終平均準確率達到了87%,平均召回率達到了81%,能較好地反映文本針對突發(fā)事件的意見傾向數(shù)值。
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:109 頁
【學(xué)位級別】:碩士
【部分圖文】:
中國網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普及率
1.1 研究背景及意義1.1.1 互聯(lián)網(wǎng)現(xiàn)狀隨著社會的進步和信息技術(shù)的發(fā)展,社會信息化、網(wǎng)絡(luò)化程度的急劇增高,互聯(lián)網(wǎng)已滲透到人們生活的點點滴滴,起到無法替代的作用。人們使用的互聯(lián)工具也越來越多,包括 PC、手機、Pad 等。如圖 1.1 所示,根據(jù) CNNIC 的調(diào)查數(shù)據(jù)[1],截至 2018 年 6 月,我國網(wǎng)民規(guī)模已達 8.02 億,互聯(lián)網(wǎng)普及率達到了 57.7%?梢娊窈髷(shù)年,我國網(wǎng)民數(shù)量、網(wǎng)站規(guī)模、數(shù)據(jù)容量都將持續(xù)增長,互聯(lián)網(wǎng)滲透率將不斷提高。隨著 4G 網(wǎng)絡(luò)的廣泛普及、上網(wǎng)資費的不斷降低,目前中國手機用戶的規(guī)模連年呈上升態(tài)勢,截止 2018 年 6 月,已達 7.88 億,且手機網(wǎng)民占整體網(wǎng)民比例高達 98.3%,如圖 1.2所示。通過移動手機終端,人們可以隨時隨地地在論壇、微博、朋友圈等載體上瀏覽信息、抒發(fā)情感、表達對某人某事某物的看法和意見。
圖 4.5 實驗 1 與實驗 2 結(jié)果對比表圖由圖 4.5 可知,加入了程度詞和否定詞之后,正確率和召回率都有所提升。同時,對后的情感值數(shù)值進行觀察發(fā)現(xiàn),情感值提升較為明顯,更新后的算法能更好地反映情感的變化,原先判斷錯誤的語句也得到了有效的糾正,將文本編上序號后使用兩種算法進感值計算,繪制情感值對比圖,如圖 4.6 所示。圖 4.6 實驗 1 與實驗 2 正向情感值對比圖123
【參考文獻】:
期刊論文
[1]基于空間自相關(guān)的網(wǎng)絡(luò)輿情話題演化時空規(guī)律分析[J]. 王璟琦,李銳,吳華意. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(02)
[2]融合主題與情感特征的突發(fā)事件微博輿情演化分析[J]. 安璐,吳林. 圖書情報工作. 2017(15)
[3]基于動態(tài)博弈的媒體參與下網(wǎng)絡(luò)輿情機制分析[J]. 張立凡,程楠,朱恒民. 情報科學(xué). 2017(01)
[4]網(wǎng)絡(luò)輿情的知識網(wǎng)絡(luò)結(jié)構(gòu)、趨勢與演化分析[J]. 李永忠,胡洪宇. 現(xiàn)代情報. 2016(06)
[5]基于知識庫和主題爬蟲的南海輿情實時監(jiān)測研究[J]. 丁晟春,龔思蘭,周文杰,王曰芬. 情報雜志. 2016(05)
[6]基于表情符的社交網(wǎng)絡(luò)情緒詞典構(gòu)造[J]. 馬秉楠,黃永峰,鄧北星. 計算機工程與設(shè)計. 2016(05)
[7]面向網(wǎng)絡(luò)輿情數(shù)據(jù)的異常行為識別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞. 計算機研究與發(fā)展. 2016(03)
[8]群體極化視域下網(wǎng)絡(luò)輿情的演化機制研究——以微博網(wǎng)民討論“浙江溫嶺殺醫(yī)案”為例[J]. 辛文娟,賴涵. 情報雜志. 2015(02)
[9]突發(fā)事件網(wǎng)絡(luò)輿情傳播規(guī)律與預(yù)警階段研究[J]. 蘭月新,曾潤喜. 情報雜志. 2013(05)
[10]中文微博情感分析研究綜述[J]. 周勝臣,瞿文婷,石英子,施詢之,孫韻辰. 計算機應(yīng)用與軟件. 2013(03)
博士論文
[1]基于語義統(tǒng)計分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D]. 萬源.武漢理工大學(xué) 2012
[2]自動文本分類若干基本問題研究[D]. 宋楓溪.南京理工大學(xué) 2004
碩士論文
[1]基于網(wǎng)絡(luò)評論的情感分類技術(shù)的研究及應(yīng)用[D]. 郭捷.電子科技大學(xué) 2018
[2]基于爬蟲與文本挖掘的“985”高校圖書館微信公眾號的調(diào)研[D]. 周海晨.安徽大學(xué) 2017
[3]基于網(wǎng)絡(luò)爬蟲技術(shù)的企業(yè)社交媒體情報獲取分析[D]. 吳虎.黑龍江大學(xué) 2017
[4]基于情感傾向性的網(wǎng)絡(luò)輿情分析及演化預(yù)測研究[D]. 孫培星.吉林大學(xué) 2016
[5]互聯(lián)網(wǎng)評論文本情感分析研究[D]. 崔連超.山東大學(xué) 2015
[6]基于向量空間模型的文本相似度算法研究[D]. 譚靜.西南石油大學(xué) 2015
[7]基于機器學(xué)習的中文文本主題分類及情感分類研究[D]. 樊小超.南京理工大學(xué) 2014
[8]文本情感分析在產(chǎn)品評論中的應(yīng)用研究[D]. 魏慧玲.北京交通大學(xué) 2014
[9]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大學(xué) 2013
[10]基于因子分解機的社交網(wǎng)絡(luò)關(guān)系推薦研究[D]. 余秋宏.北京郵電大學(xué) 2013
本文編號:3317226
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:109 頁
【學(xué)位級別】:碩士
【部分圖文】:
中國網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普及率
1.1 研究背景及意義1.1.1 互聯(lián)網(wǎng)現(xiàn)狀隨著社會的進步和信息技術(shù)的發(fā)展,社會信息化、網(wǎng)絡(luò)化程度的急劇增高,互聯(lián)網(wǎng)已滲透到人們生活的點點滴滴,起到無法替代的作用。人們使用的互聯(lián)工具也越來越多,包括 PC、手機、Pad 等。如圖 1.1 所示,根據(jù) CNNIC 的調(diào)查數(shù)據(jù)[1],截至 2018 年 6 月,我國網(wǎng)民規(guī)模已達 8.02 億,互聯(lián)網(wǎng)普及率達到了 57.7%?梢娊窈髷(shù)年,我國網(wǎng)民數(shù)量、網(wǎng)站規(guī)模、數(shù)據(jù)容量都將持續(xù)增長,互聯(lián)網(wǎng)滲透率將不斷提高。隨著 4G 網(wǎng)絡(luò)的廣泛普及、上網(wǎng)資費的不斷降低,目前中國手機用戶的規(guī)模連年呈上升態(tài)勢,截止 2018 年 6 月,已達 7.88 億,且手機網(wǎng)民占整體網(wǎng)民比例高達 98.3%,如圖 1.2所示。通過移動手機終端,人們可以隨時隨地地在論壇、微博、朋友圈等載體上瀏覽信息、抒發(fā)情感、表達對某人某事某物的看法和意見。
圖 4.5 實驗 1 與實驗 2 結(jié)果對比表圖由圖 4.5 可知,加入了程度詞和否定詞之后,正確率和召回率都有所提升。同時,對后的情感值數(shù)值進行觀察發(fā)現(xiàn),情感值提升較為明顯,更新后的算法能更好地反映情感的變化,原先判斷錯誤的語句也得到了有效的糾正,將文本編上序號后使用兩種算法進感值計算,繪制情感值對比圖,如圖 4.6 所示。圖 4.6 實驗 1 與實驗 2 正向情感值對比圖123
【參考文獻】:
期刊論文
[1]基于空間自相關(guān)的網(wǎng)絡(luò)輿情話題演化時空規(guī)律分析[J]. 王璟琦,李銳,吳華意. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2018(02)
[2]融合主題與情感特征的突發(fā)事件微博輿情演化分析[J]. 安璐,吳林. 圖書情報工作. 2017(15)
[3]基于動態(tài)博弈的媒體參與下網(wǎng)絡(luò)輿情機制分析[J]. 張立凡,程楠,朱恒民. 情報科學(xué). 2017(01)
[4]網(wǎng)絡(luò)輿情的知識網(wǎng)絡(luò)結(jié)構(gòu)、趨勢與演化分析[J]. 李永忠,胡洪宇. 現(xiàn)代情報. 2016(06)
[5]基于知識庫和主題爬蟲的南海輿情實時監(jiān)測研究[J]. 丁晟春,龔思蘭,周文杰,王曰芬. 情報雜志. 2016(05)
[6]基于表情符的社交網(wǎng)絡(luò)情緒詞典構(gòu)造[J]. 馬秉楠,黃永峰,鄧北星. 計算機工程與設(shè)計. 2016(05)
[7]面向網(wǎng)絡(luò)輿情數(shù)據(jù)的異常行為識別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞. 計算機研究與發(fā)展. 2016(03)
[8]群體極化視域下網(wǎng)絡(luò)輿情的演化機制研究——以微博網(wǎng)民討論“浙江溫嶺殺醫(yī)案”為例[J]. 辛文娟,賴涵. 情報雜志. 2015(02)
[9]突發(fā)事件網(wǎng)絡(luò)輿情傳播規(guī)律與預(yù)警階段研究[J]. 蘭月新,曾潤喜. 情報雜志. 2013(05)
[10]中文微博情感分析研究綜述[J]. 周勝臣,瞿文婷,石英子,施詢之,孫韻辰. 計算機應(yīng)用與軟件. 2013(03)
博士論文
[1]基于語義統(tǒng)計分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D]. 萬源.武漢理工大學(xué) 2012
[2]自動文本分類若干基本問題研究[D]. 宋楓溪.南京理工大學(xué) 2004
碩士論文
[1]基于網(wǎng)絡(luò)評論的情感分類技術(shù)的研究及應(yīng)用[D]. 郭捷.電子科技大學(xué) 2018
[2]基于爬蟲與文本挖掘的“985”高校圖書館微信公眾號的調(diào)研[D]. 周海晨.安徽大學(xué) 2017
[3]基于網(wǎng)絡(luò)爬蟲技術(shù)的企業(yè)社交媒體情報獲取分析[D]. 吳虎.黑龍江大學(xué) 2017
[4]基于情感傾向性的網(wǎng)絡(luò)輿情分析及演化預(yù)測研究[D]. 孫培星.吉林大學(xué) 2016
[5]互聯(lián)網(wǎng)評論文本情感分析研究[D]. 崔連超.山東大學(xué) 2015
[6]基于向量空間模型的文本相似度算法研究[D]. 譚靜.西南石油大學(xué) 2015
[7]基于機器學(xué)習的中文文本主題分類及情感分類研究[D]. 樊小超.南京理工大學(xué) 2014
[8]文本情感分析在產(chǎn)品評論中的應(yīng)用研究[D]. 魏慧玲.北京交通大學(xué) 2014
[9]面向微博短文本的情感分析研究[D]. 杜振雷.北京信息科技大學(xué) 2013
[10]基于因子分解機的社交網(wǎng)絡(luò)關(guān)系推薦研究[D]. 余秋宏.北京郵電大學(xué) 2013
本文編號:3317226
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3317226.html
最近更新
教材專著