基于網(wǎng)絡(luò)評論的情感分類模型研究
發(fā)布時間:2021-05-07 08:10
網(wǎng)絡(luò)高度發(fā)達(dá)的今天,越來越多的社交網(wǎng)絡(luò)和電商平臺滲透到了生活的方方面面。人們不僅僅是網(wǎng)絡(luò)信息的接受者,也是信息的生產(chǎn)者,眾多用戶發(fā)表的網(wǎng)絡(luò)評論蘊藏著巨大價值。對網(wǎng)絡(luò)評論進(jìn)行情感分析,政府部門可以及時獲悉群眾對某個重大事件的輿論趨勢,用戶可以了解某產(chǎn)品的特性,商家也可以獲知用戶的需求,了解產(chǎn)品的不足,及時調(diào)整營銷策略,F(xiàn)有情感分類方法主要有情感詞典方法和機器學(xué)習(xí)方法。情感詞典方法過于依賴詞典中的情感詞,情感詞典越完備,網(wǎng)絡(luò)評論情感傾向越顯著,分類效果越好,而對情感傾向不易區(qū)分的評論分類效果欠佳。機器學(xué)習(xí)方法是一種有監(jiān)督的方法,其分類效果依賴于大量事先標(biāo)注過的語料,目前語料標(biāo)注是通過人工完成,工作量極大。針對上述問題,綜合情感詞典和機器學(xué)習(xí)兩種方法的特點構(gòu)建了一個網(wǎng)絡(luò)評論情感分類模型,利用相關(guān)領(lǐng)域網(wǎng)絡(luò)評論對情感詞典進(jìn)行擴充,基于情感詞典方法的分類結(jié)果,通過自監(jiān)督學(xué)習(xí)訓(xùn)練一個分類器,進(jìn)而提高情感傾向模糊文本的分類正確率。主要研究內(nèi)容如下:(1)基于情感詞典方法研究。在已有情感詞典的基礎(chǔ)上擴充情感詞典,依靠詞典和規(guī)則計算情感值,根據(jù)情感值進(jìn)行分類。實驗發(fā)現(xiàn),詞典越完備,情感值絕對值越高,正確率...
【文章來源】:河南財經(jīng)政法大學(xué)河南省
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 課題研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 情感詞典分類方法研究現(xiàn)狀
1.2.2 機器學(xué)習(xí)分類方法研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 論文的創(chuàng)新點
2 文本預(yù)處理和相關(guān)理論介紹
2.1 網(wǎng)絡(luò)評論獲取及預(yù)處理
2.1.1 網(wǎng)絡(luò)評論獲取
2.1.2 網(wǎng)絡(luò)評論預(yù)處理
2.2 情感分類方法
2.2.1 基于情感詞典的分類方法
2.2.2 基于機器學(xué)習(xí)的分類方法
2.3 點互信息算法介紹
2.4 WORD2VEC模型介紹
2.5 特征提取
2.6 分類算法
2.6.1 邏輯回歸算法
2.6.2 支持向量機算法
2.6.3 隨機森林算法
3 情感詞典和機器學(xué)習(xí)兩種傳統(tǒng)方法問題分析
3.1 基于情感詞典的分類方法
3.1.1 情感詞典
3.1.2 基于情感詞典的情感分類流程
3.1.3 SO-PMI算法擴充情感詞典
3.2 基于機器學(xué)習(xí)的分類方法
3.2.1 基于機器學(xué)習(xí)的情感分類流程
3.2.2 詞向量與特征提取
3.3 情感詞典方法和機器學(xué)習(xí)方法的問題分析
3.3.1 情感詞典方法的問題分析
3.3.2 機器學(xué)習(xí)方法的問題分析
4 融合情感詞典和機器學(xué)習(xí)的分類模型
4.1 融合情感詞典和機器學(xué)習(xí)的分類模型
4.2 擴充情感詞典
4.3 情感值的計算
4.4 確定集和不確定集的篩選
4.5 修正不確定集的分類結(jié)果
5 實驗結(jié)果與分析
5.1 數(shù)據(jù)集
5.2 情感分類模型評價指標(biāo)
5.3 結(jié)果與分析
5.3.1 word2vec與 SO-PMI結(jié)合擴充詞典的分類效果
5.3.2 不同機器學(xué)習(xí)分類算法的分類效果
5.3.3 融合情感詞典和機器學(xué)習(xí)的分類模型效果
6 總結(jié)與展望
6.1 論文總結(jié)
6.2 進(jìn)一步的工作
參考文獻(xiàn)
攻讀學(xué)位期間科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計算機工程與科學(xué). 2019(04)
[2]結(jié)合word2vec與擴充情感詞典的微博多元情感分類研究[J]. 王名揚,吳歡,賈曉婷. 東北師大學(xué)報(自然科學(xué)版). 2019(01)
[3]基于領(lǐng)域詞典的網(wǎng)絡(luò)商品評論情感分析[J]. 孔偉俊,胡廣朋. 計算機與數(shù)字工程. 2018(01)
[4]基于詞向量的電影評論情感分析方法[J]. 殷復(fù)蓮,潘幸藝,柴劍平. 現(xiàn)代電影技術(shù). 2017(08)
[5]基于詞向量模型的情感分析[J]. 魏廣順,吳開超. 計算機系統(tǒng)應(yīng)用. 2017(03)
[6]領(lǐng)域知識學(xué)習(xí)中的馬爾可夫邏輯網(wǎng)應(yīng)用研究[J]. 于鳳,鄭德權(quán),劉祥. 計算機工程與應(yīng)用. 2016(22)
[7]基于情感分析的新浪微博爭議度分析[J]. 劉莉平,劉夢,李紹鵬. 計算機工程與科學(xué). 2016(10)
[8]一種多義詞詞向量計算方法[J]. 曾琦,周剛,蘭明敬,王濛. 小型微型計算機系統(tǒng). 2016(07)
[9]基于詞典與機器學(xué)習(xí)的中文微博情感分析研究[J]. 孫建旺,呂學(xué)強,張雷瀚. 計算機應(yīng)用與軟件. 2014(07)
[10]基于雙語信息和標(biāo)簽傳播算法的中文情感詞典構(gòu)建方法[J]. 李壽山,李逸薇,黃居仁,蘇艷. 中文信息學(xué)報. 2013(06)
碩士論文
[1]基于領(lǐng)域詞典與機器學(xué)習(xí)的中文評論情感分析[D]. 楊鵬.南京郵電大學(xué) 2018
[2]電商評論情感分析關(guān)鍵技術(shù)研究[D]. 熊樂.南昌大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類器的設(shè)計與實現(xiàn)[D]. 白璐.北京交通大學(xué) 2018
[4]基于網(wǎng)絡(luò)評論的情感分類技術(shù)的研究及應(yīng)用[D]. 郭捷.電子科技大學(xué) 2018
[5]基于圖像特征分布的高光譜波段選擇研究[D]. 李星華.西安電子科技大學(xué) 2017
[6]基于改進(jìn)RFM模型的網(wǎng)絡(luò)消費者價值識別研究[D]. 張繼艷.南華大學(xué) 2015
[7]質(zhì)量安全網(wǎng)絡(luò)信息分類系統(tǒng)的設(shè)計與實現(xiàn)[D]. 丁勇.華中科技大學(xué) 2014
[8]領(lǐng)域知識指導(dǎo)的半監(jiān)督學(xué)習(xí)和主動學(xué)習(xí)傾向性分類研究[D]. 麥永康.華南理工大學(xué) 2011
本文編號:3173056
【文章來源】:河南財經(jīng)政法大學(xué)河南省
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 課題研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 情感詞典分類方法研究現(xiàn)狀
1.2.2 機器學(xué)習(xí)分類方法研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 論文的創(chuàng)新點
2 文本預(yù)處理和相關(guān)理論介紹
2.1 網(wǎng)絡(luò)評論獲取及預(yù)處理
2.1.1 網(wǎng)絡(luò)評論獲取
2.1.2 網(wǎng)絡(luò)評論預(yù)處理
2.2 情感分類方法
2.2.1 基于情感詞典的分類方法
2.2.2 基于機器學(xué)習(xí)的分類方法
2.3 點互信息算法介紹
2.4 WORD2VEC模型介紹
2.5 特征提取
2.6 分類算法
2.6.1 邏輯回歸算法
2.6.2 支持向量機算法
2.6.3 隨機森林算法
3 情感詞典和機器學(xué)習(xí)兩種傳統(tǒng)方法問題分析
3.1 基于情感詞典的分類方法
3.1.1 情感詞典
3.1.2 基于情感詞典的情感分類流程
3.1.3 SO-PMI算法擴充情感詞典
3.2 基于機器學(xué)習(xí)的分類方法
3.2.1 基于機器學(xué)習(xí)的情感分類流程
3.2.2 詞向量與特征提取
3.3 情感詞典方法和機器學(xué)習(xí)方法的問題分析
3.3.1 情感詞典方法的問題分析
3.3.2 機器學(xué)習(xí)方法的問題分析
4 融合情感詞典和機器學(xué)習(xí)的分類模型
4.1 融合情感詞典和機器學(xué)習(xí)的分類模型
4.2 擴充情感詞典
4.3 情感值的計算
4.4 確定集和不確定集的篩選
4.5 修正不確定集的分類結(jié)果
5 實驗結(jié)果與分析
5.1 數(shù)據(jù)集
5.2 情感分類模型評價指標(biāo)
5.3 結(jié)果與分析
5.3.1 word2vec與 SO-PMI結(jié)合擴充詞典的分類效果
5.3.2 不同機器學(xué)習(xí)分類算法的分類效果
5.3.3 融合情感詞典和機器學(xué)習(xí)的分類模型效果
6 總結(jié)與展望
6.1 論文總結(jié)
6.2 進(jìn)一步的工作
參考文獻(xiàn)
攻讀學(xué)位期間科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計算機工程與科學(xué). 2019(04)
[2]結(jié)合word2vec與擴充情感詞典的微博多元情感分類研究[J]. 王名揚,吳歡,賈曉婷. 東北師大學(xué)報(自然科學(xué)版). 2019(01)
[3]基于領(lǐng)域詞典的網(wǎng)絡(luò)商品評論情感分析[J]. 孔偉俊,胡廣朋. 計算機與數(shù)字工程. 2018(01)
[4]基于詞向量的電影評論情感分析方法[J]. 殷復(fù)蓮,潘幸藝,柴劍平. 現(xiàn)代電影技術(shù). 2017(08)
[5]基于詞向量模型的情感分析[J]. 魏廣順,吳開超. 計算機系統(tǒng)應(yīng)用. 2017(03)
[6]領(lǐng)域知識學(xué)習(xí)中的馬爾可夫邏輯網(wǎng)應(yīng)用研究[J]. 于鳳,鄭德權(quán),劉祥. 計算機工程與應(yīng)用. 2016(22)
[7]基于情感分析的新浪微博爭議度分析[J]. 劉莉平,劉夢,李紹鵬. 計算機工程與科學(xué). 2016(10)
[8]一種多義詞詞向量計算方法[J]. 曾琦,周剛,蘭明敬,王濛. 小型微型計算機系統(tǒng). 2016(07)
[9]基于詞典與機器學(xué)習(xí)的中文微博情感分析研究[J]. 孫建旺,呂學(xué)強,張雷瀚. 計算機應(yīng)用與軟件. 2014(07)
[10]基于雙語信息和標(biāo)簽傳播算法的中文情感詞典構(gòu)建方法[J]. 李壽山,李逸薇,黃居仁,蘇艷. 中文信息學(xué)報. 2013(06)
碩士論文
[1]基于領(lǐng)域詞典與機器學(xué)習(xí)的中文評論情感分析[D]. 楊鵬.南京郵電大學(xué) 2018
[2]電商評論情感分析關(guān)鍵技術(shù)研究[D]. 熊樂.南昌大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類器的設(shè)計與實現(xiàn)[D]. 白璐.北京交通大學(xué) 2018
[4]基于網(wǎng)絡(luò)評論的情感分類技術(shù)的研究及應(yīng)用[D]. 郭捷.電子科技大學(xué) 2018
[5]基于圖像特征分布的高光譜波段選擇研究[D]. 李星華.西安電子科技大學(xué) 2017
[6]基于改進(jìn)RFM模型的網(wǎng)絡(luò)消費者價值識別研究[D]. 張繼艷.南華大學(xué) 2015
[7]質(zhì)量安全網(wǎng)絡(luò)信息分類系統(tǒng)的設(shè)計與實現(xiàn)[D]. 丁勇.華中科技大學(xué) 2014
[8]領(lǐng)域知識指導(dǎo)的半監(jiān)督學(xué)習(xí)和主動學(xué)習(xí)傾向性分類研究[D]. 麥永康.華南理工大學(xué) 2011
本文編號:3173056
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3173056.html
最近更新
教材專著