基于網(wǎng)絡(luò)評(píng)論的情感分類模型研究
發(fā)布時(shí)間:2021-05-07 08:10
網(wǎng)絡(luò)高度發(fā)達(dá)的今天,越來(lái)越多的社交網(wǎng)絡(luò)和電商平臺(tái)滲透到了生活的方方面面。人們不僅僅是網(wǎng)絡(luò)信息的接受者,也是信息的生產(chǎn)者,眾多用戶發(fā)表的網(wǎng)絡(luò)評(píng)論蘊(yùn)藏著巨大價(jià)值。對(duì)網(wǎng)絡(luò)評(píng)論進(jìn)行情感分析,政府部門(mén)可以及時(shí)獲悉群眾對(duì)某個(gè)重大事件的輿論趨勢(shì),用戶可以了解某產(chǎn)品的特性,商家也可以獲知用戶的需求,了解產(chǎn)品的不足,及時(shí)調(diào)整營(yíng)銷策略,F(xiàn)有情感分類方法主要有情感詞典方法和機(jī)器學(xué)習(xí)方法。情感詞典方法過(guò)于依賴詞典中的情感詞,情感詞典越完備,網(wǎng)絡(luò)評(píng)論情感傾向越顯著,分類效果越好,而對(duì)情感傾向不易區(qū)分的評(píng)論分類效果欠佳。機(jī)器學(xué)習(xí)方法是一種有監(jiān)督的方法,其分類效果依賴于大量事先標(biāo)注過(guò)的語(yǔ)料,目前語(yǔ)料標(biāo)注是通過(guò)人工完成,工作量極大。針對(duì)上述問(wèn)題,綜合情感詞典和機(jī)器學(xué)習(xí)兩種方法的特點(diǎn)構(gòu)建了一個(gè)網(wǎng)絡(luò)評(píng)論情感分類模型,利用相關(guān)領(lǐng)域網(wǎng)絡(luò)評(píng)論對(duì)情感詞典進(jìn)行擴(kuò)充,基于情感詞典方法的分類結(jié)果,通過(guò)自監(jiān)督學(xué)習(xí)訓(xùn)練一個(gè)分類器,進(jìn)而提高情感傾向模糊文本的分類正確率。主要研究?jī)?nèi)容如下:(1)基于情感詞典方法研究。在已有情感詞典的基礎(chǔ)上擴(kuò)充情感詞典,依靠詞典和規(guī)則計(jì)算情感值,根據(jù)情感值進(jìn)行分類。實(shí)驗(yàn)發(fā)現(xiàn),詞典越完備,情感值絕對(duì)值越高,正確率...
【文章來(lái)源】:河南財(cái)經(jīng)政法大學(xué)河南省
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 課題研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 情感詞典分類方法研究現(xiàn)狀
1.2.2 機(jī)器學(xué)習(xí)分類方法研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 論文的創(chuàng)新點(diǎn)
2 文本預(yù)處理和相關(guān)理論介紹
2.1 網(wǎng)絡(luò)評(píng)論獲取及預(yù)處理
2.1.1 網(wǎng)絡(luò)評(píng)論獲取
2.1.2 網(wǎng)絡(luò)評(píng)論預(yù)處理
2.2 情感分類方法
2.2.1 基于情感詞典的分類方法
2.2.2 基于機(jī)器學(xué)習(xí)的分類方法
2.3 點(diǎn)互信息算法介紹
2.4 WORD2VEC模型介紹
2.5 特征提取
2.6 分類算法
2.6.1 邏輯回歸算法
2.6.2 支持向量機(jī)算法
2.6.3 隨機(jī)森林算法
3 情感詞典和機(jī)器學(xué)習(xí)兩種傳統(tǒng)方法問(wèn)題分析
3.1 基于情感詞典的分類方法
3.1.1 情感詞典
3.1.2 基于情感詞典的情感分類流程
3.1.3 SO-PMI算法擴(kuò)充情感詞典
3.2 基于機(jī)器學(xué)習(xí)的分類方法
3.2.1 基于機(jī)器學(xué)習(xí)的情感分類流程
3.2.2 詞向量與特征提取
3.3 情感詞典方法和機(jī)器學(xué)習(xí)方法的問(wèn)題分析
3.3.1 情感詞典方法的問(wèn)題分析
3.3.2 機(jī)器學(xué)習(xí)方法的問(wèn)題分析
4 融合情感詞典和機(jī)器學(xué)習(xí)的分類模型
4.1 融合情感詞典和機(jī)器學(xué)習(xí)的分類模型
4.2 擴(kuò)充情感詞典
4.3 情感值的計(jì)算
4.4 確定集和不確定集的篩選
4.5 修正不確定集的分類結(jié)果
5 實(shí)驗(yàn)結(jié)果與分析
5.1 數(shù)據(jù)集
5.2 情感分類模型評(píng)價(jià)指標(biāo)
5.3 結(jié)果與分析
5.3.1 word2vec與 SO-PMI結(jié)合擴(kuò)充詞典的分類效果
5.3.2 不同機(jī)器學(xué)習(xí)分類算法的分類效果
5.3.3 融合情感詞典和機(jī)器學(xué)習(xí)的分類模型效果
6 總結(jié)與展望
6.1 論文總結(jié)
6.2 進(jìn)一步的工作
參考文獻(xiàn)
攻讀學(xué)位期間科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計(jì)算機(jī)工程與科學(xué). 2019(04)
[2]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷. 東北師大學(xué)報(bào)(自然科學(xué)版). 2019(01)
[3]基于領(lǐng)域詞典的網(wǎng)絡(luò)商品評(píng)論情感分析[J]. 孔偉俊,胡廣朋. 計(jì)算機(jī)與數(shù)字工程. 2018(01)
[4]基于詞向量的電影評(píng)論情感分析方法[J]. 殷復(fù)蓮,潘幸藝,柴劍平. 現(xiàn)代電影技術(shù). 2017(08)
[5]基于詞向量模型的情感分析[J]. 魏廣順,吳開(kāi)超. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(03)
[6]領(lǐng)域知識(shí)學(xué)習(xí)中的馬爾可夫邏輯網(wǎng)應(yīng)用研究[J]. 于鳳,鄭德權(quán),劉祥. 計(jì)算機(jī)工程與應(yīng)用. 2016(22)
[7]基于情感分析的新浪微博爭(zhēng)議度分析[J]. 劉莉平,劉夢(mèng),李紹鵬. 計(jì)算機(jī)工程與科學(xué). 2016(10)
[8]一種多義詞詞向量計(jì)算方法[J]. 曾琦,周剛,蘭明敬,王濛. 小型微型計(jì)算機(jī)系統(tǒng). 2016(07)
[9]基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析研究[J]. 孫建旺,呂學(xué)強(qiáng),張雷瀚. 計(jì)算機(jī)應(yīng)用與軟件. 2014(07)
[10]基于雙語(yǔ)信息和標(biāo)簽傳播算法的中文情感詞典構(gòu)建方法[J]. 李壽山,李逸薇,黃居仁,蘇艷. 中文信息學(xué)報(bào). 2013(06)
碩士論文
[1]基于領(lǐng)域詞典與機(jī)器學(xué)習(xí)的中文評(píng)論情感分析[D]. 楊鵬.南京郵電大學(xué) 2018
[2]電商評(píng)論情感分析關(guān)鍵技術(shù)研究[D]. 熊樂(lè).南昌大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)[D]. 白璐.北京交通大學(xué) 2018
[4]基于網(wǎng)絡(luò)評(píng)論的情感分類技術(shù)的研究及應(yīng)用[D]. 郭捷.電子科技大學(xué) 2018
[5]基于圖像特征分布的高光譜波段選擇研究[D]. 李星華.西安電子科技大學(xué) 2017
[6]基于改進(jìn)RFM模型的網(wǎng)絡(luò)消費(fèi)者價(jià)值識(shí)別研究[D]. 張繼艷.南華大學(xué) 2015
[7]質(zhì)量安全網(wǎng)絡(luò)信息分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 丁勇.華中科技大學(xué) 2014
[8]領(lǐng)域知識(shí)指導(dǎo)的半監(jiān)督學(xué)習(xí)和主動(dòng)學(xué)習(xí)傾向性分類研究[D]. 麥永康.華南理工大學(xué) 2011
本文編號(hào):3173056
【文章來(lái)源】:河南財(cái)經(jīng)政法大學(xué)河南省
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 課題研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 情感詞典分類方法研究現(xiàn)狀
1.2.2 機(jī)器學(xué)習(xí)分類方法研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
1.5 論文的創(chuàng)新點(diǎn)
2 文本預(yù)處理和相關(guān)理論介紹
2.1 網(wǎng)絡(luò)評(píng)論獲取及預(yù)處理
2.1.1 網(wǎng)絡(luò)評(píng)論獲取
2.1.2 網(wǎng)絡(luò)評(píng)論預(yù)處理
2.2 情感分類方法
2.2.1 基于情感詞典的分類方法
2.2.2 基于機(jī)器學(xué)習(xí)的分類方法
2.3 點(diǎn)互信息算法介紹
2.4 WORD2VEC模型介紹
2.5 特征提取
2.6 分類算法
2.6.1 邏輯回歸算法
2.6.2 支持向量機(jī)算法
2.6.3 隨機(jī)森林算法
3 情感詞典和機(jī)器學(xué)習(xí)兩種傳統(tǒng)方法問(wèn)題分析
3.1 基于情感詞典的分類方法
3.1.1 情感詞典
3.1.2 基于情感詞典的情感分類流程
3.1.3 SO-PMI算法擴(kuò)充情感詞典
3.2 基于機(jī)器學(xué)習(xí)的分類方法
3.2.1 基于機(jī)器學(xué)習(xí)的情感分類流程
3.2.2 詞向量與特征提取
3.3 情感詞典方法和機(jī)器學(xué)習(xí)方法的問(wèn)題分析
3.3.1 情感詞典方法的問(wèn)題分析
3.3.2 機(jī)器學(xué)習(xí)方法的問(wèn)題分析
4 融合情感詞典和機(jī)器學(xué)習(xí)的分類模型
4.1 融合情感詞典和機(jī)器學(xué)習(xí)的分類模型
4.2 擴(kuò)充情感詞典
4.3 情感值的計(jì)算
4.4 確定集和不確定集的篩選
4.5 修正不確定集的分類結(jié)果
5 實(shí)驗(yàn)結(jié)果與分析
5.1 數(shù)據(jù)集
5.2 情感分類模型評(píng)價(jià)指標(biāo)
5.3 結(jié)果與分析
5.3.1 word2vec與 SO-PMI結(jié)合擴(kuò)充詞典的分類效果
5.3.2 不同機(jī)器學(xué)習(xí)分類算法的分類效果
5.3.3 融合情感詞典和機(jī)器學(xué)習(xí)的分類模型效果
6 總結(jié)與展望
6.1 論文總結(jié)
6.2 進(jìn)一步的工作
參考文獻(xiàn)
攻讀學(xué)位期間科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計(jì)算機(jī)工程與科學(xué). 2019(04)
[2]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷. 東北師大學(xué)報(bào)(自然科學(xué)版). 2019(01)
[3]基于領(lǐng)域詞典的網(wǎng)絡(luò)商品評(píng)論情感分析[J]. 孔偉俊,胡廣朋. 計(jì)算機(jī)與數(shù)字工程. 2018(01)
[4]基于詞向量的電影評(píng)論情感分析方法[J]. 殷復(fù)蓮,潘幸藝,柴劍平. 現(xiàn)代電影技術(shù). 2017(08)
[5]基于詞向量模型的情感分析[J]. 魏廣順,吳開(kāi)超. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(03)
[6]領(lǐng)域知識(shí)學(xué)習(xí)中的馬爾可夫邏輯網(wǎng)應(yīng)用研究[J]. 于鳳,鄭德權(quán),劉祥. 計(jì)算機(jī)工程與應(yīng)用. 2016(22)
[7]基于情感分析的新浪微博爭(zhēng)議度分析[J]. 劉莉平,劉夢(mèng),李紹鵬. 計(jì)算機(jī)工程與科學(xué). 2016(10)
[8]一種多義詞詞向量計(jì)算方法[J]. 曾琦,周剛,蘭明敬,王濛. 小型微型計(jì)算機(jī)系統(tǒng). 2016(07)
[9]基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析研究[J]. 孫建旺,呂學(xué)強(qiáng),張雷瀚. 計(jì)算機(jī)應(yīng)用與軟件. 2014(07)
[10]基于雙語(yǔ)信息和標(biāo)簽傳播算法的中文情感詞典構(gòu)建方法[J]. 李壽山,李逸薇,黃居仁,蘇艷. 中文信息學(xué)報(bào). 2013(06)
碩士論文
[1]基于領(lǐng)域詞典與機(jī)器學(xué)習(xí)的中文評(píng)論情感分析[D]. 楊鵬.南京郵電大學(xué) 2018
[2]電商評(píng)論情感分析關(guān)鍵技術(shù)研究[D]. 熊樂(lè).南昌大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類器的設(shè)計(jì)與實(shí)現(xiàn)[D]. 白璐.北京交通大學(xué) 2018
[4]基于網(wǎng)絡(luò)評(píng)論的情感分類技術(shù)的研究及應(yīng)用[D]. 郭捷.電子科技大學(xué) 2018
[5]基于圖像特征分布的高光譜波段選擇研究[D]. 李星華.西安電子科技大學(xué) 2017
[6]基于改進(jìn)RFM模型的網(wǎng)絡(luò)消費(fèi)者價(jià)值識(shí)別研究[D]. 張繼艷.南華大學(xué) 2015
[7]質(zhì)量安全網(wǎng)絡(luò)信息分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 丁勇.華中科技大學(xué) 2014
[8]領(lǐng)域知識(shí)指導(dǎo)的半監(jiān)督學(xué)習(xí)和主動(dòng)學(xué)習(xí)傾向性分類研究[D]. 麥永康.華南理工大學(xué) 2011
本文編號(hào):3173056
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3173056.html
最近更新
教材專著