基于SVM的電商評論文本情感傾向性分析
發(fā)布時間:2021-10-08 08:43
當今世界,電子商務平臺飛速發(fā)展,海量的用戶評論文本也由此產生。這些評論文本中包含了購買者對產品的情感傾向,如:“正向”、“負向”等。研究這些評論文本的情感傾向性,有助于平臺管理者了解產品的優(yōu)勢和不足之處,便于日后的產品改進。同時,在獲取到評論文本中的情感信息后,潛在的用戶更容易做出正確的消費決策。而本文的研究方向是對電商平臺的評論文本進行情感傾向性分析,在實驗與研究過程中發(fā)現了模型構建的向量空間質量不夠好,并且在長評論文本與短評論文本數據集上,SVM與MNB算法的表現剛好相反,因此由兩個算法單獨構建的模型并不具有一般適用性。為了解決這些問題,本文提出了兩種改進方法:首先,將語料庫及情感詞典投入Word2vec模型中,構建兩個詞向量空間,并將兩者進行特征組合;其次改進傳統機器學習算法SVM,將其與MNB算法結合,構建分類器。本文的主要內容由以下幾個部分組成:首先,本文介紹了文本情感傾向性分析目前的研究現狀,對目前主流的文本情感傾向性分析方法做了簡要概述,分析了已有的方法的現狀及不足,并介紹了常用的文本向量化和文本情感分類的相關方法。其次,本文對Word2vec算法進行了深入研究,提出了基...
【文章來源】:燕山大學河北省
【文章頁數】:65 頁
【學位級別】:碩士
【部分圖文】:
中國網民規(guī)模和互聯網普及率
第 3 章 基于 Word2vec 的特征優(yōu)化模型這個特征組合,本文提出基于 Word2vec 的特征優(yōu)化ord2vec 的特征優(yōu)化算法及處理方法文本數據就是電商平臺上,各類商品匯總得到 2000絡上 kaggle 數據庫中下載的公共數據集,里面包含知,想要正確、全面的評價一個商品,好評或差評的地識別好評與差評,對于商品信息的收集,對于商家此作為改進產品的品質有著至關重要的作用。在文章,即“好評”、和“差評”。實驗中的文本數據都是簽是已經標注好的類別,則具有一定的公信力,本次“1”代表好評。部分實驗樣本數據如圖 3-4 所示。
圖 3-5 部分語料預處理結果圖過程是特定語料庫的處理過程,對常用語料庫的操作也是如本一樣的,就不在本節(jié)重復敘述。在得到了文本數據預處理的構建就能更好的進行下去了,下面就來介紹本次算法的具具體過程簡述計及算法過程,如圖 3-6 所示。常用語料庫 特定語料庫Word2vec常用特征 特定特征相似性不變/升高開始
【參考文獻】:
期刊論文
[1]中文評論情感分析方法研究[J]. 余培,行鴻彥,劉剛. 電子測量與儀器學報. 2018(12)
[2]第41次《中國互聯網絡發(fā)展狀況統計報告》發(fā)布[J]. 中國廣播. 2018(03)
[3]基于SVM的高維混合特征短文本情感分類[J]. 王義真,鄭嘯,后盾,胡昊. 計算機技術與發(fā)展. 2018(02)
[4]基于SVM的酒店客戶評論情感分析[J]. 石強強,趙應丁,楊紅云. 計算機與現代化. 2017(03)
[5]情感傾向分析在輿情監(jiān)控方面的研究[J]. 王林,李昀澤. 微型機與應用. 2017(05)
[6]基于信息內容的詞林詞語相似度計算[J]. 彭琦,朱新華,陳意山,孫柳,李飛. 計算機應用研究. 2018(02)
[7]基于改進SVM和HMM的文本信息抽取算法[J]. 孫師堯,妙全興. 計算機應用與軟件. 2015(11)
[8]中文基礎情感詞詞典構建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強. 計算機應用. 2009(10)
[9]情感語料庫的構建和分析[J]. 徐琳宏,林鴻飛,趙晶. 中文信息學報. 2008(01)
博士論文
[1]基于產品評論的情感分析研究[D]. 李方濤.清華大學 2011
本文編號:3423821
【文章來源】:燕山大學河北省
【文章頁數】:65 頁
【學位級別】:碩士
【部分圖文】:
中國網民規(guī)模和互聯網普及率
第 3 章 基于 Word2vec 的特征優(yōu)化模型這個特征組合,本文提出基于 Word2vec 的特征優(yōu)化ord2vec 的特征優(yōu)化算法及處理方法文本數據就是電商平臺上,各類商品匯總得到 2000絡上 kaggle 數據庫中下載的公共數據集,里面包含知,想要正確、全面的評價一個商品,好評或差評的地識別好評與差評,對于商品信息的收集,對于商家此作為改進產品的品質有著至關重要的作用。在文章,即“好評”、和“差評”。實驗中的文本數據都是簽是已經標注好的類別,則具有一定的公信力,本次“1”代表好評。部分實驗樣本數據如圖 3-4 所示。
圖 3-5 部分語料預處理結果圖過程是特定語料庫的處理過程,對常用語料庫的操作也是如本一樣的,就不在本節(jié)重復敘述。在得到了文本數據預處理的構建就能更好的進行下去了,下面就來介紹本次算法的具具體過程簡述計及算法過程,如圖 3-6 所示。常用語料庫 特定語料庫Word2vec常用特征 特定特征相似性不變/升高開始
【參考文獻】:
期刊論文
[1]中文評論情感分析方法研究[J]. 余培,行鴻彥,劉剛. 電子測量與儀器學報. 2018(12)
[2]第41次《中國互聯網絡發(fā)展狀況統計報告》發(fā)布[J]. 中國廣播. 2018(03)
[3]基于SVM的高維混合特征短文本情感分類[J]. 王義真,鄭嘯,后盾,胡昊. 計算機技術與發(fā)展. 2018(02)
[4]基于SVM的酒店客戶評論情感分析[J]. 石強強,趙應丁,楊紅云. 計算機與現代化. 2017(03)
[5]情感傾向分析在輿情監(jiān)控方面的研究[J]. 王林,李昀澤. 微型機與應用. 2017(05)
[6]基于信息內容的詞林詞語相似度計算[J]. 彭琦,朱新華,陳意山,孫柳,李飛. 計算機應用研究. 2018(02)
[7]基于改進SVM和HMM的文本信息抽取算法[J]. 孫師堯,妙全興. 計算機應用與軟件. 2015(11)
[8]中文基礎情感詞詞典構建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強. 計算機應用. 2009(10)
[9]情感語料庫的構建和分析[J]. 徐琳宏,林鴻飛,趙晶. 中文信息學報. 2008(01)
博士論文
[1]基于產品評論的情感分析研究[D]. 李方濤.清華大學 2011
本文編號:3423821
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3423821.html