天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于SVM的電商評論文本情感傾向性分析

發(fā)布時間:2021-10-08 08:43
  當(dāng)今世界,電子商務(wù)平臺飛速發(fā)展,海量的用戶評論文本也由此產(chǎn)生。這些評論文本中包含了購買者對產(chǎn)品的情感傾向,如:“正向”、“負(fù)向”等。研究這些評論文本的情感傾向性,有助于平臺管理者了解產(chǎn)品的優(yōu)勢和不足之處,便于日后的產(chǎn)品改進(jìn)。同時,在獲取到評論文本中的情感信息后,潛在的用戶更容易做出正確的消費(fèi)決策。而本文的研究方向是對電商平臺的評論文本進(jìn)行情感傾向性分析,在實(shí)驗(yàn)與研究過程中發(fā)現(xiàn)了模型構(gòu)建的向量空間質(zhì)量不夠好,并且在長評論文本與短評論文本數(shù)據(jù)集上,SVM與MNB算法的表現(xiàn)剛好相反,因此由兩個算法單獨(dú)構(gòu)建的模型并不具有一般適用性。為了解決這些問題,本文提出了兩種改進(jìn)方法:首先,將語料庫及情感詞典投入Word2vec模型中,構(gòu)建兩個詞向量空間,并將兩者進(jìn)行特征組合;其次改進(jìn)傳統(tǒng)機(jī)器學(xué)習(xí)算法SVM,將其與MNB算法結(jié)合,構(gòu)建分類器。本文的主要內(nèi)容由以下幾個部分組成:首先,本文介紹了文本情感傾向性分析目前的研究現(xiàn)狀,對目前主流的文本情感傾向性分析方法做了簡要概述,分析了已有的方法的現(xiàn)狀及不足,并介紹了常用的文本向量化和文本情感分類的相關(guān)方法。其次,本文對Word2vec算法進(jìn)行了深入研究,提出了基... 

【文章來源】:燕山大學(xué)河北省

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于SVM的電商評論文本情感傾向性分析


中國網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普及率

實(shí)驗(yàn)樣本,數(shù)據(jù),文本數(shù)據(jù)


第 3 章 基于 Word2vec 的特征優(yōu)化模型這個特征組合,本文提出基于 Word2vec 的特征優(yōu)化ord2vec 的特征優(yōu)化算法及處理方法文本數(shù)據(jù)就是電商平臺上,各類商品匯總得到 2000絡(luò)上 kaggle 數(shù)據(jù)庫中下載的公共數(shù)據(jù)集,里面包含知,想要正確、全面的評價一個商品,好評或差評的地識別好評與差評,對于商品信息的收集,對于商家此作為改進(jìn)產(chǎn)品的品質(zhì)有著至關(guān)重要的作用。在文章,即“好評”、和“差評”。實(shí)驗(yàn)中的文本數(shù)據(jù)都是簽是已經(jīng)標(biāo)注好的類別,則具有一定的公信力,本次“1”代表好評。部分實(shí)驗(yàn)樣本數(shù)據(jù)如圖 3-4 所示。

語料,預(yù)處理,常用語,語料庫


圖 3-5 部分語料預(yù)處理結(jié)果圖過程是特定語料庫的處理過程,對常用語料庫的操作也是如本一樣的,就不在本節(jié)重復(fù)敘述。在得到了文本數(shù)據(jù)預(yù)處理的構(gòu)建就能更好的進(jìn)行下去了,下面就來介紹本次算法的具具體過程簡述計(jì)及算法過程,如圖 3-6 所示。常用語料庫 特定語料庫Word2vec常用特征 特定特征相似性不變/升高開始

【參考文獻(xiàn)】:
期刊論文
[1]中文評論情感分析方法研究[J]. 余培,行鴻彥,劉剛.  電子測量與儀器學(xué)報(bào). 2018(12)
[2]第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》發(fā)布[J].   中國廣播. 2018(03)
[3]基于SVM的高維混合特征短文本情感分類[J]. 王義真,鄭嘯,后盾,胡昊.  計(jì)算機(jī)技術(shù)與發(fā)展. 2018(02)
[4]基于SVM的酒店客戶評論情感分析[J]. 石強(qiáng)強(qiáng),趙應(yīng)丁,楊紅云.  計(jì)算機(jī)與現(xiàn)代化. 2017(03)
[5]情感傾向分析在輿情監(jiān)控方面的研究[J]. 王林,李昀澤.  微型機(jī)與應(yīng)用. 2017(05)
[6]基于信息內(nèi)容的詞林詞語相似度計(jì)算[J]. 彭琦,朱新華,陳意山,孫柳,李飛.  計(jì)算機(jī)應(yīng)用研究. 2018(02)
[7]基于改進(jìn)SVM和HMM的文本信息抽取算法[J]. 孫師堯,妙全興.  計(jì)算機(jī)應(yīng)用與軟件. 2015(11)
[8]中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強(qiáng).  計(jì)算機(jī)應(yīng)用. 2009(10)
[9]情感語料庫的構(gòu)建和分析[J]. 徐琳宏,林鴻飛,趙晶.  中文信息學(xué)報(bào). 2008(01)

博士論文
[1]基于產(chǎn)品評論的情感分析研究[D]. 李方濤.清華大學(xué) 2011



本文編號:3423821

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3423821.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3231c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com