天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 品牌論文 >

基于情感分析的商品評價系統(tǒng)設(shè)計與實(shí)現(xiàn)

發(fā)布時間:2021-04-01 08:00
  網(wǎng)絡(luò)購物在方便人們生活的同時,也存在著一些問題,由于網(wǎng)絡(luò)購物不能像線下購物一樣能夠接觸到商品,而且商品的所有信息都是由商家所給出的,這就造成了信息的不對等,容易導(dǎo)致用戶買到了假貨、殘次品、或與自己期望不符的商品,造成一定的損失。雖然用戶可以通過查看商品評論來獲取有價值的信息,但隨著商品評論的不斷的累積,這種信息獲取方式的效率越來越低。針對商品評論累積過多的問題,重點(diǎn)是從海量的商品評論中提取出有價值的信息,本文通過對現(xiàn)有情感分析方法進(jìn)行研究,設(shè)計并實(shí)現(xiàn)了基于情感詞典和基于SVM的商品評價系統(tǒng),利用情感分析方法對商品評論進(jìn)行分析處理,向用戶提供客觀且全面的購物參考信息。本文主要工作體現(xiàn)在以下方面:(1)數(shù)據(jù)的采集。本文通過對電商平臺頁面進(jìn)行分析,設(shè)計了基于Scrapy框架的網(wǎng)絡(luò)爬蟲,該網(wǎng)絡(luò)爬蟲能夠從電商平臺上爬取相應(yīng)商品的各項信息。本文利用該網(wǎng)絡(luò)爬蟲從電商平臺累積收集了數(shù)十萬條數(shù)據(jù)。(2)情感分析方法的研究。為了從商品評論中挖掘出有價值的信息,本文對現(xiàn)有情感分析方法進(jìn)行研究,采用了基于情感詞典和基于SVM這兩種情感分析方法對商品評論進(jìn)行處理。在情感詞典方法的研究中,本文以通用情感詞典為基礎(chǔ)... 

【文章來源】:河北工程大學(xué)河北省

【文章頁數(shù)】:80 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于情感分析的商品評價系統(tǒng)設(shè)計與實(shí)現(xiàn)


京東源碼截圖

源碼,商品,數(shù)據(jù)


第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲商品評論的文件為包含有l(wèi)ist_detail的文件,商品評論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲商品評論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評論的初始URL,并通過更改URL中的商品ID來構(gòu)造出相應(yīng)商品評論的URL。獲取評論的URL后,就可分析電商平臺返回的數(shù)據(jù)來制定相應(yīng)的爬蟲規(guī)則來獲取評論內(nèi)容、評分等信息。本文以京東商城的返回數(shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過查找數(shù)據(jù)中的key來獲取對應(yīng)的數(shù)據(jù),其中存放評論的key是content,存放評論創(chuàng)建時間的是creationTime,存放用戶評分的是score。因此通過遍歷數(shù)據(jù)中的content、createTime、score來獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot

數(shù)據(jù),商品


第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲商品評論的文件為包含有l(wèi)ist_detail的文件,商品評論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲商品評論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評論的初始URL,并通過更改URL中的商品ID來構(gòu)造出相應(yīng)商品評論的URL。獲取評論的URL后,就可分析電商平臺返回的數(shù)據(jù)來制定相應(yīng)的爬蟲規(guī)則來獲取評論內(nèi)容、評分等信息。本文以京東商城的返回數(shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過查找數(shù)據(jù)中的key來獲取對應(yīng)的數(shù)據(jù),其中存放評論的key是content,存放評論創(chuàng)建時間的是creationTime,存放用戶評分的是score。因此通過遍歷數(shù)據(jù)中的content、createTime、score來獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot

【參考文獻(xiàn)】:
期刊論文
[1]商品評論情感傾向性分析[J]. 李明,胡吉霞,侯琳娜,嚴(yán)峻.  計算機(jī)應(yīng)用. 2019(S2)
[2]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平.  網(wǎng)絡(luò)與信息安全學(xué)報. 2019(05)
[3]攝影領(lǐng)域評論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻.  計算機(jī)工程與設(shè)計. 2019(10)
[4]面向突發(fā)事件應(yīng)急管理的情感詞典構(gòu)建——以“暴雨洪澇”災(zāi)害為例[J]. 周莉,楊小儷.  武漢理工大學(xué)學(xué)報(社會科學(xué)版). 2019(04)
[5]基于多部情感詞典與SVM的電影評論情感分析[J]. 吳杰勝,陸奎,王詩兵.  阜陽師范學(xué)院學(xué)報(自然科學(xué)版). 2019(02)
[6]基于改進(jìn)隨機(jī)森林算法的文本分類研究與應(yīng)用[J]. 劉勇,興艷云.  計算機(jī)系統(tǒng)應(yīng)用. 2019(05)
[7]文本情感分析方法研究綜述[J]. 洪巍,李敏.  計算機(jī)工程與科學(xué). 2019(04)
[8]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷.  東北師大學(xué)報(自然科學(xué)版). 2019(01)
[9]基于深度學(xué)習(xí)的女裝圖片分類探索[J]. 葉錦,彭小江,喬宇,邢昊.  集成技術(shù). 2019(02)
[10]基于中文社交媒體文本的領(lǐng)域情感詞典構(gòu)建方法研究[J]. 蔣翠清,郭軼博,劉堯.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(02)

碩士論文
[1]基于機(jī)器學(xué)習(xí)的中文文本分類算法的研究與實(shí)現(xiàn)[D]. 朱夢.北京郵電大學(xué) 2019
[2]產(chǎn)品評論文本的情感分析方法研究[D]. 原多多.蘭州財經(jīng)大學(xué) 2019
[3]商品評論情感分析技術(shù)研究[D]. 張佳悅.北京交通大學(xué) 2018
[4]基于情感分析的汽車推薦系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D]. 王彥婕.山西大學(xué) 2018
[5]基于酒店中文評論情感傾向分析[D]. 李長江.華南理工大學(xué) 2016



本文編號:3112977

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/pinpaiwenhualunwen/3112977.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶99924***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com