基于情感分析的商品評價系統(tǒng)設(shè)計與實(shí)現(xiàn)
發(fā)布時間:2021-04-01 08:00
網(wǎng)絡(luò)購物在方便人們生活的同時,也存在著一些問題,由于網(wǎng)絡(luò)購物不能像線下購物一樣能夠接觸到商品,而且商品的所有信息都是由商家所給出的,這就造成了信息的不對等,容易導(dǎo)致用戶買到了假貨、殘次品、或與自己期望不符的商品,造成一定的損失。雖然用戶可以通過查看商品評論來獲取有價值的信息,但隨著商品評論的不斷的累積,這種信息獲取方式的效率越來越低。針對商品評論累積過多的問題,重點(diǎn)是從海量的商品評論中提取出有價值的信息,本文通過對現(xiàn)有情感分析方法進(jìn)行研究,設(shè)計并實(shí)現(xiàn)了基于情感詞典和基于SVM的商品評價系統(tǒng),利用情感分析方法對商品評論進(jìn)行分析處理,向用戶提供客觀且全面的購物參考信息。本文主要工作體現(xiàn)在以下方面:(1)數(shù)據(jù)的采集。本文通過對電商平臺頁面進(jìn)行分析,設(shè)計了基于Scrapy框架的網(wǎng)絡(luò)爬蟲,該網(wǎng)絡(luò)爬蟲能夠從電商平臺上爬取相應(yīng)商品的各項信息。本文利用該網(wǎng)絡(luò)爬蟲從電商平臺累積收集了數(shù)十萬條數(shù)據(jù)。(2)情感分析方法的研究。為了從商品評論中挖掘出有價值的信息,本文對現(xiàn)有情感分析方法進(jìn)行研究,采用了基于情感詞典和基于SVM這兩種情感分析方法對商品評論進(jìn)行處理。在情感詞典方法的研究中,本文以通用情感詞典為基礎(chǔ)...
【文章來源】:河北工程大學(xué)河北省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
京東源碼截圖
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲商品評論的文件為包含有l(wèi)ist_detail的文件,商品評論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲商品評論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評論的初始URL,并通過更改URL中的商品ID來構(gòu)造出相應(yīng)商品評論的URL。獲取評論的URL后,就可分析電商平臺返回的數(shù)據(jù)來制定相應(yīng)的爬蟲規(guī)則來獲取評論內(nèi)容、評分等信息。本文以京東商城的返回數(shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過查找數(shù)據(jù)中的key來獲取對應(yīng)的數(shù)據(jù),其中存放評論的key是content,存放評論創(chuàng)建時間的是creationTime,存放用戶評分的是score。因此通過遍歷數(shù)據(jù)中的content、createTime、score來獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲商品評論的文件為包含有l(wèi)ist_detail的文件,商品評論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲商品評論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評論的初始URL,并通過更改URL中的商品ID來構(gòu)造出相應(yīng)商品評論的URL。獲取評論的URL后,就可分析電商平臺返回的數(shù)據(jù)來制定相應(yīng)的爬蟲規(guī)則來獲取評論內(nèi)容、評分等信息。本文以京東商城的返回數(shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過查找數(shù)據(jù)中的key來獲取對應(yīng)的數(shù)據(jù),其中存放評論的key是content,存放評論創(chuàng)建時間的是creationTime,存放用戶評分的是score。因此通過遍歷數(shù)據(jù)中的content、createTime、score來獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
【參考文獻(xiàn)】:
期刊論文
[1]商品評論情感傾向性分析[J]. 李明,胡吉霞,侯琳娜,嚴(yán)峻. 計算機(jī)應(yīng)用. 2019(S2)
[2]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報. 2019(05)
[3]攝影領(lǐng)域評論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻. 計算機(jī)工程與設(shè)計. 2019(10)
[4]面向突發(fā)事件應(yīng)急管理的情感詞典構(gòu)建——以“暴雨洪澇”災(zāi)害為例[J]. 周莉,楊小儷. 武漢理工大學(xué)學(xué)報(社會科學(xué)版). 2019(04)
[5]基于多部情感詞典與SVM的電影評論情感分析[J]. 吳杰勝,陸奎,王詩兵. 阜陽師范學(xué)院學(xué)報(自然科學(xué)版). 2019(02)
[6]基于改進(jìn)隨機(jī)森林算法的文本分類研究與應(yīng)用[J]. 劉勇,興艷云. 計算機(jī)系統(tǒng)應(yīng)用. 2019(05)
[7]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計算機(jī)工程與科學(xué). 2019(04)
[8]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷. 東北師大學(xué)報(自然科學(xué)版). 2019(01)
[9]基于深度學(xué)習(xí)的女裝圖片分類探索[J]. 葉錦,彭小江,喬宇,邢昊. 集成技術(shù). 2019(02)
[10]基于中文社交媒體文本的領(lǐng)域情感詞典構(gòu)建方法研究[J]. 蔣翠清,郭軼博,劉堯. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(02)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的中文文本分類算法的研究與實(shí)現(xiàn)[D]. 朱夢.北京郵電大學(xué) 2019
[2]產(chǎn)品評論文本的情感分析方法研究[D]. 原多多.蘭州財經(jīng)大學(xué) 2019
[3]商品評論情感分析技術(shù)研究[D]. 張佳悅.北京交通大學(xué) 2018
[4]基于情感分析的汽車推薦系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D]. 王彥婕.山西大學(xué) 2018
[5]基于酒店中文評論情感傾向分析[D]. 李長江.華南理工大學(xué) 2016
本文編號:3112977
【文章來源】:河北工程大學(xué)河北省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
京東源碼截圖
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲商品評論的文件為包含有l(wèi)ist_detail的文件,商品評論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲商品評論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評論的初始URL,并通過更改URL中的商品ID來構(gòu)造出相應(yīng)商品評論的URL。獲取評論的URL后,就可分析電商平臺返回的數(shù)據(jù)來制定相應(yīng)的爬蟲規(guī)則來獲取評論內(nèi)容、評分等信息。本文以京東商城的返回數(shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過查找數(shù)據(jù)中的key來獲取對應(yīng)的數(shù)據(jù),其中存放評論的key是content,存放評論創(chuàng)建時間的是creationTime,存放用戶評分的是score。因此通過遍歷數(shù)據(jù)中的content、createTime、score來獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
第3章基于Scrapy框架的數(shù)據(jù)采集23圖3-7京東源碼截圖Fig.3-7JDsourcecodescreenshot通過同樣的分析方法,可以發(fā)現(xiàn)淘寶用于存儲商品評論的文件為包含有l(wèi)ist_detail的文件,商品評論的URL同樣可以在headers中找到,如圖3-8所示。圖3-8淘寶源碼截圖Fig.3-8screenshotofTaobaosourcecode在對其他筆記本電腦進(jìn)行同樣的分析后,可以發(fā)現(xiàn)這些用于存儲商品評論的URL的區(qū)別僅在于商品的ID不同,所以本文依此構(gòu)造了商品評論的初始URL,并通過更改URL中的商品ID來構(gòu)造出相應(yīng)商品評論的URL。獲取評論的URL后,就可分析電商平臺返回的數(shù)據(jù)來制定相應(yīng)的爬蟲規(guī)則來獲取評論內(nèi)容、評分等信息。本文以京東商城的返回數(shù)據(jù)為例進(jìn)行分析,如圖3-9所示,可以發(fā)現(xiàn)返回的響應(yīng)數(shù)據(jù)是json格式的數(shù)據(jù),所以可以通過查找數(shù)據(jù)中的key來獲取對應(yīng)的數(shù)據(jù),其中存放評論的key是content,存放評論創(chuàng)建時間的是creationTime,存放用戶評分的是score。因此通過遍歷數(shù)據(jù)中的content、createTime、score來獲取到相應(yīng)的數(shù)據(jù)。圖3-9京東響應(yīng)數(shù)據(jù)截圖Fig.3-9JDresponsedatascreenshot
【參考文獻(xiàn)】:
期刊論文
[1]商品評論情感傾向性分析[J]. 李明,胡吉霞,侯琳娜,嚴(yán)峻. 計算機(jī)應(yīng)用. 2019(S2)
[2]中文文本分類方法綜述[J]. 于游,付鈺,吳曉平. 網(wǎng)絡(luò)與信息安全學(xué)報. 2019(05)
[3]攝影領(lǐng)域評論情感詞典構(gòu)建方法[J]. 劉亞橋,陸向艷,鄧凱凱,阮開棟,劉峻. 計算機(jī)工程與設(shè)計. 2019(10)
[4]面向突發(fā)事件應(yīng)急管理的情感詞典構(gòu)建——以“暴雨洪澇”災(zāi)害為例[J]. 周莉,楊小儷. 武漢理工大學(xué)學(xué)報(社會科學(xué)版). 2019(04)
[5]基于多部情感詞典與SVM的電影評論情感分析[J]. 吳杰勝,陸奎,王詩兵. 阜陽師范學(xué)院學(xué)報(自然科學(xué)版). 2019(02)
[6]基于改進(jìn)隨機(jī)森林算法的文本分類研究與應(yīng)用[J]. 劉勇,興艷云. 計算機(jī)系統(tǒng)應(yīng)用. 2019(05)
[7]文本情感分析方法研究綜述[J]. 洪巍,李敏. 計算機(jī)工程與科學(xué). 2019(04)
[8]結(jié)合word2vec與擴(kuò)充情感詞典的微博多元情感分類研究[J]. 王名揚(yáng),吳歡,賈曉婷. 東北師大學(xué)報(自然科學(xué)版). 2019(01)
[9]基于深度學(xué)習(xí)的女裝圖片分類探索[J]. 葉錦,彭小江,喬宇,邢昊. 集成技術(shù). 2019(02)
[10]基于中文社交媒體文本的領(lǐng)域情感詞典構(gòu)建方法研究[J]. 蔣翠清,郭軼博,劉堯. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(02)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的中文文本分類算法的研究與實(shí)現(xiàn)[D]. 朱夢.北京郵電大學(xué) 2019
[2]產(chǎn)品評論文本的情感分析方法研究[D]. 原多多.蘭州財經(jīng)大學(xué) 2019
[3]商品評論情感分析技術(shù)研究[D]. 張佳悅.北京交通大學(xué) 2018
[4]基于情感分析的汽車推薦系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D]. 王彥婕.山西大學(xué) 2018
[5]基于酒店中文評論情感傾向分析[D]. 李長江.華南理工大學(xué) 2016
本文編號:3112977
本文鏈接:http://sikaile.net/guanlilunwen/pinpaiwenhualunwen/3112977.html
最近更新
教材專著