基于情感計算的線上商品銷量預(yù)測方法研究
發(fā)布時間:2021-04-15 20:48
近年來,隨著電子商務(wù)的迅猛發(fā)展,網(wǎng)購評論作為傳統(tǒng)口碑的數(shù)字化版本己經(jīng)成為網(wǎng)絡(luò)消費(fèi)評價的最主要信息來源之一。一方面,大量理論研究及實(shí)踐應(yīng)用表明,消費(fèi)者對線上商品所表達(dá)的情感傾向不僅對其他消費(fèi)者的潛在購買決策有重要指導(dǎo)作用,而且對于生產(chǎn)商和商家改進(jìn)商品品質(zhì)、持續(xù)優(yōu)化經(jīng)營策略具有重要影響;另一方面,由于不同消費(fèi)者和商家對于不同商品特征的關(guān)注度往往不同,因此傳統(tǒng)基于網(wǎng)購評論整體情感傾向性的分析結(jié)果,已經(jīng)無法滿足用戶日益多樣化的現(xiàn)實(shí)需求;谏鲜霰尘,本文在深入學(xué)習(xí)國內(nèi)外情感分析理論及其主要研究成果基礎(chǔ)之上,以某電商平臺關(guān)于手機(jī)的交易數(shù)據(jù)作為研究用實(shí)驗(yàn)數(shù)據(jù),將情感分析作用于商品的不同屬性,開展了基于網(wǎng)購評論信息情感傾向性分析的在線商品銷售量預(yù)測模型研究,主要研究工作如下:(1)提出了一種基于融合詞性的BiLSTM-CRF模型的商品顯式特征提取方法。該方法首先對基于詞語的評論句和基于詞性的評論句進(jìn)行獨(dú)立建模,分別使用BiLSTM網(wǎng)絡(luò)學(xué)習(xí)評論信息的長期依賴關(guān)系,然后將詞語與詞性的特征進(jìn)行融合,并將融合后的語義特征接入全連接網(wǎng)絡(luò),最后將全連接網(wǎng)絡(luò)輸出的結(jié)果作為CRF網(wǎng)絡(luò)的輸入,經(jīng)過CRF層的訓(xùn)練得出帶...
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.?3?LSTM總體框架??Fig.?2.3?LSTM?overall?framework??2.?3情感分類方法??
017年4月28日至2018年6月28日在每月28日收集相關(guān)數(shù)據(jù),共計65536條。采集??的數(shù)據(jù)包括:商品ID、商品名稱、店鋪名稱、價格、月銷量、總評論數(shù)、評論內(nèi)容、??評論時間、商品評分、店鋪服務(wù)評分、店鋪物流評分、店鋪年數(shù)、商品分期免息月數(shù)、??商品被收藏數(shù)、追評數(shù)、評論中圖片數(shù)、該型號手機(jī)上市天數(shù)。月銷量是指當(dāng)前價格下??的月銷量,不包含價格變動帶來的銷量,且月銷量是指當(dāng)前周期(30天)內(nèi)的銷量,不??與其他周期的銷量累加。??將處理后的數(shù)據(jù)放到同一數(shù)據(jù)表中,表中1?10列如圖3.3中(a)所示,11?21??列如圖3.3中(b)所示。本章采用其中的評論內(nèi)容作為實(shí)驗(yàn)數(shù)據(jù)。??id?seller_id?item?shop_name?price?sell_irtotal_c?rateContent?rateDate?auctionSki??65001?2838892713?huawei_n〇'華為官方旗艦2399.00?7773?29503在實(shí)體店看看以后才買的,有活動,便宜一點(diǎn),還有禮品,?2018/5/14?19:26網(wǎng)絡(luò)類型??65002?2838892713?huawei_n〇,華為官方旗艦2399.00?7773?29503?第一次買華為感覺還不錯!?2018/5/3?15:16?網(wǎng)絡(luò)類型:‘??65003?2838892713?hUawei_no,華為官方旗艦2399.00?7773?29503特別好用,男朋友一直推薦的。?2018/5/16?21:06網(wǎng)絡(luò)類型:,??65004?2838892713?huawei_no,華為官方旗艦¥?2399.00?7773?29503用了兩
回率(Recall,/?)和Fi值,計算??公式如下:??P=?tTP?(3.14)??t?TP?+?貧?Fp??其中為識別正確個數(shù),為識別錯誤的個數(shù),精確度衡量了識別出的商品特征及??觀點(diǎn)的正確比例。??R?=?_hp_?(3.15)??tTP?+tFN??其中,為真正的但沒有被系統(tǒng)正確識別出的個數(shù),召回率衡量的是在所有真正特征??及觀點(diǎn)中被正確識別出的比例。??=?2PR_?(3.16)??P?+?R??g為綜合精確度和召回率的調(diào)和平均值。??本文的分詞結(jié)果如圖3.5所示,對手機(jī)商品評論中商品特征及觀點(diǎn)的識別結(jié)果如圖??3.6所示。??r ̄]?Console?1/A?^?戀#??)?A??In?[1]?:?runfile(1?C?;?/Use^s/ynvi/Oesktop/untitledB??py'j?wdir=1?C:?/yii'l/Cesktcp?'??-手機(jī)/n很/cf不錯/a,/wd拍照/vi很/d清晰/a,/wd玩/v游戲/n也/d很/d給力/a,?/wd客??月艮/n態(tài)度/n好/a,?/wd很/d耐心/ad解答/v問題/n。/wj??2手機(jī)/n不錯/a,?/wd指紋/n解鎖/v也/d很/d快/a。/w丨女兒/n挺/d喜歡/vU綱??3機(jī)子/n非常/d好/a,/wd包裝/n特別/d仔細(xì)/a,/wd賣家/n發(fā)貨/vi快/a。收到/v后/f試??/v?了/ule—下/mq,?/wd?比/p?之前/f?手機(jī)/n?質(zhì)感/n?好/a。/wf??圖3.?5評論文本分詞結(jié)果??Fig.?3.5?Comment?text?segmentation?results??-25?-??
【參考文獻(xiàn)】:
期刊論文
[1]融合詞性的雙注意力Bi-LSTM情感分析[J]. 趙富,楊洋,蔣瑞,張利君,任曉雷. 計算機(jī)應(yīng)用. 2018(S2)
[2]基于CNN和BiLSTM網(wǎng)絡(luò)特征融合的文本情感分析[J]. 李洋,董紅斌. 計算機(jī)應(yīng)用. 2018(11)
[3]基于雙向LSTM和GBDT的中醫(yī)文本關(guān)系抽取模型[J]. 羅計根,杜建強(qiáng),聶斌,熊旺平,劉蕾,賀佳. 計算機(jī)應(yīng)用研究. 2019(12)
[4]網(wǎng)絡(luò)評論方面級觀點(diǎn)挖掘方法研究綜述[J]. 韓忠明,李夢琪,劉雯,張夢玫,段大高,于重重. 軟件學(xué)報. 2018(02)
[5]在線用戶評論細(xì)粒度屬性抽取[J]. 周清清,章成志. 情報學(xué)報. 2017(05)
[6]面向汽車評論的細(xì)粒度情感分析方法研究[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,王麗娟,黃浩,蔡曉鳳. 廣東工業(yè)大學(xué)學(xué)報. 2017(03)
[7]細(xì)粒度情感分析的酒店評論研究[J]. 李鳴,吳波,宋陽,朱夢堯,徐志廣,張宏俊. 傳感器與微系統(tǒng). 2016(12)
[8]基于語義約束LDA的商品特征和情感詞提取[J]. 彭云,萬常選,江騰蛟,劉德喜,劉喜平,廖國瓊. 軟件學(xué)報. 2017(03)
[9]基于多特征融合的微博主題情感挖掘[J]. 黃發(fā)良,馮時,王大玲,于戈. 計算機(jī)學(xué)報. 2017(04)
[10]泰安市農(nóng)產(chǎn)品電子商務(wù)發(fā)展的現(xiàn)狀和對策探究[J]. 孫光宇. 中國商論. 2016(26)
博士論文
[1]觀點(diǎn)挖掘中評價對象抽取方法的研究[D]. 劉倩.東南大學(xué) 2016
碩士論文
[1]基于隱式產(chǎn)品特征的網(wǎng)絡(luò)商品評論情感分析研究[D]. 陶婭芝.重慶郵電大學(xué) 2017
[2]網(wǎng)購用戶評論中隱式評價對象的提取方法研究[D]. 馬京苗.北京交通大學(xué) 2017
本文編號:3140060
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.?3?LSTM總體框架??Fig.?2.3?LSTM?overall?framework??2.?3情感分類方法??
017年4月28日至2018年6月28日在每月28日收集相關(guān)數(shù)據(jù),共計65536條。采集??的數(shù)據(jù)包括:商品ID、商品名稱、店鋪名稱、價格、月銷量、總評論數(shù)、評論內(nèi)容、??評論時間、商品評分、店鋪服務(wù)評分、店鋪物流評分、店鋪年數(shù)、商品分期免息月數(shù)、??商品被收藏數(shù)、追評數(shù)、評論中圖片數(shù)、該型號手機(jī)上市天數(shù)。月銷量是指當(dāng)前價格下??的月銷量,不包含價格變動帶來的銷量,且月銷量是指當(dāng)前周期(30天)內(nèi)的銷量,不??與其他周期的銷量累加。??將處理后的數(shù)據(jù)放到同一數(shù)據(jù)表中,表中1?10列如圖3.3中(a)所示,11?21??列如圖3.3中(b)所示。本章采用其中的評論內(nèi)容作為實(shí)驗(yàn)數(shù)據(jù)。??id?seller_id?item?shop_name?price?sell_irtotal_c?rateContent?rateDate?auctionSki??65001?2838892713?huawei_n〇'華為官方旗艦2399.00?7773?29503在實(shí)體店看看以后才買的,有活動,便宜一點(diǎn),還有禮品,?2018/5/14?19:26網(wǎng)絡(luò)類型??65002?2838892713?huawei_n〇,華為官方旗艦2399.00?7773?29503?第一次買華為感覺還不錯!?2018/5/3?15:16?網(wǎng)絡(luò)類型:‘??65003?2838892713?hUawei_no,華為官方旗艦2399.00?7773?29503特別好用,男朋友一直推薦的。?2018/5/16?21:06網(wǎng)絡(luò)類型:,??65004?2838892713?huawei_no,華為官方旗艦¥?2399.00?7773?29503用了兩
回率(Recall,/?)和Fi值,計算??公式如下:??P=?tTP?(3.14)??t?TP?+?貧?Fp??其中為識別正確個數(shù),為識別錯誤的個數(shù),精確度衡量了識別出的商品特征及??觀點(diǎn)的正確比例。??R?=?_hp_?(3.15)??tTP?+tFN??其中,為真正的但沒有被系統(tǒng)正確識別出的個數(shù),召回率衡量的是在所有真正特征??及觀點(diǎn)中被正確識別出的比例。??=?2PR_?(3.16)??P?+?R??g為綜合精確度和召回率的調(diào)和平均值。??本文的分詞結(jié)果如圖3.5所示,對手機(jī)商品評論中商品特征及觀點(diǎn)的識別結(jié)果如圖??3.6所示。??r ̄]?Console?1/A?^?戀#??)?A??In?[1]?:?runfile(1?C?;?/Use^s/ynvi/Oesktop/untitledB??py'j?wdir=1?C:?/yii'l/Cesktcp?'??-手機(jī)/n很/cf不錯/a,/wd拍照/vi很/d清晰/a,/wd玩/v游戲/n也/d很/d給力/a,?/wd客??月艮/n態(tài)度/n好/a,?/wd很/d耐心/ad解答/v問題/n。/wj??2手機(jī)/n不錯/a,?/wd指紋/n解鎖/v也/d很/d快/a。/w丨女兒/n挺/d喜歡/vU綱??3機(jī)子/n非常/d好/a,/wd包裝/n特別/d仔細(xì)/a,/wd賣家/n發(fā)貨/vi快/a。收到/v后/f試??/v?了/ule—下/mq,?/wd?比/p?之前/f?手機(jī)/n?質(zhì)感/n?好/a。/wf??圖3.?5評論文本分詞結(jié)果??Fig.?3.5?Comment?text?segmentation?results??-25?-??
【參考文獻(xiàn)】:
期刊論文
[1]融合詞性的雙注意力Bi-LSTM情感分析[J]. 趙富,楊洋,蔣瑞,張利君,任曉雷. 計算機(jī)應(yīng)用. 2018(S2)
[2]基于CNN和BiLSTM網(wǎng)絡(luò)特征融合的文本情感分析[J]. 李洋,董紅斌. 計算機(jī)應(yīng)用. 2018(11)
[3]基于雙向LSTM和GBDT的中醫(yī)文本關(guān)系抽取模型[J]. 羅計根,杜建強(qiáng),聶斌,熊旺平,劉蕾,賀佳. 計算機(jī)應(yīng)用研究. 2019(12)
[4]網(wǎng)絡(luò)評論方面級觀點(diǎn)挖掘方法研究綜述[J]. 韓忠明,李夢琪,劉雯,張夢玫,段大高,于重重. 軟件學(xué)報. 2018(02)
[5]在線用戶評論細(xì)粒度屬性抽取[J]. 周清清,章成志. 情報學(xué)報. 2017(05)
[6]面向汽車評論的細(xì)粒度情感分析方法研究[J]. 陳炳豐,郝志峰,蔡瑞初,溫雯,王麗娟,黃浩,蔡曉鳳. 廣東工業(yè)大學(xué)學(xué)報. 2017(03)
[7]細(xì)粒度情感分析的酒店評論研究[J]. 李鳴,吳波,宋陽,朱夢堯,徐志廣,張宏俊. 傳感器與微系統(tǒng). 2016(12)
[8]基于語義約束LDA的商品特征和情感詞提取[J]. 彭云,萬常選,江騰蛟,劉德喜,劉喜平,廖國瓊. 軟件學(xué)報. 2017(03)
[9]基于多特征融合的微博主題情感挖掘[J]. 黃發(fā)良,馮時,王大玲,于戈. 計算機(jī)學(xué)報. 2017(04)
[10]泰安市農(nóng)產(chǎn)品電子商務(wù)發(fā)展的現(xiàn)狀和對策探究[J]. 孫光宇. 中國商論. 2016(26)
博士論文
[1]觀點(diǎn)挖掘中評價對象抽取方法的研究[D]. 劉倩.東南大學(xué) 2016
碩士論文
[1]基于隱式產(chǎn)品特征的網(wǎng)絡(luò)商品評論情感分析研究[D]. 陶婭芝.重慶郵電大學(xué) 2017
[2]網(wǎng)購用戶評論中隱式評價對象的提取方法研究[D]. 馬京苗.北京交通大學(xué) 2017
本文編號:3140060
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3140060.html
最近更新
教材專著