基于屬性聚類的手機評價模型研究與應(yīng)用
發(fā)布時間:2021-03-14 15:24
隨著電商行業(yè)的快速發(fā)展,網(wǎng)絡(luò)購物越來越受消費者的青睞。在購買手機時,消費者可以根據(jù)電商平臺上的評論信息,分析手機在“外觀”、“價格”、“功能”等方面的表現(xiàn)并做出判斷。另外,手機生產(chǎn)商也可以通過分析評論來了解消費者的關(guān)注傾向,進而為新款手機的制造提供策略性幫助。本文提出的手機評價模型是以評論語料為依據(jù),通過分析語料來反映消費者對手機某一特征的傾向程度,并為消費者或生產(chǎn)商提供參考。本文從手機的評價信息出發(fā),研究現(xiàn)有評價模型、屬性評價結(jié)構(gòu)和屬性聚類的相關(guān)理論,對相關(guān)技術(shù)方案深入思考。首先,設(shè)計爬蟲規(guī)則并利用八爪魚爬蟲工具在京東商城上獲取5種品牌的手機評論作為參考語料,把其中榮耀手機的評論用于檢測模型的評估語料,即單款手機的評論語料;其次,根據(jù)現(xiàn)有的中文自然語言處理技術(shù),對參考語料和單款手機的評論語料進行分詞和去停用詞處理;再次,用預(yù)處理過的參考語料訓(xùn)練CBOW(Continuous Bag-of-Words)模型得出參考語料模型,并由此模型得出與手機特征詞相關(guān)的屬性詞及其詞向量,進而通過Kmeans、譜聚類和SOM(Self-organizing Maps)對屬性詞的詞向量進行聚類,并選取最...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同特征詞的參數(shù)測試結(jié)果
不同聚類算法的平均對比情況
不同閾值條件下的特征傾向度實驗結(jié)果表明:不同閾值條件下,買家對手機某一特征的傾向程度不同,反
【參考文獻】:
期刊論文
[1]融合語義信息的矩陣分解詞向量學(xué)習(xí)模型[J]. 陳培,景麗萍. 智能系統(tǒng)學(xué)報. 2017(05)
[2]基于詞向量和EMD距離的短文本聚類[J]. 黃棟,徐博,許侃,林鴻飛,楊志豪. 山東大學(xué)學(xué)報(理學(xué)版). 2017(07)
[3]基于CBC-LIKE算法的產(chǎn)品特征詞聚類的研究[J]. 江偉,路松峰,楊莉萍. 現(xiàn)代電子技術(shù). 2017(14)
[4]大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)[J]. 謝克武. 電子制作. 2017(09)
[5]中文自然語言處理與計算機的結(jié)合問題研究[J]. 鐘磊. 數(shù)字技術(shù)與應(yīng)用. 2017(02)
[6]基于在線評論的產(chǎn)品選擇方法[J]. 梁霞,姜艷萍,高夢. 東北大學(xué)學(xué)報(自然科學(xué)版). 2017(01)
[7]一種基于信息熵的混合數(shù)據(jù)屬性加權(quán)聚類算法[J]. 趙興旺,梁吉業(yè). 計算機研究與發(fā)展. 2016(05)
[8]結(jié)合全局特征的命名實體屬性值抽取[J]. 劉倩,伍大勇,劉悅,程學(xué)旗,龐琳. 計算機研究與發(fā)展. 2016(04)
[9]一種基于加權(quán)LDA模型的文本聚類方法[J]. 李國,張春杰,張志遠. 中國民航大學(xué)學(xué)報. 2016(02)
[10]基于詞項共現(xiàn)關(guān)系圖模型的中文觀點句識別研究[J]. 王明文,付翠琴,徐凡,洪歡. 中文信息學(xué)報. 2015(06)
碩士論文
[1]商品評論中的屬性詞聚類和擴展研究[D]. 楊靜.北京郵電大學(xué) 2015
[2]電商和微博評論中商品屬性與傾向性識別技術(shù)的研究與實現(xiàn)[D]. 褚劍峰.東華大學(xué) 2014
[3]實體—屬性—框架語義知識庫構(gòu)建研究[D]. 饒思維.東北大學(xué) 2012
本文編號:3082442
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同特征詞的參數(shù)測試結(jié)果
不同聚類算法的平均對比情況
不同閾值條件下的特征傾向度實驗結(jié)果表明:不同閾值條件下,買家對手機某一特征的傾向程度不同,反
【參考文獻】:
期刊論文
[1]融合語義信息的矩陣分解詞向量學(xué)習(xí)模型[J]. 陳培,景麗萍. 智能系統(tǒng)學(xué)報. 2017(05)
[2]基于詞向量和EMD距離的短文本聚類[J]. 黃棟,徐博,許侃,林鴻飛,楊志豪. 山東大學(xué)學(xué)報(理學(xué)版). 2017(07)
[3]基于CBC-LIKE算法的產(chǎn)品特征詞聚類的研究[J]. 江偉,路松峰,楊莉萍. 現(xiàn)代電子技術(shù). 2017(14)
[4]大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)[J]. 謝克武. 電子制作. 2017(09)
[5]中文自然語言處理與計算機的結(jié)合問題研究[J]. 鐘磊. 數(shù)字技術(shù)與應(yīng)用. 2017(02)
[6]基于在線評論的產(chǎn)品選擇方法[J]. 梁霞,姜艷萍,高夢. 東北大學(xué)學(xué)報(自然科學(xué)版). 2017(01)
[7]一種基于信息熵的混合數(shù)據(jù)屬性加權(quán)聚類算法[J]. 趙興旺,梁吉業(yè). 計算機研究與發(fā)展. 2016(05)
[8]結(jié)合全局特征的命名實體屬性值抽取[J]. 劉倩,伍大勇,劉悅,程學(xué)旗,龐琳. 計算機研究與發(fā)展. 2016(04)
[9]一種基于加權(quán)LDA模型的文本聚類方法[J]. 李國,張春杰,張志遠. 中國民航大學(xué)學(xué)報. 2016(02)
[10]基于詞項共現(xiàn)關(guān)系圖模型的中文觀點句識別研究[J]. 王明文,付翠琴,徐凡,洪歡. 中文信息學(xué)報. 2015(06)
碩士論文
[1]商品評論中的屬性詞聚類和擴展研究[D]. 楊靜.北京郵電大學(xué) 2015
[2]電商和微博評論中商品屬性與傾向性識別技術(shù)的研究與實現(xiàn)[D]. 褚劍峰.東華大學(xué) 2014
[3]實體—屬性—框架語義知識庫構(gòu)建研究[D]. 饒思維.東北大學(xué) 2012
本文編號:3082442
本文鏈接:http://sikaile.net/jingjilunwen/gongyejingjilunwen/3082442.html
最近更新
教材專著