面向商品的虛假評論檢測技術(shù)研究
發(fā)布時間:2024-04-12 00:52
隨著電子商務的飛速發(fā)展,線上購物產(chǎn)生的商品評論對消費者選擇商品提供了重要的參考價值。然而受利益的驅(qū)使,某些商家會雇傭評論者對商品屬性進行失實說明,使消費者收到外界對商品質(zhì)量的錯誤反饋,進而影響消費者的消費行為。虛假評論能夠影響商家口碑,使消費者在商家的選擇上具有傾向性。因此不法商家對虛假評論有著迫切需求,從而導致虛假評論日益泛濫,破壞了電子商務市場應該遵循的良性競爭規(guī)則。因此虛假評論檢測研究已經(jīng)成為電子商務良性發(fā)展過程中極為重要的工作之一。目前研究者通常對評論文本和評論者行為進行分析來檢測虛假評論,而很少有人以商戶特征、評論者的歷史行為以及評論時間為依據(jù)分析評論的異常性。因此以往的方法只能檢測出隱藏性較低的虛假評論,而對專業(yè)的虛假評論者撰寫的隱藏性較高的虛假評論檢測準確率較低。為解決這些問題,給消費者購物提供更加準確的參考,本文主要進行了以下兩方面的工作:(1)提出了一種基于習慣偏差與XGBoost算法的虛假評論檢測方法。首先,提出一種改進的情感極性計算算法,并根據(jù)位置因素加入本地化情感詞,使評論文本情感極性的計算更為精準;其次,提出了商家的異常波動區(qū)間概念以及評論用戶習慣偏差指標并融...
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3951408
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【部分圖文】:
圖3-2某位評論者評論情感—評分圖
面向商品的虛假評論檢測技術(shù)研究-5所示:2_115()nncurrentreviewjjF其中,為評論的情感—評分的相符程度,j為當前評論用戶的第j條歷史評為評分滿分,故的計算公式如3-6所示:這里取出某位評論者的全部評論繪制了情感—評分....
圖3-3某位評論者評論長度圖
圖3-3某位評論者評論長度圖由圖可知,大部分評論長度都在一定范圍內(nèi)波動,有小部分的評論長度是偏過大的,這也許是由于某些評論者會被利益驅(qū)使進行虛假評論的發(fā)布,如果長度和歷史評論長度的方差過大,則認為此用戶存在撰寫虛假評論的可能,為此條評論為潛在的虛假評論。三、商戶異常波動某些商....
圖3-4店鋪人流量和EMA曲線對比圖
面向商品的虛假評論檢測技術(shù)研究(3-為了便于理解,這里對一家店鋪三年的所有評論進行了人流量的計算,設定為一個記錄時間區(qū)間,該店鋪的人流量波動如圖3-4所示:1,0.370,0.3iiiiiixYxFxYx
圖3-5店鋪平均評分和EMA曲線對比圖
圖3-5店鋪平均評分和EMA曲線對比圖3.2.4基于XGBoost算法的虛假評論檢測在得到特征模型之后,使用XGBoost算法進行虛假評論的檢測工作,下面紹該算法的檢測流程:(1)假設有文本數(shù)據(jù)集R={x1,x2,…,xn},其中xi代表第i條評論。每條....
本文編號:3951408
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3951408.html
最近更新
教材專著