天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于派系過濾算法的虛假評論用戶群檢測研究

發(fā)布時間:2024-04-26 02:05
  電子商務(wù)的發(fā)展促使在線評論數(shù)量急劇增長,產(chǎn)品評論成為人們購物消費(fèi)的重要參考指標(biāo),但是網(wǎng)絡(luò)中的虛假評論卻在逐年增多,其發(fā)布者多為專業(yè)的虛假評論用戶群。雖然國內(nèi)外研究者提出了許多用于檢測虛假評論和虛假評論者的方法和模型,但是仍存在許多問題,如人工標(biāo)注數(shù)據(jù)的準(zhǔn)確率低、語言特征失效、檢測精確率較低和檢測滯后。為了解決以上問題,本文主要研究在線評論網(wǎng)站中虛假評論用戶群的檢測模型,主要研究內(nèi)容包含以下兩個方面:1.針對人工標(biāo)注數(shù)據(jù)的準(zhǔn)確率低和語言特征失效的問題,提出一種基于派系過濾的虛假評論用戶群離線檢測模型,采用完全無監(jiān)督的方式檢測虛假評論用戶群。首先,將評論數(shù)據(jù)構(gòu)建為評論者網(wǎng)絡(luò)。其次,在評論者網(wǎng)絡(luò)中執(zhí)行派系過濾算法,創(chuàng)新地將檢測到的每一個k-派系鏈視為一個虛假評論用戶群。然后,構(gòu)建基于評論行為的作弊特征,從個人和群組兩個維度衡量各個虛假評論用戶群的可疑程度,生成群組排序列表。最后,在三個公開數(shù)據(jù)集上進(jìn)行對比實驗,結(jié)果表明本模型的檢測精確率和排名質(zhì)量高于四個對比模型,并且數(shù)據(jù)集越大,本模型的效果越好。2.針對檢測滯后和檢測精確率較低的問題,提出一種基于增量派系過濾的虛假評論用戶群在線檢測模型。首...

【文章頁數(shù)】:73 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1.1論文整體研究思路

圖1.1論文整體研究思路

2.針對檢測滯后和檢測精確率較低的問題,本文第四章研究了如何在線檢測虛假評論用戶群,提出一種基于增量派系過濾的虛假評論用戶群在線檢測模型。本模型主要包含兩個部分,一是檢測初始靜態(tài)評論者網(wǎng)絡(luò)中的虛假評論用戶群,二是在線更新虛假評論用戶群。其中第一部分沿用了離線檢測模型的核心方法,仍....


圖3.1派系過濾算法中的k-派系和k-派系鏈?zhǔn)纠? src=

圖3.1派系過濾算法中的k-派系和k-派系鏈?zhǔn)纠?br>
k-派系是具有k個節(jié)點(diǎn)的完全圖。圖3.1(a)展示了k-派系(k=2,3,4)的示例。定義3.4:k-派系鏈(k-cliquecluster)


圖3.2基于派系過濾的虛假評論用戶群離線檢測模型框架圖

圖3.2基于派系過濾的虛假評論用戶群離線檢測模型框架圖

將評論者網(wǎng)絡(luò)與用戶的行為數(shù)據(jù)相結(jié)合,構(gòu)建基于派系過濾的虛假評論用戶群離線檢測模型,簡稱GSCPM(DetectingGroupSpamviaCPM),模型的整體框架如圖3.2所示。本模型的輸入為評論元數(shù)據(jù)、最小群組規(guī)模和時間閾值,通過本模型中三個步驟的運(yùn)算,最后輸出群組排....


圖3.3基于評論數(shù)據(jù)構(gòu)建評論者網(wǎng)絡(luò)

圖3.3基于評論數(shù)據(jù)構(gòu)建評論者網(wǎng)絡(luò)

3.過濾可疑度較低的評論者節(jié)點(diǎn)。根據(jù)以上兩步構(gòu)造的評論者投影圖可能會包含很多的正常評論者,接下來過濾可疑度較低的評論者節(jié)點(diǎn)。在本模型中,邊權(quán)重值為1表示兩個評論者之間相互勾結(jié)的可能性較大,邊權(quán)重值為0表示兩個評論者之間不存在共同評論的可能性,所以本模型在后面的計算過程中忽略邊權(quán)重....



本文編號:3964548

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3964548.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9487b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com