評(píng)論類網(wǎng)站的用戶欺詐行為檢測(cè)
發(fā)布時(shí)間:2022-01-22 09:16
評(píng)論類網(wǎng)站為用戶提供了交流意見和分享觀點(diǎn)的平臺(tái),群體評(píng)論意見往往反映物品的真實(shí)情況,這些功能幫助用戶獲取更多有價(jià)值的信息。例如在電子商務(wù)平臺(tái)上,用戶對(duì)購(gòu)買的商品進(jìn)行的評(píng)分或是文字評(píng)論可以幫助其他用戶了解商家沒有告知的商品信息,輔助用戶做出選擇。然而,部分商家為了商業(yè)目的讓部分用戶發(fā)表不實(shí)評(píng)論信息,夸大商品優(yōu)點(diǎn)或是詆毀競(jìng)爭(zhēng)對(duì)手的商品,甚至有商家通過眾包平臺(tái),雇傭大量用戶進(jìn)行虛假評(píng)論,給評(píng)論類網(wǎng)站上的公平環(huán)境帶來負(fù)面影響。因此,有必要對(duì)評(píng)論行為進(jìn)行欺詐分析和檢測(cè)。評(píng)論類網(wǎng)站上的欺詐行為檢測(cè)存在幾個(gè)困難:首先,用戶對(duì)商品的認(rèn)同感通常是個(gè)性化的,不同用戶評(píng)分受個(gè)體因素影響較大;其次,個(gè)體用戶的偏好也存在波動(dòng)性,對(duì)相同質(zhì)量的物品或服務(wù)的評(píng)價(jià)可能會(huì)因所處環(huán)境的差異而變化,并非每次評(píng)論行為均是客觀公正的;再者,數(shù)據(jù)中缺少對(duì)評(píng)論行為的欺詐標(biāo)記。理論上欺詐行為應(yīng)該依據(jù)客觀的標(biāo)準(zhǔn)和事實(shí)進(jìn)行判定,而評(píng)論行為的主觀性和隨機(jī)性、以及動(dòng)態(tài)性和數(shù)據(jù)量巨大等特點(diǎn)給欺詐行為的判定帶來困難。針對(duì)這些問題,本文工作分別針對(duì)個(gè)體用戶、用戶群組和單次評(píng)論進(jìn)行不同粒度的欺詐檢測(cè)。針對(duì)欺詐用戶的檢測(cè)問題,本文提出了基于統(tǒng)計(jì)的異常行...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
整體框架圖
定義2-2?(文本評(píng)論):是指用戶對(duì)于特定商品以文字方式進(jìn)行的功能描述以??及使用感受。??圖2-2為Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布,橫軸表示文本長(zhǎng)度,??縱軸表示對(duì)應(yīng)長(zhǎng)度的文本評(píng)論次數(shù)?梢钥闯鲈谠u(píng)論類網(wǎng)站中,單次文本評(píng)論長(zhǎng)??度一般呈現(xiàn)長(zhǎng)尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本長(zhǎng)度??圖2-2?Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布??定義2-3?(評(píng)論):是指用戶對(duì)商品情況的總體反饋,一般可由多元組??表不,其中用戶u屬于用戶集合[/,商品i屬于商品集合/,w對(duì)i給??出的評(píng)分ruie?(0,5],tx代表文本評(píng)論,tm為此次評(píng)論產(chǎn)生的時(shí)間點(diǎn)。??從參與人數(shù)的表現(xiàn)形式上講,欺詐行為可以分為異常與共謀兩個(gè)特性。所謂??異常一般是指單個(gè)用戶呈現(xiàn)出與他人甚至自身歷史不同的行為。
(a)MovieLens數(shù)據(jù)集中用戶評(píng)分分布?(b)Amazon數(shù)據(jù)集中用戶評(píng)分分布??圖2-1不同平臺(tái)用戶評(píng)分分布區(qū)別??定義2-2?(文本評(píng)論):是指用戶對(duì)于特定商品以文字方式進(jìn)行的功能描述以??及使用感受。??圖2-2為Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布,橫軸表示文本長(zhǎng)度,??縱軸表示對(duì)應(yīng)長(zhǎng)度的文本評(píng)論次數(shù)。可以看出在評(píng)論類網(wǎng)站中,單次文本評(píng)論長(zhǎng)??度一般呈現(xiàn)長(zhǎng)尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本長(zhǎng)度??圖2-2?Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布??定義2-3?(評(píng)論):是指用戶對(duì)商品情況的總體反饋,一般可由多元組??表不,其中用戶u屬于用戶集合[/,商品i屬于商品集合/,w對(duì)i給??出的評(píng)分ruie?(0,5],tx代表文本評(píng)論,tm為此次評(píng)論產(chǎn)生的時(shí)間點(diǎn)。??從參與人數(shù)的表現(xiàn)形式上講
【參考文獻(xiàn)】:
期刊論文
[1]知識(shí)表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
[2]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇. 軟件學(xué)報(bào). 2008(01)
本文編號(hào):3601935
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
整體框架圖
定義2-2?(文本評(píng)論):是指用戶對(duì)于特定商品以文字方式進(jìn)行的功能描述以??及使用感受。??圖2-2為Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布,橫軸表示文本長(zhǎng)度,??縱軸表示對(duì)應(yīng)長(zhǎng)度的文本評(píng)論次數(shù)?梢钥闯鲈谠u(píng)論類網(wǎng)站中,單次文本評(píng)論長(zhǎng)??度一般呈現(xiàn)長(zhǎng)尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本長(zhǎng)度??圖2-2?Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布??定義2-3?(評(píng)論):是指用戶對(duì)商品情況的總體反饋,一般可由多元組??表不,其中用戶u屬于用戶集合[/,商品i屬于商品集合/,w對(duì)i給??出的評(píng)分ruie?(0,5],tx代表文本評(píng)論,tm為此次評(píng)論產(chǎn)生的時(shí)間點(diǎn)。??從參與人數(shù)的表現(xiàn)形式上講,欺詐行為可以分為異常與共謀兩個(gè)特性。所謂??異常一般是指單個(gè)用戶呈現(xiàn)出與他人甚至自身歷史不同的行為。
(a)MovieLens數(shù)據(jù)集中用戶評(píng)分分布?(b)Amazon數(shù)據(jù)集中用戶評(píng)分分布??圖2-1不同平臺(tái)用戶評(píng)分分布區(qū)別??定義2-2?(文本評(píng)論):是指用戶對(duì)于特定商品以文字方式進(jìn)行的功能描述以??及使用感受。??圖2-2為Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布,橫軸表示文本長(zhǎng)度,??縱軸表示對(duì)應(yīng)長(zhǎng)度的文本評(píng)論次數(shù)。可以看出在評(píng)論類網(wǎng)站中,單次文本評(píng)論長(zhǎng)??度一般呈現(xiàn)長(zhǎng)尾分布。??考衣X)0?!?!'?j?■;?t??SCfX??-??5C50C?iL??■?II:龜,??:、丨麗__'揉《??——?—????0?5DG?1000?1500?KXX)?21^-?SQ0G?4〇〇〇?-:500?SOOC??文本長(zhǎng)度??圖2-2?Amazon數(shù)據(jù)集中用戶單次文本評(píng)論長(zhǎng)度分布??定義2-3?(評(píng)論):是指用戶對(duì)商品情況的總體反饋,一般可由多元組??表不,其中用戶u屬于用戶集合[/,商品i屬于商品集合/,w對(duì)i給??出的評(píng)分ruie?(0,5],tx代表文本評(píng)論,tm為此次評(píng)論產(chǎn)生的時(shí)間點(diǎn)。??從參與人數(shù)的表現(xiàn)形式上講
【參考文獻(xiàn)】:
期刊論文
[1]知識(shí)表示學(xué)習(xí)研究進(jìn)展[J]. 劉知遠(yuǎn),孫茂松,林衍凱,謝若冰. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
[2]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇. 軟件學(xué)報(bào). 2008(01)
本文編號(hào):3601935
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3601935.html
最近更新
教材專著