網(wǎng)絡(luò)廣告中的點(diǎn)擊欺詐檢測方法研究
本文選題:網(wǎng)絡(luò)廣告 + 點(diǎn)擊欺詐; 參考:《哈爾濱工程大學(xué)》2016年碩士論文
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)服務(wù)已經(jīng)滲透到了生活的方方面面,人們也逐漸形成了對網(wǎng)絡(luò)信息的依賴,在網(wǎng)站中投放廣告的方式已經(jīng)成為目前網(wǎng)絡(luò)中重要的宣傳策略,同時(shí)也成為各個(gè)互聯(lián)網(wǎng)公司重要的財(cái)政收入之一。目前國內(nèi)外對于點(diǎn)擊欺詐檢測的相關(guān)研究,主要分為改進(jìn)付費(fèi)模式、驗(yàn)證碼預(yù)防和數(shù)據(jù)分析檢測三個(gè)方向。然而,對于點(diǎn)擊欺詐的檢測,仍存在廣告商難以接受改變當(dāng)前按點(diǎn)擊付費(fèi)的商業(yè)模式,驗(yàn)證碼機(jī)制降低用戶的體驗(yàn)好感,數(shù)據(jù)分析檢測難以確定用戶身份、數(shù)據(jù)龐大致使分析效率低等問題。本文針對以上這些問題,借鑒目前對點(diǎn)擊欺詐檢測的相關(guān)研究成果,在不改變計(jì)費(fèi)模式的前提下,提出了一種基于分布式環(huán)境的點(diǎn)擊欺詐檢測模型。該點(diǎn)擊欺詐檢測模型主要包括數(shù)據(jù)采集、用戶身份識別以及并行欺詐檢測三個(gè)部分。數(shù)據(jù)采集模塊通過客戶端代碼采集瀏覽器指紋、EverCookie存放數(shù)據(jù)來進(jìn)行用戶身份識別,同時(shí)采集點(diǎn)擊相關(guān)數(shù)據(jù)進(jìn)行并行欺詐檢測;用戶身份識別模塊主要通過瀏覽器指紋識別和EverCookie投放相結(jié)合的方式對用戶的身份進(jìn)行識別;并行欺詐檢測模塊分為并行統(tǒng)計(jì)分析和并行可疑性分析,基于Hadoop分布式環(huán)境對用戶點(diǎn)擊數(shù)據(jù)進(jìn)行并行分析檢測。在本文的最后,通過實(shí)例數(shù)據(jù)對所研究的分析檢測過程進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果表明本文提出的算法能夠改進(jìn)當(dāng)前點(diǎn)擊欺詐檢測算法存在問題,在點(diǎn)擊欺詐檢測的效率和準(zhǔn)確率方面有了明顯提升,能夠?qū)W(wǎng)絡(luò)廣告中的點(diǎn)擊欺詐行為進(jìn)行可靠的檢測。
[Abstract]:With the rapid development of Internet technology, network services have penetrated into all aspects of life, people have gradually formed a dependence on network information, the way to place advertisements in websites has become an important propaganda strategy in the current network. At the same time, it has also become one of the most important revenue for Internet companies. At present, the research on click fraud detection at home and abroad is mainly divided into three directions: improved payment mode, verification code prevention and data analysis and detection. However, for the detection of click fraud, advertisers still find it difficult to accept changing the current pay-per-click business model, the CAPTC-code mechanism reduces the user's good impression of the experience, and the data analysis detection is difficult to determine the identity of the user. The huge data result in low efficiency of analysis and so on. In order to solve these problems, this paper proposes a new click fraud detection model based on distributed environment without changing the billing model by referring to the current research results of click fraud detection. The click-fraud detection model includes three parts: data acquisition, user identification and parallel fraud detection. The data acquisition module uses the client code to collect the browser fingerprint and EverCookie to store the data to identify the user, and at the same time to collect and click the relevant data for parallel fraud detection. The user identification module mainly uses the combination of browser fingerprint identification and EverCookie to identify the identity of the user. The parallel fraud detection module is divided into parallel statistical analysis and parallel suspicious analysis. Parallel analysis and detection of user click-through data based on Hadoop distributed environment. At the end of this paper, the experimental results show that the proposed algorithm can improve the current click-fraud detection algorithm. The efficiency and accuracy of click fraud detection have been improved obviously, and the click fraud can be detected reliably in online advertising.
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.092;TP301.6
【相似文獻(xiàn)】
相關(guān)期刊論文 前7條
1 劉國卿;;一種新的點(diǎn)擊欺詐防范算法[J];計(jì)算機(jī)工程;2011年S1期
2 袁健;張勁松;馬良;;一種有效預(yù)防點(diǎn)擊欺詐的策略[J];計(jì)算機(jī)應(yīng)用;2009年07期
3 張祖蓮;卡米力·木衣丁;王命全;;一種有效預(yù)防點(diǎn)擊欺詐的算法[J];計(jì)算機(jī)應(yīng)用;2010年07期
4 立平;;孫智辰:網(wǎng)絡(luò)惡意點(diǎn)擊的克星[J];今日財(cái)富;2008年10期
5 李愛春;滕少華;;Web挖掘在網(wǎng)絡(luò)廣告點(diǎn)擊欺詐檢測中的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年03期
6 任亞縉;;基于ASIRRA的預(yù)防點(diǎn)擊欺詐改進(jìn)算法[J];信息通信;2014年03期
7 ;Google開創(chuàng)反點(diǎn)擊欺詐網(wǎng)站[J];軟件世界;2007年17期
相關(guān)重要報(bào)紙文章 前10條
1 沙英;網(wǎng)絡(luò)廣告點(diǎn)擊欺詐率高達(dá)14.6%[N];人民郵電;2006年
2 記者 劉世輝;“點(diǎn)擊欺詐”困擾搜索引擎[N];北京日報(bào);2006年
3 主持人 高賽;如何規(guī)避互聯(lián)網(wǎng)“點(diǎn)擊欺詐”[N];光明日報(bào);2006年
4 本報(bào)記者 劉菁菁 杜昊;直面點(diǎn)擊欺詐[N];計(jì)算機(jī)世界;2006年
5 ;搜索廣告陷入“點(diǎn)擊欺詐”[N];亞太經(jīng)濟(jì)時(shí)報(bào);2006年
6 本報(bào)見習(xí)記者 彭瑞財(cái);搜索廣告遭遇“點(diǎn)擊欺詐”[N];財(cái)經(jīng)時(shí)報(bào);2006年
7 梁益暢;點(diǎn)擊欺詐:網(wǎng)絡(luò)廣告的夢魘[N];計(jì)算機(jī)世界;2008年
8 邱桂奇;期待搜索引擎走出點(diǎn)擊欺詐的怪圈[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
9 劉鵬;網(wǎng)頁廣告:點(diǎn)擊欺詐讓廣告費(fèi)白扔[N];新華每日電訊;2006年
10 大漠凌鷹;點(diǎn)擊欺詐成搜索引擎潛規(guī)則[N];電腦報(bào);2006年
相關(guān)碩士學(xué)位論文 前10條
1 喬晨蕊;網(wǎng)絡(luò)廣告中的點(diǎn)擊欺詐檢測方法研究[D];哈爾濱工程大學(xué);2016年
2 母路明;移動萬維網(wǎng)中廣告點(diǎn)擊欺詐檢測技術(shù)的研究[D];西南交通大學(xué);2016年
3 張祖蓮;網(wǎng)絡(luò)點(diǎn)擊欺詐及預(yù)防策略的研究[D];新疆大學(xué);2011年
4 鹿慶超;營造互利多贏的(防點(diǎn)擊欺詐)廣告聯(lián)盟[D];大連理工大學(xué);2011年
5 蘇亞東;關(guān)鍵詞廣告中點(diǎn)擊欺詐問題研究[D];重慶大學(xué);2014年
6 賀文軍;連續(xù)隱馬爾科夫模型在點(diǎn)擊欺詐識別中的應(yīng)用研究[D];上海交通大學(xué);2013年
7 李寶鏡;搜索引擎廣告中策略性出價(jià)和點(diǎn)擊欺詐問題的研究[D];重慶大學(xué);2013年
8 李愛春;Web挖掘在檢測網(wǎng)絡(luò)廣告欺詐行為中的研究與應(yīng)用[D];廣東工業(yè)大學(xué);2011年
9 舒正勇;商業(yè)搜索引擎的點(diǎn)擊欺詐問題研究[D];遼寧師范大學(xué);2008年
10 任亞縉;網(wǎng)絡(luò)廣告中防范欺詐點(diǎn)擊技術(shù)的研究[D];蘭州交通大學(xué);2014年
,本文編號:1846960
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1846960.html