Web挖掘在網(wǎng)絡(luò)廣告點擊欺詐檢測中的應(yīng)用
本文選題:點擊欺詐 + Web數(shù)據(jù)挖掘。 參考:《計算機工程與設(shè)計》2012年03期
【摘要】:為有效解決網(wǎng)絡(luò)廣告中存在的點擊欺詐問題,提出了一種基于Web挖掘算法的解決方案,并設(shè)計了一套點擊欺詐檢測模型。該模型通過對點擊流進行時序分析、離群點挖掘、非線性分析等操作,能有效檢測或屏蔽各類點擊欺詐,有效屏蔽無意識的無效點擊,并且在不影響廣告展示速度的基礎(chǔ)上顯著提高檢測點擊欺詐的效率。實驗結(jié)果表明,該解決方案可以有效檢測采用手動或者利用計算機程序的方法模仿正常用戶進行點擊欺詐的行為,表明了模型的可行性和方案的有效性。
[Abstract]:In order to effectively solve the problem of click fraud in network advertisement, a solution based on Web mining algorithm is proposed, and a set of click fraud detection model is designed. The model can detect or shield all kinds of click fraud effectively and effectively shield the unconscious invalid click through timing analysis, outlier mining, nonlinear analysis and other operations, such as click stream timing analysis, outlier mining, nonlinear analysis and so on. And on the basis of not affecting the speed of advertising display, the efficiency of detecting click fraud is improved significantly. The experimental results show that the proposed scheme can effectively detect the click fraud behavior of normal users by manual or computer program, which shows the feasibility of the model and the effectiveness of the scheme.
【作者單位】: 廣東工業(yè)大學(xué)計算機學(xué)院;
【基金】:廣東省自然科學(xué)基金項目(06021484、9151009001000007、9451009001002777) 廣東省科技計劃基金項目(2008A060201011) 韶關(guān)市科技計劃基金項目(2010CXY/C05)
【分類號】:TP393.08
【參考文獻】
相關(guān)期刊論文 前10條
1 李學(xué)俊;李龍澍;徐怡;;基于粗糙集的Web用戶行為預(yù)測研究[J];計算機工程與應(yīng)用;2008年13期
2 張波;巫莉莉;周敏;;基于Web使用挖掘的用戶行為分析[J];計算機科學(xué);2006年08期
3 張蓉;;Web挖掘技術(shù)研究[J];計算機工程;2006年15期
4 方元康;胡學(xué)鋼;夏啟壽;朱勇;;改進的Web日志數(shù)據(jù)預(yù)處理技術(shù)[J];計算機工程;2009年10期
5 袁健;張勁松;馬良;;一種有效預(yù)防點擊欺詐的策略[J];計算機應(yīng)用;2009年07期
6 張毅;劉旭敏;關(guān)永;;基于密度的離群噪聲點檢測[J];計算機應(yīng)用;2010年03期
7 徐翔;劉建偉;羅雄麟;;離群點挖掘研究[J];計算機應(yīng)用研究;2009年01期
8 高衛(wèi)華;謝康林;;Web用戶行為預(yù)測的一種新模型及算法[J];計算機應(yīng)用與軟件;2007年03期
9 趙戰(zhàn)營;成長生;;基于聚類分析局部離群點挖掘改進算法的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2010年11期
10 高志堅;;引入第三方監(jiān)測根治點擊欺詐[J];生產(chǎn)力研究;2007年18期
相關(guān)碩士學(xué)位論文 前1條
1 舒正勇;商業(yè)搜索引擎的點擊欺詐問題研究[D];遼寧師范大學(xué);2008年
【共引文獻】
相關(guān)期刊論文 前10條
1 王柯柯;崔貫勛;倪偉;茍光磊;;基于單元的快速的大數(shù)據(jù)集離群數(shù)據(jù)挖掘算法[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2010年05期
2 張智;閆正龍;;地理信息公共服務(wù)平臺用戶行為模式挖掘關(guān)鍵技術(shù)研究[J];測繪技術(shù)裝備;2011年03期
3 王軍豪;劉艷杰;;基于電子政務(wù)的點擊流數(shù)據(jù)分析應(yīng)用研究[J];河南城建學(xué)院學(xué)報;2010年01期
4 劉雨;;基于聚類的Markov預(yù)測模型的改進[J];河南財政稅務(wù)高等專科學(xué)校學(xué)報;2009年02期
5 史月美;胡國華;;基于Rough Set的Web日志規(guī)則挖掘[J];電腦開發(fā)與應(yīng)用;2009年09期
6 王燕;;關(guān)聯(lián)規(guī)則在計算機取證中的應(yīng)用研究[J];計算機安全;2010年04期
7 李建廷;;元搜索引擎中搜索結(jié)果的采集與處理[J];電子科技;2010年06期
8 周賀來;;Web挖掘在電子政務(wù)中的應(yīng)用研究[J];電子政務(wù);2008年07期
9 秦艷華;;數(shù)據(jù)挖掘技術(shù)中孤立點的分析研究[J];硅谷;2010年04期
10 張劍飛;李照欣;;基于后綴數(shù)組的Web文本重復(fù)短語識別[J];高師理科學(xué)刊;2007年05期
相關(guān)會議論文 前1條
1 武洪萍;周國祥;;Web文本挖掘研究[A];計算機技術(shù)與應(yīng)用進展·2007——全國第18屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前7條
1 孟凡文;面向光柵投影的點云預(yù)處理與曲面重構(gòu)技術(shù)研究[D];南昌大學(xué);2010年
2 歐海鷹;互聯(lián)網(wǎng)環(huán)境下在線廣告位置管理研究[D];北京郵電大學(xué);2011年
3 方輝;機械制造信息資源的非規(guī)范知識處理技術(shù)研究[D];四川大學(xué);2007年
4 尹世群;Web文本分類關(guān)鍵技術(shù)研究[D];西南大學(xué);2008年
5 李海強;基于情景感知的移動接入模式挖掘及預(yù)測研究[D];北京郵電大學(xué);2009年
6 竇伊男;根據(jù)多維特征的網(wǎng)絡(luò)用戶分類研究[D];北京郵電大學(xué);2010年
7 聶建輝;自定位實物數(shù)字化技術(shù)研究[D];大連海事大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 張琰渝;用戶興趣模型建模方法研究[D];遼寧師范大學(xué);2010年
2 李曉飛;J2EE集成開發(fā)框架及其應(yīng)用[D];江西師范大學(xué);2010年
3 蔣濤;基于數(shù)據(jù)挖掘技術(shù)的個性化網(wǎng)上書店系統(tǒng)的設(shè)計研究[D];電子科技大學(xué);2010年
4 沙有闖;基于Web文本挖掘的網(wǎng)絡(luò)口碑監(jiān)測系統(tǒng)研究[D];安徽大學(xué);2010年
5 周志剛;數(shù)據(jù)挖掘技術(shù)在計算機取證的研究[D];大連交通大學(xué);2010年
6 田家瑞;骨干通信網(wǎng)絡(luò)異常事件關(guān)聯(lián)分析的不確定性分析[D];電子科技大學(xué);2011年
7 董倩;Web潛在用戶挖掘研究[D];河北農(nóng)業(yè)大學(xué);2011年
8 王瑞偉;網(wǎng)絡(luò)安全取證的應(yīng)用研究[D];江南大學(xué);2011年
9 李愛春;Web挖掘在檢測網(wǎng)絡(luò)廣告欺詐行為中的研究與應(yīng)用[D];廣東工業(yè)大學(xué);2011年
10 文軍艦;基于Nutch的Web結(jié)構(gòu)挖掘算法研究[D];天津財經(jīng)大學(xué);2011年
【二級參考文獻】
相關(guān)期刊論文 前10條
1 劉大峰;廖文和;戴寧;程筱勝;;散亂點云去噪算法的研究與實現(xiàn)[J];東南大學(xué)學(xué)報(自然科學(xué)版);2007年06期
2 徐慧樸;馬孜;吳德烽;;逆向工程中三維離散點云的平滑整定新算法[J];工程設(shè)計學(xué)報;2008年02期
3 王先林;丁圣偉;;網(wǎng)絡(luò)廣告中的點擊欺詐及其對策[J];中國工商管理研究;2007年04期
4 易敏昕,張有仁,汪勝;基于日志定制的Web使用數(shù)據(jù)挖掘預(yù)處理研究[J];華東理工大學(xué)學(xué)報;2003年04期
5 韓家煒,孟小峰,王靜,李盛恩;Web挖掘研究[J];計算機研究與發(fā)展;2001年04期
6 王虎;馮林;孫宇哲;;數(shù)字驗證碼識別算法的研究和設(shè)計[J];計算機工程與應(yīng)用;2007年32期
7 薛安榮;姚林;鞠時光;陳偉鶴;馬漢達;;離群點挖掘方法綜述[J];計算機科學(xué);2008年11期
8 張蓉,彭宏;一種基于快速分解模擬退火算法的數(shù)據(jù)聚類算法[J];計算機工程;2002年08期
9 趙澤茂,何坤金,陳鵬,景雪琴,蔣霞東;Web日志文件的異常數(shù)據(jù)挖掘算法及其應(yīng)用[J];計算機工程;2003年17期
10 王志琪;王永成;;HTML文件的文本信息預(yù)處理技術(shù)[J];計算機工程;2006年05期
相關(guān)博士學(xué)位論文 前2條
1 胡國飛;三維數(shù)字表面去噪光順技術(shù)研究[D];浙江大學(xué);2005年
2 賀美芳;基于散亂點云數(shù)據(jù)的曲面重建關(guān)鍵技術(shù)研究[D];南京航空航天大學(xué);2006年
相關(guān)碩士學(xué)位論文 前2條
1 戴靜蘭;海量點云預(yù)處理算法研究[D];浙江大學(xué);2006年
2 黃薇;搜索引擎?zhèn)鞑ヅc盈利模式研究[D];四川大學(xué);2006年
【相似文獻】
相關(guān)期刊論文 前10條
1 聶高輝;萬常選;;Web數(shù)據(jù)挖掘的原理與技術(shù)[J];科技管理研究;2008年01期
2 李欣;羅立宇;周浩;;基于XML的Web數(shù)據(jù)挖掘的應(yīng)用研究[J];電腦知識與技術(shù);2008年14期
3 顧紅其;;Xml在web數(shù)據(jù)挖掘中的作用與研究[J];科技信息;2008年27期
4 陳林凱;;Web數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J];福建電腦;2008年11期
5 何志英;王明泉;;基于XML的Web數(shù)據(jù)挖掘研究[J];軟件導(dǎo)刊;2009年05期
6 方少卿;;XML在Web數(shù)據(jù)挖掘中的應(yīng)用研究[J];銅陵職業(yè)技術(shù)學(xué)院學(xué)報;2010年01期
7 柴夢竹;;基于Web的數(shù)據(jù)挖掘研究綜述[J];職大學(xué)報;2010年02期
8 孫學(xué)軍;;面向電子商務(wù)的Web數(shù)據(jù)挖掘應(yīng)用研究[J];棗莊學(xué)院學(xué)報;2010年05期
9 林建勤;XML與Web數(shù)據(jù)挖掘技術(shù)[J];貴州師范大學(xué)學(xué)報(自然科學(xué)版);2003年02期
10 王玉珍;Web數(shù)據(jù)挖掘技術(shù)與XML[J];信息技術(shù);2005年10期
相關(guān)會議論文 前10條
1 于浩;王斌;肖剛;楊曉春;;基于距離的不確定離群點檢測[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
2 萬英;蔣梁中;翟敬梅;;虛擬數(shù)據(jù)庫與WEB數(shù)據(jù)挖掘[A];首屆泛珠三角先進制造技術(shù)論壇暨第八屆粵港機電工程技術(shù)與應(yīng)用研討會論文專輯[C];2004年
3 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動化學(xué)會第24屆學(xué)術(shù)年會會議論文集[C];2006年
4 吳瑾;趙燕平;;WEB數(shù)據(jù)挖掘中多線程的開發(fā)及同步機制的實現(xiàn)[A];第11屆全國計算機在現(xiàn)代科學(xué)技術(shù)領(lǐng)域應(yīng)用學(xué)術(shù)會議論文集[C];2003年
5 李翠萍;呂廷杰;;Web數(shù)據(jù)挖掘在網(wǎng)絡(luò)商務(wù)領(lǐng)域的應(yīng)用[A];2006中國控制與決策學(xué)術(shù)年會論文集[C];2006年
6 吳楊凱;王澤兵;黃杲;馮雁;;Web數(shù)據(jù)挖掘綜述[A];第六屆全國計算機應(yīng)用聯(lián)合學(xué)術(shù)會議論文集[C];2002年
7 楊金來;洪偉林;張翼翔;;網(wǎng)絡(luò)學(xué)習(xí)行為的實時監(jiān)控研究與實踐[A];2009年中國成人教育協(xié)會年會論文集[C];2009年
8 易虹;許德剛;;Web數(shù)據(jù)挖掘的研究與應(yīng)用[A];第一屆全國Web信息系統(tǒng)及其應(yīng)用會議(WISA2004)論文集[C];2004年
9 戴琦;;Web上的數(shù)據(jù)挖掘[A];全國計算機網(wǎng)絡(luò)應(yīng)用年會論文集(2001)[C];2001年
10 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報學(xué)會學(xué)術(shù)年會論文集[C];2004年
相關(guān)重要報紙文章 前1條
1 記者 賀耀堂;港城9項目入選省科技創(chuàng)新與成果轉(zhuǎn)化項目[N];連云港日報;2008年
相關(guān)博士學(xué)位論文 前5條
1 唐向紅;數(shù)據(jù)流離群點檢測研究[D];華中科技大學(xué);2010年
2 王旭紅;遙感影像數(shù)據(jù)挖掘技術(shù)研究[D];西北大學(xué);2005年
3 周黔;高性能數(shù)據(jù)流模式發(fā)現(xiàn)算法及其應(yīng)用研究[D];浙江大學(xué);2008年
4 蘇亮;數(shù)據(jù)流分析關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2008年
5 于瀚雯;單/多基線相位解纏繞技術(shù)研究[D];西安電子科技大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 李明;無線傳感器網(wǎng)絡(luò)中離群點檢測算法研究[D];江蘇大學(xué);2010年
2 譚艷娜;面向?qū)徲嬵I(lǐng)域的聚類離群點檢測研究[D];哈爾濱工程大學(xué);2011年
3 于浩;面向概率數(shù)據(jù)流的離群點檢測技術(shù)[D];東北大學(xué);2009年
4 余燦玲;基于密度的不確定離群點檢測研究[D];云南大學(xué);2010年
5 張?zhí)煊?基于網(wǎng)格劃分的高維大數(shù)據(jù)集離群點檢測算法研究[D];中南大學(xué);2011年
6 何威;基于數(shù)據(jù)密度估計的聚類與離群點檢測研究[D];北京交通大學(xué);2011年
7 陳德峰;基于Context的時空離群點檢測模型研究[D];華東理工大學(xué);2011年
8 孫啟林;基于NMF和相似度函數(shù)離群點檢測[D];安徽大學(xué);2012年
9 陳明建;基于WEB的數(shù)據(jù)挖掘技術(shù)——WEB內(nèi)容挖掘的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2003年
10 趙學(xué)良;基于滑動窗口模型的數(shù)據(jù)流離群點檢測研究[D];重慶大學(xué);2012年
,本文編號:1853306
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/1853306.html