基于用戶行為的色情網(wǎng)站識別
發(fā)布時間:2017-06-25 21:15
本文關(guān)鍵詞:基于用戶行為的色情網(wǎng)站識別,由筆耕文化傳播整理發(fā)布。
【摘要】:以色情網(wǎng)站為代表的萬維網(wǎng)非法資源已經(jīng)成為互聯(lián)網(wǎng)應(yīng)用普及過程中的重大挑戰(zhàn).由于色情網(wǎng)站與普通網(wǎng)站的內(nèi)容特征、結(jié)構(gòu)形式和訪問者群體都有顯著的差異,這造成了用戶對色情網(wǎng)站和普通網(wǎng)站的訪問行為的差異.在某商業(yè)搜索引擎的協(xié)助下,收集了海量規(guī);ヂ(lián)網(wǎng)用戶訪問日志,基于對日志中所記載用戶行為的挖掘,驗證了用戶訪問色情網(wǎng)站與普通網(wǎng)站時的行為確實具有明顯的差異.基于此類差異設(shè)計了一系列用戶行為特征,并結(jié)合機器學(xué)習(xí)方法,設(shè)計了基于用戶行為的色情網(wǎng)站識別方法.實驗表明,該方法可以較準確、高效地從網(wǎng)站中識別色情網(wǎng)站.
【作者單位】: 智能技術(shù)與系統(tǒng)國家重點實驗室(清華大學(xué));清華信息科學(xué)與技術(shù)國家實驗室(籌);清華大學(xué)計算機科學(xué)與技術(shù)系;
【關(guān)鍵詞】: 色情網(wǎng)站 網(wǎng)絡(luò)非法資源 用戶行為分析 搜索引擎 網(wǎng)絡(luò)瀏覽
【基金】:國家“八六三”高技術(shù)研究發(fā)展計劃基金項目(2011AA01A205) 國家自然科學(xué)基金項目(60903107,61073071) 高等學(xué)校博士學(xué)科點專項科研基金項目(20090002120005)
【分類號】:TP391.3
【正文快照】: 我國正處于互聯(lián)網(wǎng)高速發(fā)展的浪潮之中,一方面,截止2011年底,中國網(wǎng)民規(guī)模達到4.85億,位居世界首位,網(wǎng)頁數(shù)量達到600億以上,自2003年以來已經(jīng)保持了多年的快速增長;另一方面,我國人口中的互聯(lián)網(wǎng)普及率目前為36.2%,僅略高于世界平均水平,遠低于西方發(fā)達國家的水平.互聯(lián)網(wǎng)普及率
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 江婕;李建民;曾R挽,
本文編號:483587
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/483587.html
最近更新
教材專著