天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

欺詐網(wǎng)頁(yè)挖掘中特征優(yōu)選及檢測(cè)性能研究

發(fā)布時(shí)間:2020-11-20 15:46
   隨著信息時(shí)代的蓬勃發(fā)展,互聯(lián)網(wǎng)在帶給人們方便的同時(shí),也帶來(lái)了許多安全問(wèn)題,其中,以網(wǎng)頁(yè)欺詐為核心的網(wǎng)絡(luò)詐騙行為肆意橫行。欺詐網(wǎng)頁(yè)通過(guò)各種偽裝手段欺騙搜索引擎,提高自身網(wǎng)頁(yè)排名,從而達(dá)到廣告、非法傳銷(xiāo)等目的。在網(wǎng)頁(yè)欺詐與反欺詐的博弈里,如何快速有效、低成本地檢測(cè)出欺詐網(wǎng)頁(yè),加速構(gòu)建和諧、安全的互聯(lián)網(wǎng)環(huán)境,成了刻不容緩的問(wèn)題。在欺詐網(wǎng)頁(yè)檢測(cè)的研究中存在兩個(gè)挑戰(zhàn):一方面,網(wǎng)頁(yè)基本特征的高維、冗余增加了欺詐網(wǎng)頁(yè)檢測(cè)的計(jì)算消耗和計(jì)算代價(jià),影響檢測(cè)效率;另一方面,挖掘欺詐網(wǎng)頁(yè)的過(guò)程中可能會(huì)泄露敏感數(shù)據(jù)的隱私。為了應(yīng)對(duì)上述兩個(gè)挑戰(zhàn),提出了多種有效的特征選擇算法,并在此基礎(chǔ)上進(jìn)一步提出一種兼顧數(shù)據(jù)隱私保護(hù)和檢測(cè)性能的特征選擇算法,以及一個(gè)高效安全的欺詐網(wǎng)頁(yè)檢測(cè)模型。本文首先深入研究了欺詐網(wǎng)頁(yè)的基本分類(lèi)以及對(duì)應(yīng)的網(wǎng)頁(yè)基本特征,并將研究重點(diǎn)放在網(wǎng)頁(yè)基本特征的優(yōu)選上,通過(guò)分析多種特征選擇算法,提出一種基于信息增益(Information Gain,IG)和遺傳算法(Genetic Algorithm,GA)的改進(jìn)特征選擇算法IFS-BIGGA,并且得到了最佳最小的特征子集(OMFS)。為了分析對(duì)比IFS-BIGGA算法的有效性,本文另外實(shí)現(xiàn)了三種基于隨機(jī)森林和鄰域粗糙集的高效的特征選擇算法,實(shí)驗(yàn)結(jié)果證明了IFS-BIGGA算法優(yōu)于其他特征選擇算法?紤]到欺詐網(wǎng)頁(yè)挖掘中數(shù)據(jù)隱私保護(hù)的重要性,本文結(jié)合網(wǎng)頁(yè)特征選擇,在IFSBIGGA的基礎(chǔ)上,加入基于條件熵的隱私度和置信度,實(shí)現(xiàn)了基于隱私保護(hù)的級(jí)聯(lián)特征選擇算法PPGAFS,解決了欺詐網(wǎng)頁(yè)挖掘中提高欺詐網(wǎng)頁(yè)檢測(cè)性能和保護(hù)數(shù)據(jù)隱私之間的矛盾,并在此基礎(chǔ)上提出了一個(gè)高效安全的欺詐網(wǎng)頁(yè)檢測(cè)模型WSDM,主要包括數(shù)據(jù)離散化、數(shù)據(jù)平衡化、特征選擇和分類(lèi)檢測(cè)四個(gè)階段。為了驗(yàn)證提出算法和模型的有效性,在WEBSPAM-UK2007數(shù)據(jù)集上進(jìn)行了多組對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明了提出的基于PPGAFS的欺詐網(wǎng)頁(yè)檢測(cè)模型優(yōu)于其他多種新提出的檢測(cè)方案,有效保護(hù)了數(shù)據(jù)隱私,并且提高了欺詐網(wǎng)頁(yè)檢測(cè)性能。
【學(xué)位單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類(lèi)】:TP393.092
【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景和意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 研究?jī)?nèi)容和論文組織結(jié)構(gòu)
        1.3.1 研究?jī)?nèi)容
        1.3.2 論文組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)研究
    2.1 網(wǎng)頁(yè)欺詐類(lèi)型及相關(guān)網(wǎng)頁(yè)特征
        2.1.1 鏈接欺詐與基于鏈接的特征
        2.1.2 內(nèi)容欺詐與基于內(nèi)容的特征
        2.1.3 隱藏型欺詐與隱藏型特征
    2.2 特征選擇與分類(lèi)
        2.2.1 特征選擇
        2.2.2 分類(lèi)算法
    2.3 總結(jié)
第3章 基于信息增益和遺傳算法改進(jìn)特征選擇策略
    3.1 改進(jìn)的信息增益-特征選擇
    3.2 改進(jìn)的遺傳算法
        3.2.1 染色體編碼
        3.2.2 遺傳算子
    3.3 基于信息增益和遺傳算法的改進(jìn)特征選擇算法IFS-BIGGA
    3.4 數(shù)據(jù)集與評(píng)價(jià)指標(biāo)
        3.4.1 數(shù)據(jù)集
        3.4.2 評(píng)價(jià)指標(biāo)
        3.4.3 箱型圖
    3.5 基于IFS-BIGGA的特征選擇實(shí)驗(yàn)與結(jié)果分析
        3.5.1 實(shí)驗(yàn)參數(shù)設(shè)置
        3.5.2 特征選擇實(shí)驗(yàn)結(jié)果
        3.5.3 驗(yàn)證性實(shí)驗(yàn)與結(jié)果分析
    3.6 三種特征選擇算法與實(shí)驗(yàn)結(jié)果對(duì)比
        3.6.1 基于比例刪除的隨機(jī)森林特征選擇算法PDRFFS
RFFS'>        3.6.2 基于卡方檢驗(yàn)的隨機(jī)森林特征選擇算法Chi-SquareRFFS
        3.6.3 基于鄰域粗糙集的特征選擇算法FHARA
    3.7 本章小結(jié)
第4章 基于隱私保護(hù)的級(jí)聯(lián)特征選擇算法
    4.1 隱私度與置信度
    4.2 隱私保護(hù)-特征選擇
    4.3 基于隱私保護(hù)和遺傳算法的級(jí)聯(lián)特征選擇算法PPGAFS
    4.4 數(shù)據(jù)集與評(píng)價(jià)指標(biāo)
    4.5 實(shí)驗(yàn)與結(jié)果分析
    4.6 本章小結(jié)
第5章 一個(gè)高效安全的欺詐網(wǎng)頁(yè)檢測(cè)模型
    5.1 欺詐網(wǎng)頁(yè)檢測(cè)模型WSDM
    5.2 基于WSDM的驗(yàn)證實(shí)驗(yàn)
    5.3 本章小結(jié)
總結(jié)與展望
    總結(jié)
    展望
致謝
參考文獻(xiàn)
攻讀碩士期間發(fā)表的論文

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王嘉卿;朱焱;陳同孝;張真誠(chéng);;欺詐網(wǎng)頁(yè)檢測(cè)中基于遺傳算法的特征優(yōu)選[J];計(jì)算機(jī)應(yīng)用;2018年01期

2 盧曉勇;陳木生;;基于隨機(jī)森林和欠采樣集成的垃圾網(wǎng)頁(yè)檢測(cè)[J];計(jì)算機(jī)應(yīng)用;2016年03期

3 韋莎;朱焱;;主題相似度與鏈接權(quán)重相結(jié)合的垃圾網(wǎng)頁(yè)排序檢測(cè)[J];計(jì)算機(jī)應(yīng)用;2016年03期

4 陸釗;李石君;;基于鏈接相似度和作弊系數(shù)的Spam網(wǎng)頁(yè)識(shí)別算法[J];計(jì)算機(jī)工程與科學(xué);2015年10期

5 吳少華;程書(shū)寶;胡勇;;基于SVM的Web攻擊檢測(cè)技術(shù)[J];計(jì)算機(jī)科學(xué);2015年S1期

6 宋源;梁雪春;張然;;基于統(tǒng)計(jì)特性隨機(jī)森林算法的特征選擇[J];計(jì)算機(jī)應(yīng)用;2015年05期

7 董師師;黃哲學(xué);;隨機(jī)森林理論淺析[J];集成技術(shù);2013年01期

8 羅武;方逵;朱興輝;;網(wǎng)絡(luò)搜索引擎排序算法研究進(jìn)展[J];湖南農(nóng)業(yè)科學(xué);2010年07期

9 常璐,夏祖奇;搜索引擎的幾種常用排序算法[J];圖書(shū)情報(bào)工作;2003年06期

10 沈?qū)W華,周志華,吳建鑫,陳兆乾;Boosting和Bagging綜述[J];計(jì)算機(jī)工程與應(yīng)用;2000年12期


相關(guān)碩士學(xué)位論文 前5條

1 孫丹丹;集成URL新特征的網(wǎng)絡(luò)釣魚(yú)檢測(cè)機(jī)制研究[D];西南交通大學(xué);2017年

2 江雄偉;偽裝型垃圾網(wǎng)頁(yè)檢測(cè)技術(shù)的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2014年

3 李法良;集成Web質(zhì)量的垃圾網(wǎng)頁(yè)分級(jí)檢測(cè)機(jī)制研究[D];西南交通大學(xué);2013年

4 王莉麗;隱藏型垃圾網(wǎng)頁(yè)檢測(cè)研究[D];西南交通大學(xué);2013年

5 周政;隱藏型垃圾網(wǎng)頁(yè)檢測(cè)技術(shù)的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2012年



本文編號(hào):2891640

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2891640.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f145f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩一级欧美一级久久| 最新69国产精品视频| 久久精品国产在热亚洲| 亚洲男人的天堂久久a| 国产又粗又爽又猛又黄的| 中文字幕一区久久综合| 亚洲视频一区二区久久久| 丁香六月婷婷基地伊人| 国产成人亚洲综合色就色| 婷婷九月在线中文字幕| 亚洲香艳网久久五月婷婷| 久久少妇诱惑免费视频| 欧美丰满人妻少妇精品| 丁香六月婷婷基地伊人| 日韩日韩日韩日韩在线| 国产精品亚洲综合色区韩国| 国产人妻精品区一区二区三区| 亚洲最新中文字幕在线视频| 少妇人妻精品一区二区三区| 久久精品国产亚洲av麻豆尤物| 国产在线成人免费高清观看av| 欧美91精品国产自产| 成人你懂的在线免费视频| 精品伊人久久大香线蕉综合 | 一区中文字幕人妻少妇| 欧美激情中文字幕综合八区| 大尺度剧情国产在线视频| 亚洲人午夜精品射精日韩| 中国少妇精品偷拍视频 | 欧美精品久久一二三区| 久久99午夜福利视频| 亚洲一区二区精品免费| 国产精品欧美在线观看| 国产熟女高清一区二区| 亚洲综合色在线视频香蕉视频| 人妻人妻人人妻人人澡| 欧美丰满大屁股一区二区三区| 深夜日本福利在线观看| 少妇人妻精品一区二区三区| 欧洲一区二区三区蜜桃| 女同伦理国产精品久久久|