惡意爬蟲主動防御技術研究與實現(xiàn)

發(fā)布時間：2021-07-09 16:25

　　伴隨著大數(shù)據(jù)時代的不斷進步,網(wǎng)絡爬蟲技術作為能夠自動化、持久化地與互聯(lián)網(wǎng)應用進行模擬交互的工具正迅猛發(fā)展。網(wǎng)絡爬蟲在帶來便利的同時也給網(wǎng)絡環(huán)境造成了諸多安全隱患。諸如批量惡意采集數(shù)據(jù);匹配采集各類社區(qū)敏感信息;非授權刷票、點評;基于網(wǎng)絡爬蟲變種的各類惡意攻擊等惡意行為�，F(xiàn)有的網(wǎng)絡爬蟲防御機制主要是采用被動檢測和攔截技術進行限制,起到了一定的防護效果,但是隨著人工智能技術的不斷迭代,驗證碼識別、仿人行為等技術的不斷精進和變化給靜態(tài)的被動檢測增加了難度;另外由于IP地址的有限性,以IP地址作為檢測和封鎖的條件也存在巨大的缺陷。本文針對以上所面臨的問題并結(jié)合網(wǎng)絡爬蟲技術的關鍵點,提出了一種惡意爬蟲主動防御技術模型,通過動態(tài)化算法改變Web頁面固有的靜態(tài)特性,結(jié)合主動防御中的移動目標防御的思想,來應對復雜多變的網(wǎng)絡爬蟲及其變種攻擊。本文針對惡意爬蟲防御主要做了以下工作:1、提出了一種Web頁面動態(tài)化算法。該算法采用動態(tài)加密算法和動態(tài)陷阱技術將Web頁面進行自適應地動態(tài)化跳變,從而高效地避免因靜態(tài)性、單一性和確定性造成的惡意爬蟲及其變種攻擊的自動化實施;2、提出一種基于瀏覽器指紋技術的訪問流量異...

【文章來源】：北京郵電大學北京市 211工程院校教育部直屬院校

【文章頁數(shù)】：84 頁

【學位級別】：碩士

【部分圖文】：

圖２－１爬蟲等級和應對方式??

頁面,源代碼,驗證碼

頁面,目標,驗證碼

．觸?１式進行ｉＲ別限制—＇＊］人的行Ｋ繞過檢測???????通過ＫＨＴＰ?Ｈｅａｄｅｒ?Ｈｅａｄｅｒ信息??ｉ無界面?』自動化工——？■參數(shù)進行５１Ｍ限制——令?容易偽裝??｜?瀏覽器—？！?ｎ＊瀏覽一１??—：：：：：：—：ｚ＝ｚｒｆ????器內(nèi)核??ｕ通過單丨ｐ地址訪問?ｉ?代理ｉｐ容ｓ??利用搬器?—＾１?⑥檢測．．Ｊ??Ｃ智能Ｋ蟲）－????????ｒｉａｅｉＰｔｏｉＳ／ｉ＇?‘?ｒｅｉｉｐＳｓ＂—??Ｙ?白動＿化工?＊ｉ進行識稱限制?＆過檢》??激歡器！?？■具＋滿覽－?．．．：????＿±＿＿Ｉ?器引－?ｉ通過驗證碼?驗證碼ｇ雜程度????１?．也隨截?’丨不砝控制??圖２－１爬蟲等級和應對方式??圖２－２代碼所示，如果目標內(nèi)容是搜狗微信站點上的所有頁面的新聞標題，??里的匹配規(guī)則如圖２－３代碼所示，我們?yōu)榱宋ㄒ黄ヅ涑鰳祟}（或者其他目標內(nèi)??），需要編寫能夠唯一確定的正則表達式或者ｘｐａｔｈ路徑，并且需要保證所選的??配方式適用于期望的目標所有頁面。通過離線觀察、分析以及嘗試，這里的ｃｌａｓｓ??值和ｉｄ的值“ｒｉｃｈ＿ｍｅｄｉａ＿ｔｉｔｌｅ”、“ａｃｔｉｖｉｔｙ－ｎａｍｅ”，可以在單個ＨＴＭＬ頁面中唯??確定我們想要的標題，而且不會隨著時間動態(tài)改變，并適用于所有新聞頁面，??此我們可以編寫出穩(wěn)定持續(xù)的自動化獲取腳本代碼如上。??

【參考文獻】：
期刊論文
[1]基于Netfilter/Iptables的動態(tài)安全防御系統(tǒng)設計[J]. 李志奇,何彥宏,孔德愷.  通信學報. 2018(S2)
[2]面向SDN的移動目標防御技術研究進展[J]. 譚晶磊,張紅旗,雷程,劉小虎,王碩.  網(wǎng)絡與信息安全學報. 2018(07)
[3]基于梯度提升模型的行為式驗證碼人機識別[J]. 歐陽志友,孫孝魁.  信息網(wǎng)絡安全. 2017(09)
[4]基于隱馬爾科夫模型的網(wǎng)絡爬蟲檢測算法仿真[J]. 琚興空.  計算機與現(xiàn)代化. 2017(04)

博士論文
[1]網(wǎng)絡主動防御關鍵技術研究[D]. 羅躍斌.國防科學技術大學 2017
[2]Rijndael中若干關鍵問題的研究[D]. 崔杰.中國科學技術大學 2012

碩士論文
[1]基于深度學習的圖片驗證碼識別算法研究[D]. 張樂樂.青島科技大學 2018
[2]Cookie技術發(fā)展視閾下我國個人信息保護的法律路徑探究[D]. 陳若男.華中師范大學 2018
[3]基于Web服務的移動目標防御技術研究與實現(xiàn)[D]. 景湘評.北京郵電大學 2018
[4]基于網(wǎng)絡欺騙的網(wǎng)站防護技術研究[D]. 林建寶.北京郵電大學 2018
[5]滑塊驗證碼人機識別系統(tǒng)特征選擇及應用研究[D]. 王二磊.長沙理工大學 2017
[6]Web客戶端隱私泄露成因與機理研究[D]. 王曉茜.北京工業(yè)大學 2017
[7]基于SVM的空心驗證碼識別技術研究[D]. 孟凱.重慶郵電大學 2017
[8]基于HTTP的可靠性測試腳本生成的研究與實現(xiàn)[D]. 張珊.北京郵電大學 2017
[9]一種基于SDN的地址跳變主動防御技術的研究與實現(xiàn)[D]. 王宇航.浙江大學 2017
[10]基于行為模式的Web Robot檢測技術研究[D]. 琚興空.武漢郵電科學研究院 2017

本文編號：3274085

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3274085.html

上一篇：可導航輸電線路電子地圖的研發(fā)
下一篇：基于三值神經(jīng)網(wǎng)絡和混沌搜索的數(shù)字電路串擾時滯故障測試生成算法（英文）

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

惡意爬蟲主動防御技術研究與實現(xiàn)