基于搜索引擎的惡意對(duì)象發(fā)掘系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)
本文選題:搜索引擎 + 惡意軟件。 參考:《山東大學(xué)》2013年碩士論文
【摘要】:惡意對(duì)象發(fā)掘系統(tǒng)是卡巴斯基公司針對(duì)現(xiàn)有的樣本收集和分析處理系統(tǒng)的一次研究性嘗試,其方向符合未來(lái)殺毒行業(yè)發(fā)展的基本趨勢(shì)。其中涉及到多個(gè)學(xué)科和業(yè)行的技術(shù),是一個(gè)典型的利用多學(xué)科知識(shí)交叉實(shí)現(xiàn)的系統(tǒng)。如搜索引擎技術(shù)、分布式系統(tǒng)并行處理架構(gòu)、機(jī)器學(xué)習(xí)和虛擬機(jī)系統(tǒng)等。系統(tǒng)摒棄傳統(tǒng)殺毒行業(yè)一直沿用的被動(dòng)收集和感染后查殺的模式,采用主動(dòng)檢索,在大數(shù)據(jù)和海量文件的基礎(chǔ)上進(jìn)行挖掘和抽取。這種積極發(fā)現(xiàn)惡意程序并在惡意程序感染和擴(kuò)散之前更新病毒庫(kù)的方式,在第一時(shí)間阻斷了可能感染用戶的信息渠道。 本文采用統(tǒng)一建模的工程方法,以面向?qū)ο蟮乃枷雽?duì)系統(tǒng)進(jìn)行需求分析和設(shè)計(jì)。在系統(tǒng)需求分析章節(jié)我們對(duì)總體業(yè)務(wù)系統(tǒng)的流程進(jìn)行了詳細(xì)說(shuō)明,分析了四大模塊的功能,對(duì)模塊與模塊之間的協(xié)作關(guān)系進(jìn)行描述,樣本收集為例,著重研究了對(duì)原始網(wǎng)頁(yè)的采集,分類(lèi)及分析過(guò)程。從活動(dòng)圖設(shè)計(jì)、類(lèi)結(jié)構(gòu)設(shè)計(jì)、數(shù)據(jù)庫(kù)設(shè)計(jì)等方面詳細(xì)描述系統(tǒng)的設(shè)計(jì),得到了系統(tǒng)中的設(shè)計(jì)類(lèi)和數(shù)據(jù)庫(kù)模型;重點(diǎn)分析了樣本基礎(chǔ)信息庫(kù)和網(wǎng)址分類(lèi)庫(kù)的表設(shè)計(jì)。 全文通過(guò)對(duì)借助搜索引擎進(jìn)行惡意軟件傳播的傳播方式及特點(diǎn)的分析,有針對(duì)性的設(shè)計(jì)出一套精準(zhǔn)有效的監(jiān)測(cè)和自動(dòng)查殺系統(tǒng)。在整體上系統(tǒng)使用了典型的C/S架構(gòu)。因?yàn)樯婕暗酱罅楷F(xiàn)有的功能平臺(tái),系統(tǒng)使用跨平臺(tái)的軟件技術(shù)以兼容和驅(qū)動(dòng)繁雜的異構(gòu)系統(tǒng),所以我們選用各種平臺(tái)無(wú)關(guān)的腳本語(yǔ)言開(kāi)發(fā)主要業(yè)務(wù)邏輯,例如Perl,PHP等。在病毒樣本收集階段,基于虛擬機(jī)實(shí)現(xiàn)了一個(gè)分布式系統(tǒng)檢測(cè)環(huán)境。創(chuàng)建并引入惡意對(duì)象流的概念,在此基礎(chǔ)上設(shè)計(jì)了系統(tǒng)對(duì)潛在惡意對(duì)象的智能判斷以及自動(dòng)化處理流程。其中重點(diǎn)介紹了如何基于搜索引擎發(fā)現(xiàn)惡意對(duì)象和惡意對(duì)象的分類(lèi)處理,基于惡意對(duì)象特征庫(kù),采用支持向量機(jī)設(shè)計(jì)出一個(gè)惡意程序檢測(cè)算法,并用實(shí)驗(yàn)實(shí)證的方法進(jìn)行數(shù)據(jù)比對(duì),分析該算法的理論可行性和實(shí)用性。最后進(jìn)行軟件測(cè)試對(duì)各項(xiàng)功能進(jìn)行評(píng)測(cè)。 該系統(tǒng)目前在實(shí)驗(yàn)室內(nèi)穩(wěn)定運(yùn)行,根據(jù)現(xiàn)有的統(tǒng)計(jì)數(shù)據(jù)看,系統(tǒng)基本達(dá)到預(yù)期。系統(tǒng)已經(jīng)開(kāi)始為公司業(yè)務(wù)系統(tǒng)貢獻(xiàn)了很多有價(jià)值的惡意程序樣本。
[Abstract]:The malicious object discovery system is a research attempt of Kaspersky Company aimed at the existing sample collection and analysis and processing system, and its direction accords with the basic trend of the future development of antivirus industry. The technology involves many disciplines and industries, and it is a typical system using multidisciplinary knowledge. Such as search engine technology, distributed system parallel processing architecture, machine learning and virtual machine systems. The system abandoned the traditional anti-virus industry has been used passive collection and post-infection kill mode, using active retrieval, on the basis of big data and massive files for mining and extraction. This way of actively detecting malicious programs and updating the virus library before the malicious program infects and spreads blocks the information channel of the possible infected users at the first time. In this paper, the unified modeling engineering method is used to analyze and design the requirements of the system with the idea of object-oriented. In the chapter of system requirement analysis, we explain the flow of the whole business system in detail, analyze the functions of the four modules, describe the cooperative relationship between the modules and the modules, and collect samples as an example. The process of collecting, classifying and analyzing the original web pages is studied emphatically. The design of the system is described in detail from the aspects of activity diagram design, class structure design, database design and so on. The design class and database model of the system are obtained, and the table design of the sample base information base and the URL classification database is analyzed. Based on the analysis of the transmission mode and characteristics of malware spread by search engine, a set of accurate and effective monitoring and automatic killing system is designed in this paper. On the whole, the system uses a typical C / S architecture. Because it involves a large number of existing functional platforms, the system uses cross-platform software technology to compatible and drive complex heterogeneous systems, so we choose various platform-independent scripting languages to develop the main business logic, such as Perl PHP and so on. In the phase of virus sample collection, a distributed system detection environment based on virtual machine is implemented. The concept of malicious object flow is created and introduced. Based on this, the intelligent judgment and automatic processing flow of potentially malicious objects are designed. It focuses on how to classify and process malicious objects and malicious objects based on search engine. Based on the signature library of malicious objects, a malicious program detection algorithm is designed by using support vector machine (SVM). The theoretical feasibility and practicability of the algorithm are analyzed. Finally, software tests are carried out to evaluate the functions. The system is running stably in the laboratory at present. According to the existing statistics, the system basically meets the expectation. The system has begun to contribute a number of valuable samples of malicious programs to the company's business systems.
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類(lèi)號(hào)】:TP311.52;TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡(luò)與信息;1999年09期
2 ;關(guān)鍵詞搜索[J];每周電腦報(bào);2000年38期
3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期
4 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報(bào);2001年01期
5 周毅華;從搜索引擎的分類(lèi)看其應(yīng)用技巧[J];圖書(shū)館理論與實(shí)踐;2002年06期
6 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書(shū)館學(xué)研究;2002年05期
7 林燕;Google搜索引擎的搜索功能與使用技巧[J];河北科技圖苑;2003年05期
8 林中;GOOGLE搜索引擎的關(guān)鍵詞檢索[J];中國(guó)信息導(dǎo)報(bào);2003年03期
9 封劍待封喉;吸星大法“搜”天下 笑傲網(wǎng)絡(luò)任我行——搜索引擎絕對(duì)專(zhuān)題[J];網(wǎng)絡(luò)與信息;2003年07期
10 閆凡蕾;建設(shè)站內(nèi)搜索的好幫手——Search Engine Maker[J];少年電世界;2003年08期
相關(guān)會(huì)議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
3 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐?tīng)柡椤の崴韭?;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
6 姚樹(shù)宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
7 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
8 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
9 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
相關(guān)重要報(bào)紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場(chǎng)[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
4 賽迪顧問(wèn)股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢(xún)中心 常燕杰;搜索,,還是門(mén)戶[N];中國(guó)計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國(guó)經(jīng)營(yíng)報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國(guó)證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
10 姜蕊;問(wèn)天下誰(shuí)識(shí)搜索?[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類(lèi)算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
9 鄭文良;基于簡(jiǎn)單本體的農(nóng)業(yè)P2P搜索引擎關(guān)鍵技術(shù)研究[D];沈陽(yáng)農(nóng)業(yè)大學(xué);2013年
10 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
相關(guān)碩士學(xué)位論文 前10條
1 陳剛;基于行為分析智能推薦購(gòu)物搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2011年
2 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
3 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
4 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
5 董晨;基于模糊聚類(lèi)的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
6 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
7 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年
8 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
9 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
10 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實(shí)踐[D];新疆大學(xué);2004年
本文編號(hào):2068642
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2068642.html