可搜索壓縮算法的設(shè)計與實現(xiàn)及其在ClamAV中的應(yīng)用
發(fā)布時間:2020-12-04 10:00
當(dāng)前,由于互聯(lián)網(wǎng)技術(shù)的提高和網(wǎng)絡(luò)的飛速發(fā)展,數(shù)據(jù)信息出現(xiàn)了快速地增長。伴隨著數(shù)據(jù)量的增長,對海量數(shù)據(jù)的存儲、傳輸以及處理都出現(xiàn)了更高的要求。對大量的數(shù)據(jù)如何能夠在減少其空間占用的同時又能快速地對其進行檢索查找,成為了一個新的可以探索并且需要解決的問題。在本文中我們提出了一種方法,這種方法采用一種新的壓縮模式來對數(shù)據(jù)進行處理。與一般壓縮模式的處理方法不同的是,該壓縮模式在減少數(shù)據(jù)文件大小的同時,支持在壓縮文件中直接進行檢索查找等相關(guān)操作,從而達到了在減少數(shù)據(jù)存儲空間占用的同時對數(shù)據(jù)進行快速查找檢索的雙重目的。本文所提出的壓縮算法是采用基于壓縮字典的字符串替換方法,該方法對文本的處理是在字節(jié)流上進行處理,所以其適用于一切文件類型。其處理過程的主要思想是將文本中高頻出現(xiàn)的字節(jié)對(即連續(xù)的兩個字節(jié))與文本中低頻出現(xiàn)的單個字節(jié)進行交換。當(dāng)文中我們選中的字節(jié)對出現(xiàn)的頻率高于文中我們選中的字節(jié)出現(xiàn)的頻率時,對文本進行壓縮,就會產(chǎn)生壓縮效果。對于自然文本,基本都會達到壓縮效果。另外,對用于進行壓縮的字節(jié)對和字節(jié),為避免壓縮和解壓過程出現(xiàn)二義性,需要對它們的選取加以限制,即所選取的任意兩個字節(jié)對之間不能...
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文的組織結(jié)構(gòu)
圖 2.2 可查找壓縮模式的查找過程Manber 將該查找壓縮算法應(yīng)用在了兩個查找程序中進行了實驗。實驗結(jié)下(作者的實驗運行在 DECstation 5000/240,Ultrix 上),單位為秒(s)
圖 4.1 ClamAV 系統(tǒng)結(jié)構(gòu)圖C1amAV 反病毒系統(tǒng)的框架設(shè)計各部分分工明確,邏輯較為清晰,可從五面劃分:第一步,讀取病毒庫。系統(tǒng)通過調(diào)用 int c1_load()從指定路徑下讀取病。第二步,病毒引擎初始化。在病毒庫加載成功后,系統(tǒng)通過調(diào)用函數(shù) i1_build()開始進行引擎加載及參數(shù)配置,其中涉及包括了對各算法數(shù)據(jù)結(jié)構(gòu)始化。待各參數(shù)完成初始化后進行加載。用數(shù)字 0 來表明加載成功,其他說載不成功。第三步,初步檢查掃描。查毒系統(tǒng)通過調(diào)用 c1_scandesc()函數(shù)通過掃描傳入的文件特征和掃描參數(shù)調(diào)用對應(yīng)的函數(shù)對文件進行初步的掃描。cli_scandesc()函數(shù)的執(zhí)行過程大致如下:系統(tǒng)先執(zhí)行精準模式匹配程序據(jù)輸入文件的類型對其進行查找,使用 BM 模式匹配算法調(diào)用函
本文編號:2897399
【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文的組織結(jié)構(gòu)
圖 2.2 可查找壓縮模式的查找過程Manber 將該查找壓縮算法應(yīng)用在了兩個查找程序中進行了實驗。實驗結(jié)下(作者的實驗運行在 DECstation 5000/240,Ultrix 上),單位為秒(s)
圖 4.1 ClamAV 系統(tǒng)結(jié)構(gòu)圖C1amAV 反病毒系統(tǒng)的框架設(shè)計各部分分工明確,邏輯較為清晰,可從五面劃分:第一步,讀取病毒庫。系統(tǒng)通過調(diào)用 int c1_load()從指定路徑下讀取病。第二步,病毒引擎初始化。在病毒庫加載成功后,系統(tǒng)通過調(diào)用函數(shù) i1_build()開始進行引擎加載及參數(shù)配置,其中涉及包括了對各算法數(shù)據(jù)結(jié)構(gòu)始化。待各參數(shù)完成初始化后進行加載。用數(shù)字 0 來表明加載成功,其他說載不成功。第三步,初步檢查掃描。查毒系統(tǒng)通過調(diào)用 c1_scandesc()函數(shù)通過掃描傳入的文件特征和掃描參數(shù)調(diào)用對應(yīng)的函數(shù)對文件進行初步的掃描。cli_scandesc()函數(shù)的執(zhí)行過程大致如下:系統(tǒng)先執(zhí)行精準模式匹配程序據(jù)輸入文件的類型對其進行查找,使用 BM 模式匹配算法調(diào)用函
本文編號:2897399
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2897399.html
最近更新
教材專著