可搜索壓縮算法的設(shè)計(jì)與實(shí)現(xiàn)及其在ClamAV中的應(yīng)用
發(fā)布時(shí)間:2020-12-04 10:00
當(dāng)前,由于互聯(lián)網(wǎng)技術(shù)的提高和網(wǎng)絡(luò)的飛速發(fā)展,數(shù)據(jù)信息出現(xiàn)了快速地增長(zhǎng)。伴隨著數(shù)據(jù)量的增長(zhǎng),對(duì)海量數(shù)據(jù)的存儲(chǔ)、傳輸以及處理都出現(xiàn)了更高的要求。對(duì)大量的數(shù)據(jù)如何能夠在減少其空間占用的同時(shí)又能快速地對(duì)其進(jìn)行檢索查找,成為了一個(gè)新的可以探索并且需要解決的問(wèn)題。在本文中我們提出了一種方法,這種方法采用一種新的壓縮模式來(lái)對(duì)數(shù)據(jù)進(jìn)行處理。與一般壓縮模式的處理方法不同的是,該壓縮模式在減少數(shù)據(jù)文件大小的同時(shí),支持在壓縮文件中直接進(jìn)行檢索查找等相關(guān)操作,從而達(dá)到了在減少數(shù)據(jù)存儲(chǔ)空間占用的同時(shí)對(duì)數(shù)據(jù)進(jìn)行快速查找檢索的雙重目的。本文所提出的壓縮算法是采用基于壓縮字典的字符串替換方法,該方法對(duì)文本的處理是在字節(jié)流上進(jìn)行處理,所以其適用于一切文件類型。其處理過(guò)程的主要思想是將文本中高頻出現(xiàn)的字節(jié)對(duì)(即連續(xù)的兩個(gè)字節(jié))與文本中低頻出現(xiàn)的單個(gè)字節(jié)進(jìn)行交換。當(dāng)文中我們選中的字節(jié)對(duì)出現(xiàn)的頻率高于文中我們選中的字節(jié)出現(xiàn)的頻率時(shí),對(duì)文本進(jìn)行壓縮,就會(huì)產(chǎn)生壓縮效果。對(duì)于自然文本,基本都會(huì)達(dá)到壓縮效果。另外,對(duì)用于進(jìn)行壓縮的字節(jié)對(duì)和字節(jié),為避免壓縮和解壓過(guò)程出現(xiàn)二義性,需要對(duì)它們的選取加以限制,即所選取的任意兩個(gè)字節(jié)對(duì)之間不能...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文的組織結(jié)構(gòu)
圖 2.2 可查找壓縮模式的查找過(guò)程Manber 將該查找壓縮算法應(yīng)用在了兩個(gè)查找程序中進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)下(作者的實(shí)驗(yàn)運(yùn)行在 DECstation 5000/240,Ultrix 上),單位為秒(s)
圖 4.1 ClamAV 系統(tǒng)結(jié)構(gòu)圖C1amAV 反病毒系統(tǒng)的框架設(shè)計(jì)各部分分工明確,邏輯較為清晰,可從五面劃分:第一步,讀取病毒庫(kù)。系統(tǒng)通過(guò)調(diào)用 int c1_load()從指定路徑下讀取病。第二步,病毒引擎初始化。在病毒庫(kù)加載成功后,系統(tǒng)通過(guò)調(diào)用函數(shù) i1_build()開(kāi)始進(jìn)行引擎加載及參數(shù)配置,其中涉及包括了對(duì)各算法數(shù)據(jù)結(jié)構(gòu)始化。待各參數(shù)完成初始化后進(jìn)行加載。用數(shù)字 0 來(lái)表明加載成功,其他說(shuō)載不成功。第三步,初步檢查掃描。查毒系統(tǒng)通過(guò)調(diào)用 c1_scandesc()函數(shù)通過(guò)掃描傳入的文件特征和掃描參數(shù)調(diào)用對(duì)應(yīng)的函數(shù)對(duì)文件進(jìn)行初步的掃描。cli_scandesc()函數(shù)的執(zhí)行過(guò)程大致如下:系統(tǒng)先執(zhí)行精準(zhǔn)模式匹配程序據(jù)輸入文件的類型對(duì)其進(jìn)行查找,使用 BM 模式匹配算法調(diào)用函
本文編號(hào):2897399
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文的組織結(jié)構(gòu)
圖 2.2 可查找壓縮模式的查找過(guò)程Manber 將該查找壓縮算法應(yīng)用在了兩個(gè)查找程序中進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)下(作者的實(shí)驗(yàn)運(yùn)行在 DECstation 5000/240,Ultrix 上),單位為秒(s)
圖 4.1 ClamAV 系統(tǒng)結(jié)構(gòu)圖C1amAV 反病毒系統(tǒng)的框架設(shè)計(jì)各部分分工明確,邏輯較為清晰,可從五面劃分:第一步,讀取病毒庫(kù)。系統(tǒng)通過(guò)調(diào)用 int c1_load()從指定路徑下讀取病。第二步,病毒引擎初始化。在病毒庫(kù)加載成功后,系統(tǒng)通過(guò)調(diào)用函數(shù) i1_build()開(kāi)始進(jìn)行引擎加載及參數(shù)配置,其中涉及包括了對(duì)各算法數(shù)據(jù)結(jié)構(gòu)始化。待各參數(shù)完成初始化后進(jìn)行加載。用數(shù)字 0 來(lái)表明加載成功,其他說(shuō)載不成功。第三步,初步檢查掃描。查毒系統(tǒng)通過(guò)調(diào)用 c1_scandesc()函數(shù)通過(guò)掃描傳入的文件特征和掃描參數(shù)調(diào)用對(duì)應(yīng)的函數(shù)對(duì)文件進(jìn)行初步的掃描。cli_scandesc()函數(shù)的執(zhí)行過(guò)程大致如下:系統(tǒng)先執(zhí)行精準(zhǔn)模式匹配程序據(jù)輸入文件的類型對(duì)其進(jìn)行查找,使用 BM 模式匹配算法調(diào)用函
本文編號(hào):2897399
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2897399.html
最近更新
教材專著