文件碎片識(shí)別和重組技術(shù)的研究與應(yīng)用
發(fā)布時(shí)間:2017-09-29 08:30
本文關(guān)鍵詞:文件碎片識(shí)別和重組技術(shù)的研究與應(yīng)用
更多相關(guān)文章: 數(shù)據(jù)恢復(fù) 文件雕復(fù) 文件碎片 內(nèi)容特征
【摘要】:隨著科學(xué)技術(shù)和信息時(shí)代的發(fā)展,數(shù)據(jù)的重要性日益突出,人們更加依賴于計(jì)算機(jī)和智能系統(tǒng)設(shè)備,這無(wú)疑給人們的工作和生活帶來(lái)了巨大方便。傳統(tǒng)數(shù)據(jù)恢復(fù)技術(shù)能夠恢復(fù)人為誤刪等數(shù)據(jù),但是當(dāng)文件系統(tǒng)損壞或文件系統(tǒng)元數(shù)據(jù)信息損壞、丟失時(shí),傳統(tǒng)數(shù)據(jù)恢復(fù)技術(shù)無(wú)法恢復(fù)數(shù)據(jù),造成無(wú)法估計(jì)的損失。而文件雕復(fù)技術(shù)不依賴于原始磁盤(pán)鏡像的文件系統(tǒng),它從表面上無(wú)結(jié)構(gòu)的二進(jìn)制數(shù)據(jù)流(即原始磁盤(pán)鏡像)中恢復(fù)數(shù)據(jù),它克服了傳統(tǒng)數(shù)據(jù)恢復(fù)技術(shù)在文件系統(tǒng)損壞或元數(shù)據(jù)損壞以及文件在磁盤(pán)上不連續(xù)存放而形成碎片等無(wú)法恢復(fù)的情況,因此受到了極大的關(guān)注。本文通過(guò)對(duì)文件雕復(fù)技術(shù)進(jìn)行研究,基于信息熵、字節(jié)頻率分布和字節(jié)平均值三種特征提取算法,并結(jié)合支持向量機(jī)作為分類器來(lái)分類文件碎片,并使用基于磁盤(pán)簇邏輯順序的重組算法或基于數(shù)據(jù)文件性質(zhì)的重組算法對(duì)文件碎片進(jìn)行重組,提出了一種對(duì)多種文件類型有效的文件雕復(fù)算法,并通過(guò)恢復(fù)Word文檔和JPEG圖像進(jìn)行驗(yàn)證。主要工作如下:首先,提出一種基于內(nèi)容特征的文件碎片分類算法。該算法利用信息熵原理,計(jì)算目標(biāo)類型文件的熵值范圍,通過(guò)熵值特征提取算法提取出目標(biāo)類型文件碎片的集合。之后在二類分類的基礎(chǔ)上,采用1-gram的方法,利用字節(jié)頻率分布和字節(jié)平均值兩個(gè)特征,并結(jié)合基于支持向量機(jī)的監(jiān)督學(xué)習(xí)算法對(duì)熵值提取出的碎片集合進(jìn)一步分類。其次,設(shè)計(jì)三組仿真實(shí)驗(yàn)對(duì)基于內(nèi)容特征的文件碎片分類算法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該算法的可行性和有效性。然后,提出一種基于內(nèi)容特征的文件雕復(fù)算法。該算法是在基于內(nèi)容特征的文件碎片分類算法基礎(chǔ)上,對(duì)已完成分類的目標(biāo)類型文件碎片,采用基于磁盤(pán)簇邏輯順序的重組算法或基于數(shù)據(jù)文件性質(zhì)的重組算法對(duì)目標(biāo)類型文件碎片進(jìn)行重組,確定同一文件碎片間正確的拼接關(guān)系,恢復(fù)其文件。最后,為了驗(yàn)證該算法的可行性,選取DFRW 2006發(fā)布的磁盤(pán)鏡像作為實(shí)驗(yàn)數(shù)據(jù),對(duì)Word文檔和JPEG圖像進(jìn)行恢復(fù)。通過(guò)設(shè)計(jì)詳細(xì)的實(shí)驗(yàn)步驟,并將實(shí)驗(yàn)結(jié)果與Foremost和PhotoRec兩種工具的雕復(fù)結(jié)果進(jìn)行對(duì)比,結(jié)果表明該算法能夠從無(wú)結(jié)構(gòu)的磁盤(pán)鏡像中恢復(fù)文件,并證明了該算法的可行性和有效性。
【關(guān)鍵詞】:數(shù)據(jù)恢復(fù) 文件雕復(fù) 文件碎片 內(nèi)容特征
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP309.3
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-18
- 1.1 研究背景10-12
- 1.2 問(wèn)題的提出12
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀12-15
- 1.4 研究目的和意義15
- 1.5 研究?jī)?nèi)容15-16
- 1.6 論文組織結(jié)構(gòu)16-18
- 第2章 相關(guān)理論與技術(shù)概述18-32
- 2.1 FAT32文件系統(tǒng)18-20
- 2.1.1 FAT32的文件分配18-19
- 2.1.2 FAT32的文件刪除19
- 2.1.3 FAT32的文件恢復(fù)19-20
- 2.2 文件碎片20-22
- 2.2.1 碎片產(chǎn)生的原因20-22
- 2.2.2 碎片模型22
- 2.3 文件雕復(fù)技術(shù)概述22-28
- 2.3.1 基于文件頭/文件尾雕復(fù)方法23-24
- 2.3.2 基于文件頭/最大長(zhǎng)度雕復(fù)方法24
- 2.3.3 基于映射函數(shù)雕復(fù)方法24-25
- 2.3.4 二分片差距雕復(fù)方法25
- 2.3.5 基于文件結(jié)構(gòu)雕復(fù)方法25-26
- 2.3.6 基于內(nèi)容特征雕復(fù)方法26
- 2.3.7 基于語(yǔ)義雕復(fù)方法26
- 2.3.8 基于圖論雕復(fù)方法26-27
- 2.3.9 Smart雕復(fù)方法27-28
- 2.4 模式識(shí)別28-30
- 2.4.1 模式識(shí)別的應(yīng)用28-29
- 2.4.2 模式識(shí)別系統(tǒng)29-30
- 2.4.3 模式識(shí)別方法30
- 2.5 本章小結(jié)30-32
- 第3章 基于內(nèi)容特征的文件碎片分類算法32-40
- 3.1 文件碎片分類的相關(guān)研究32
- 3.2 文件碎片分類算法框架32-34
- 3.3 文件碎片分類34-39
- 3.3.1 支持向量機(jī)34-36
- 3.3.2 特征提取算法36-37
- 3.3.3 訓(xùn)練過(guò)程和分類過(guò)程37-38
- 3.3.4 分類結(jié)果評(píng)估38-39
- 3.4 本章小結(jié)39-40
- 第4章 文件碎片分類實(shí)驗(yàn)與分析40-54
- 4.1 數(shù)據(jù)集40-41
- 4.2 實(shí)驗(yàn)設(shè)計(jì)41-45
- 4.2.1 熵值提取41
- 4.2.2 高熵類型文件碎片分類41-43
- 4.2.3 本文的文件碎片分類算法43-45
- 4.2.4 驗(yàn)證實(shí)驗(yàn)45
- 4.3 實(shí)驗(yàn)結(jié)果與分析45-52
- 4.3.1 熵值特征提取算法45-47
- 4.3.2 高熵文件碎片分類算法47-49
- 4.3.3 本文的文件碎片分類算法49-51
- 4.3.4 實(shí)驗(yàn)結(jié)果對(duì)比51-52
- 4.4 本章小結(jié)52-54
- 第5章 基于內(nèi)容特征的文件雕復(fù)實(shí)現(xiàn)54-72
- 5.1 文件碎片重組技術(shù)54-58
- 5.1.1 基于磁盤(pán)簇邏輯順序的重組算法54-56
- 5.1.2 基于數(shù)據(jù)文件性質(zhì)的重組算法56-58
- 5.2 基于內(nèi)容特征的文件雕復(fù)算法58-61
- 5.2.1 文件雕復(fù)算法思想58-59
- 5.2.2 文件雕復(fù)算法流程59-61
- 5.3 實(shí)驗(yàn)設(shè)計(jì)61-64
- 5.3.1 數(shù)據(jù)集61-62
- 5.3.2 MD5校驗(yàn)62
- 5.3.3 病毒掃描62
- 5.3.4 雕復(fù)過(guò)程62-64
- 5.3.5 驗(yàn)證實(shí)驗(yàn)64
- 5.4 實(shí)驗(yàn)結(jié)果與分析64-70
- 5.4.1 雕復(fù)結(jié)果比較與分析64-68
- 5.4.2 雕復(fù)結(jié)果展示68-70
- 5.5 本章小結(jié)70-72
- 結(jié)論72-74
- 參考文獻(xiàn)74-78
- 攻讀碩士學(xué)位期間取得的研究成果78-80
- 致謝80
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 俞偉燕;;輕松處理文件碎片[J];信息與電腦(理論版);2010年01期
2 江萬(wàn);問(wèn)&答[J];電子與電腦;1995年04期
3 ;困擾服務(wù)器性能的文件碎片[J];電子商務(wù);2009年05期
4 平心;;有效優(yōu)化Linux防文件碎片降低硬盤(pán)性能[J];網(wǎng)絡(luò)與信息;2009年12期
5 李艷紅;;“智斗”Windows XP(5)——數(shù)據(jù)整隊(duì)總動(dòng)員[J];少年電腦世界;2010年06期
6 徐明;黃立;張海平;徐建;鄭寧;;頭部缺失的JPEG文件碎片恢復(fù)[J];中國(guó)圖象圖形學(xué)報(bào);2013年01期
7 ;[J];;年期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 郭軍;文件碎片識(shí)別和重組技術(shù)的研究與應(yīng)用[D];北京工業(yè)大學(xué);2016年
,本文編號(hào):940984
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/940984.html
最近更新
教材專著