無損壓縮文件的參數(shù)特性分析
【部分圖文】:
侄?被解壓后得到的譯文為解壓字段。解壓文件可以被表示成解壓字段的形式:X=(xs,1,xs,2,…,xs,n),(6)其中,xs,i表示第i個解壓字段。1.2編碼分類無損壓縮編碼可分為分組碼和字典碼兩類。分組碼是指不依賴前文而能譯碼的壓縮碼,如Huffman[7-8]碼和Fano碼等。字典碼是指必須依靠前文作為字典才能完成譯碼的壓縮碼,如LZ77[9]和LZW[10]等。從碼長是否相等的角度可以將無損壓縮編碼分為變長碼和等長碼。從是否采用字典的角度可以將無損壓縮編碼分為字典碼和非字典碼。如圖1所示,LZ77屬于等長碼和字典碼,Huffman碼屬于變長碼和非字典碼,Deflate32[11]和LZSS[12]屬于變長碼和字典碼。圖1壓縮編碼分類Fig.1Thetypesofcompressedcode1.3壓縮文件的參數(shù)統(tǒng)計特性本節(jié)主要分析壓縮比、匹配距離和匹配長度的統(tǒng)計特性。1)壓縮比壓縮比是反映壓縮算法性能的重要指標。壓縮比γc可以被定義為γc=LcLo,(7)其中,Lc是壓縮文件長度,Lo是源文件長度。壓縮比越小,壓縮算法的性能就越高。實驗中統(tǒng)計了Deflate32算法的原文件與壓縮比的關(guān)系(圖2),其中橫坐標是原文件長度,縱坐標為Deflate32算法的壓縮比。原文件為英文的文本文件。實驗中選擇了1000個英文文本文件來計算壓縮比,這些英文文本文件來自美國國家語料庫。美國國家語料庫可以在ANC官網(wǎng)上下載,此語料庫包含了從1990年以來的新聞報道、小說、紀實文學(xué)和書信等各類文本,語料庫的大小為7GB。從圖2中可以看出,當原文件長度較小時,壓縮比很高。隨著原文件長度增加,壓縮比下降。當原文件長度大于20KB時,壓縮比基本不變。從圖2中可以看出,只有當原文件長度足夠大時,壓縮算法的?
76燕山大學(xué)學(xué)報2017圖2原文件長度和壓縮比的關(guān)系圖Fig.2Therelationshipbetweentheoriginalfile’slengthandthecompressionratio2)匹配距離匹配距離是匹配字符串與被壓縮字符串之間的距離。匹配距離的最小值是1字節(jié),最大值是窗口長度。圖3和圖4分別是Deflate32文件和LZSS文件的匹配距離的概率密度圖,其中橫坐標是匹配距離(單位為字節(jié)),縱坐標是概率密度。Deflate32算法和LZSS算法的窗口長度分別為32KB和4KB。實驗中選擇了100個長度在100KB到5MB之間的英文文本,分布用Deflate32算法和LZSS算法對它們進行壓縮,并隨機選擇了50000個匹配距離進行統(tǒng)計。圖3Deflate32文件的匹配距離的概率密度圖Fig.3TheprobabilitydensityofmatchdistanceinDeflate32file從兩幅圖可以看出,當匹配距離小于100字節(jié)時,隨著匹配距離的增大匹配距離的概率密度會減校當匹配距離大于100字節(jié)時,隨著匹配距離增大,匹配距離的概率密度趨于平穩(wěn)。不同窗口長度的匹配距離服從均勻分布,因此對匹配距離的二次熵編碼的壓縮效果是不明顯的。匹配距離的概率密度函數(shù)接近于均勻分布這一事實反應(yīng)了英文文本中的統(tǒng)計特性基本是平穩(wěn)的。當英文單詞之間的間隔足夠大(兩個單詞之間相隔5~6個單詞)時,英文單詞之間的相關(guān)性與單詞之間的距離是無關(guān)的。這一實驗事實也說明:通過調(diào)整字典窗口長度是無法有效提高壓縮率的,這也驗證了字典長度為64KB的Deflate壓縮編碼方法的性能與字典長度為32KB的Deflate壓縮編碼方法的性能相比差別不大。圖4LZSS文件的匹配距離的概率密度圖Fig.4TheprobabilitydensityofmatchdistanceinLZSSfile3)匹配長度匹配長度是指字典碼中匹配字符串的長度。圖5和圖6分別是Deflate32算法和LZSS算法的匹配長度的概率密度圖,其
叵低?Fig.2Therelationshipbetweentheoriginalfile’slengthandthecompressionratio2)匹配距離匹配距離是匹配字符串與被壓縮字符串之間的距離。匹配距離的最小值是1字節(jié),最大值是窗口長度。圖3和圖4分別是Deflate32文件和LZSS文件的匹配距離的概率密度圖,其中橫坐標是匹配距離(單位為字節(jié)),縱坐標是概率密度。Deflate32算法和LZSS算法的窗口長度分別為32KB和4KB。實驗中選擇了100個長度在100KB到5MB之間的英文文本,分布用Deflate32算法和LZSS算法對它們進行壓縮,并隨機選擇了50000個匹配距離進行統(tǒng)計。圖3Deflate32文件的匹配距離的概率密度圖Fig.3TheprobabilitydensityofmatchdistanceinDeflate32file從兩幅圖可以看出,當匹配距離小于100字節(jié)時,隨著匹配距離的增大匹配距離的概率密度會減校當匹配距離大于100字節(jié)時,隨著匹配距離增大,匹配距離的概率密度趨于平穩(wěn)。不同窗口長度的匹配距離服從均勻分布,因此對匹配距離的二次熵編碼的壓縮效果是不明顯的。匹配距離的概率密度函數(shù)接近于均勻分布這一事實反應(yīng)了英文文本中的統(tǒng)計特性基本是平穩(wěn)的。當英文單詞之間的間隔足夠大(兩個單詞之間相隔5~6個單詞)時,英文單詞之間的相關(guān)性與單詞之間的距離是無關(guān)的。這一實驗事實也說明:通過調(diào)整字典窗口長度是無法有效提高壓縮率的,這也驗證了字典長度為64KB的Deflate壓縮編碼方法的性能與字典長度為32KB的Deflate壓縮編碼方法的性能相比差別不大。圖4LZSS文件的匹配距離的概率密度圖Fig.4TheprobabilitydensityofmatchdistanceinLZSSfile3)匹配長度匹配長度是指字典碼中匹配字符串的長度。圖5和圖6分別是Deflate32算法和LZSS算法的匹配長度的概率密度圖,其中橫坐標是匹配長度,縱坐標是概率密度。Defl
【相似文獻】
相關(guān)期刊論文 前10條
1 杜冰;朱張勤;葉中付;;一種二維光纖光譜數(shù)據(jù)的無損壓縮方法[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2010年02期
2 魏琳;馬大瑋;余訓(xùn)鋒;;一種基于感興趣區(qū)域的圖像近無損壓縮方法[J];中國科技信息;2006年24期
3 楊成禹;何昕;魏仲慧;隋玉萍;朱運東;;實時數(shù)字圖像無損壓縮的研究[J];光學(xué)技術(shù);2008年05期
4 羅堅;姜勇強;戴彩悌;;降水格點數(shù)據(jù)的無損壓縮方法[J];氣象與環(huán)境學(xué)報;2013年03期
5 唐艷娜;孫桂萍;孫華麗;徐俊;;基于預(yù)測的無損視頻壓縮技術(shù)[J];科技信息(學(xué)術(shù)研究);2008年18期
6 朱振宇,林侃,王建宇;成像光譜圖像實時無損壓縮方法研究[J];紅外與毫米波學(xué)報;1998年01期
7 劉雄恩;黃曉陽;;一種離散色調(diào)圖像無損壓縮方法[J];廈門大學(xué)學(xué)報(自然科學(xué)版);2014年01期
8 譚繼強;張立強;;一種DEM數(shù)據(jù)無損壓縮的方法[J];地理信息世界;2010年02期
9 馮燕,何明一,魏江;基于神經(jīng)網(wǎng)絡(luò)的多光譜遙感圖像無損壓縮[J];遙感技術(shù)與應(yīng)用;2004年01期
10 李進;金龍旭;李國寧;韓雙麗;張然峰;;星上大視場TDICCD相機的多光譜圖像無損壓縮系統(tǒng)[J];發(fā)光學(xué)報;2013年04期
相關(guān)博士學(xué)位論文 前1條
1 武曉玥;圖像無損壓縮及去噪技術(shù)研究[D];西安電子科技大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 任改玲;基于預(yù)測的高光譜及極光光譜圖像無損壓縮[D];西安電子科技大學(xué);2014年
2 楊雪;空間大面陣紅外探測數(shù)據(jù)無損壓縮系統(tǒng)的研究[D];中國科學(xué)院研究生院(上海技術(shù)物理研究所);2016年
3 李媛媛;陸地遙感衛(wèi)星高光譜圖像無損壓縮研究[D];長春理工大學(xué);2016年
4 張思思;基于FPGA的GZIP硬件壓縮電路設(shè)計[D];西安電子科技大學(xué);2016年
5 張習(xí)民;基于神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像無損壓縮研究[D];太原科技大學(xué);2011年
6 孫中柏;一種16位灰度圖像無損壓縮和解壓縮方法[D];電子科技大學(xué);2012年
7 馮希;幾種圖像無損壓縮與編碼方法的比較研究[D];中國科學(xué)院研究生院(西安光學(xué)精密機械研究所);2008年
8 趙國毅;面向相似數(shù)據(jù)的無損壓縮技術(shù)[D];東北大學(xué);2011年
9 殷凱;衛(wèi)星圖像無損壓縮檢糾錯編解碼技術(shù)[D];華中科技大學(xué);2012年
10 陳柯勛;基于DSP的數(shù)據(jù)實時無損壓縮技術(shù)研究[D];中北大學(xué);2010年
本文編號:2894031
本文鏈接:http://sikaile.net/kejilunwen/yysx/2894031.html