云存儲中一種基于文件相似度的抽樣重刪索引算法
發(fā)布時間:2018-05-23 21:33
本文選題:云存儲 + 重復(fù)數(shù)據(jù)刪除; 參考:《小型微型計算機系統(tǒng)》2015年10期
【摘要】:索引性能瓶頸制約著云存儲下重復(fù)數(shù)據(jù)刪除技術(shù)的發(fā)展和應(yīng)用.通過分析影響索引性能的關(guān)鍵因素,提出一種基于抽樣和相似度的重復(fù)數(shù)據(jù)刪除索引算法.該方法利用基于文件級別的抽樣,抽取每個文件部分指紋組成索引.通過減少指紋索引比對的范圍和次數(shù),提高索引檢索的效率.當(dāng)新寫入文件的相似度達到臨界值時,系統(tǒng)進行深度刪冗,從而增加整體的重刪率.
[Abstract]:The bottleneck of index performance restricts the development and application of repeated data deletion under cloud storage. Based on the analysis of the key factors affecting the performance of the index, an index deletion algorithm for repetitive data based on sampling and similarity is proposed. The method uses file level sampling to extract some fingerprints of each file to form an index. The efficiency of index retrieval is improved by reducing the range and times of fingerprint index alignment. When the similarity of the newly written files reaches the critical value, the system deletes deeply, thus increasing the overall redelete rate.
【作者單位】: 湖南大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金項目(61272062)資助 湖南省自然科學(xué)基金項目(2015JJ2035)資助 中央高;究蒲袠I(yè)務(wù)費資助
【分類號】:TP333
【相似文獻】
相關(guān)期刊論文 前10條
1 陳雍;謝旭升;魏根芽;;Oracle B*樹索引內(nèi)部機制及其應(yīng)用的研究[J];計算機與現(xiàn)代化;2008年10期
2 高玉良;張濟強;白瑤;;基于Lucene的多索引搜索的研究與應(yīng)用[J];電腦知識與技術(shù);2012年07期
3 陳仲肅;;淺談索引失效原因、對策及其應(yīng)用[J];軟件;2012年07期
4 周英華;金培權(quán);岳麗華;龔育昌;;基于位置的web搜索索引研究[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2007年02期
5 趙娟娟;;嵌入數(shù)據(jù)庫索引機制及特點研究[J];硅谷;2011年02期
6 耿慶田;狄婧;常亮;趙宏偉;;基于B+樹的數(shù)據(jù)索引存儲[J];吉林大學(xué)學(xué)報(理學(xué)版);2013年06期
7 張,
本文編號:1926453
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1926453.html
最近更新
教材專著