分布式存儲系統(tǒng)文件級連續(xù)數(shù)據(jù)保護技術研究
發(fā)布時間:2020-04-08 04:12
【摘要】:隨著信息時代數(shù)據(jù)規(guī)模的急劇增長和數(shù)據(jù)價值的不斷提升,存儲系統(tǒng)必須具有良好的可擴展性并采取有效的措施來保障用戶數(shù)據(jù)的可靠性、安全性和存取的高性能。為了適應信息時代海量數(shù)據(jù)對存儲系統(tǒng)各方面性能的需求,分布式存儲系統(tǒng)成為了研究熱點,它滿足了海量數(shù)據(jù)對系統(tǒng)可擴展性的要求,同時又能利用體系結(jié)構(gòu)優(yōu)勢增加系統(tǒng)的可靠性和性能。而另一方面由于計算機病毒、黑客攻擊以及人為誤操作等造成的數(shù)據(jù)失效,以及一些對數(shù)據(jù)歷史要求嚴格,或?qū)浞荽翱诿舾械膽?則需要存儲系統(tǒng)盡可能減少數(shù)據(jù)恢復點時間間隔(RPO)。傳統(tǒng)的數(shù)據(jù)備份技術已經(jīng)不能很好的適應這些新出現(xiàn)的需求。連續(xù)數(shù)據(jù)保護技術(CDP)可以解決這樣的問題,通過將數(shù)據(jù)保護擴展到實時,RPO縮小到了每次數(shù)據(jù)改寫,連續(xù)數(shù)據(jù)保護技術能為關鍵應用提供充分技術支撐。面向分布式存儲系統(tǒng)的連續(xù)數(shù)據(jù)保護技術將為存儲系統(tǒng)提供連續(xù)時間上的數(shù)據(jù)保護,同時存儲系統(tǒng)分布式體系結(jié)構(gòu)的并行性又能優(yōu)化連續(xù)數(shù)據(jù)保護帶來的性能和容量開銷,其可擴展性又可以解決備份數(shù)據(jù)不斷增長的問題。融合了連續(xù)數(shù)據(jù)保護元數(shù)據(jù)管理的分布式文件系統(tǒng)將為分布式存儲系統(tǒng)提供文件級的連續(xù)數(shù)據(jù)保護功能。 在研究現(xiàn)有連續(xù)數(shù)據(jù)保護機制的基礎上,面向分布式存儲環(huán)境設計了一種的將分布式文件系統(tǒng)元數(shù)據(jù)管理機制以及連續(xù)數(shù)據(jù)保護元數(shù)據(jù)管理機制結(jié)合起來的文件系統(tǒng)。擴展了傳統(tǒng)的元數(shù)據(jù)組織結(jié)構(gòu),由一維增加時間維度變?yōu)槎S,從而很好的實現(xiàn)了連續(xù)數(shù)據(jù)保護元數(shù)據(jù)管理的融合,并且針對連續(xù)數(shù)據(jù)保護應用優(yōu)化了元數(shù)據(jù)管理策略,使得在數(shù)據(jù)保護與數(shù)據(jù)恢復時的時間開銷得以降低。同時得益于文件系統(tǒng)級的實現(xiàn)方式,通過歷史元數(shù)據(jù)的運用使得文件的歷史視圖的實現(xiàn)變得簡單,系統(tǒng)可以在極低開銷的情況下提供指定文件任意時間點歷史的查看。 為了進一步減小應用連續(xù)數(shù)據(jù)保護功能而帶來的時間開銷,研究了在分布式環(huán)境下充分利用系統(tǒng)架構(gòu)進行優(yōu)化的方法。通過設計合適的數(shù)據(jù)分條分配及管理策略,可以在數(shù)據(jù)操作過程中充分利用分布式系統(tǒng)的并行度。通過設計針對連續(xù)數(shù)據(jù)保護的讀預取及寫合并等方法,使得在數(shù)據(jù)傳輸、備份、恢復時能充分利用分布式系統(tǒng)的并行度,進一步減少應用連續(xù)數(shù)據(jù)保護所帶來的性能開銷。 針對文件內(nèi)數(shù)據(jù)移動這種造成連續(xù)數(shù)據(jù)保護效率極大下降的情況,研究并擴展了標準的POSIX文件系統(tǒng)接口,提出了插入寫及刪除寫語義。新的應用程序利用這兩個語義可以直接提高連續(xù)數(shù)據(jù)保護的效率。對于傳統(tǒng)應用程序,研究并設計了客戶端針對數(shù)據(jù)改寫行為的各種偵測方法,在用戶程序透明的情況對插入寫及刪除寫操作進行識別并提取插入數(shù)據(jù)、刪除數(shù)據(jù)的詳細信息,為元數(shù)據(jù)服務器進一步處理做準備。 為了進一步減少備份數(shù)據(jù)量,研究了基于數(shù)據(jù)內(nèi)容比較的方法,以消除重復數(shù)據(jù)備份以及精確的獲取每次數(shù)據(jù)改變的字節(jié)級信息來實現(xiàn)差異數(shù)據(jù)備份。得益于基于對象的存儲服務器實現(xiàn),將基于數(shù)據(jù)分條內(nèi)容的數(shù)據(jù)備份元數(shù)據(jù)封閉在存儲服務器內(nèi)部,做到對分布式文件系統(tǒng)元數(shù)據(jù)管理最小的影響。在不影響數(shù)據(jù)傳輸而又充分利用存儲節(jié)點計算能力的前提下,研究并優(yōu)化了差異數(shù)據(jù)備份的策略。
【學位授予單位】:華中科技大學
【學位級別】:博士
【學位授予年份】:2009
【分類號】:TP333
本文編號:2618873
【學位授予單位】:華中科技大學
【學位級別】:博士
【學位授予年份】:2009
【分類號】:TP333
【參考文獻】
相關期刊論文 前1條
1 劉煒,鄭緯民,申俊,鞠大鵬;底層通信協(xié)議中內(nèi)存映射機制的設計與實現(xiàn)[J];軟件學報;1999年01期
,本文編號:2618873
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2618873.html
最近更新
教材專著