在線重復(fù)數(shù)據(jù)刪除技術(shù)的研究與實現(xiàn)
發(fā)布時間:2020-04-26 10:20
【摘要】:隨著信息化建設(shè)的不斷深入,企業(yè)數(shù)據(jù)信息量呈幾何級數(shù)增長。信息量的不斷擴張帶來以下兩個問題:一是存在著大量的重復(fù)數(shù)據(jù),導(dǎo)致存儲空間的大量浪費,企業(yè)的存儲成本提高;二是高訪問量使得磁盤存儲設(shè)備逐漸成為數(shù)據(jù)中心的訪問性能瓶。針對上述問題,通過對重復(fù)數(shù)據(jù)刪除技術(shù)的研究,以及對固態(tài)硬盤性能和特性的調(diào)研,提出了一種基于iSCSI平臺的分級存儲技術(shù)與重復(fù)數(shù)據(jù)刪除技術(shù)相結(jié)合的存儲系統(tǒng)。 首先,深入研究了重復(fù)數(shù)據(jù)刪除技術(shù),采用了基于散列的重復(fù)數(shù)據(jù)刪除方式,實現(xiàn)了以下基本功能:指紋計算、指紋檢索、指紋索引表管理;為了彌補重復(fù)數(shù)據(jù)刪除對系統(tǒng)帶來的性能損失,提出了“內(nèi)存—固態(tài)盤—磁盤”分級存儲系統(tǒng),用固態(tài)盤充當二級緩存,利用其讀寫性能好、容量大、非易失性等特點,提高系統(tǒng)整體性能;通過虛擬空間映射功能,將服務(wù)器物理磁盤虛擬為一個較大的虛擬盤,然后按分區(qū)映射給多個客戶端,實現(xiàn)單服務(wù)器---多客戶端功能。 然后針對重復(fù)數(shù)據(jù)刪除功能中指紋檢索性能瓶頸,進行了專門的算法優(yōu)化。首先提出了基于布隆過濾的檢索過濾算法,過濾掉大量不必要的指紋檢索請求;然后實現(xiàn)了指紋索引表“內(nèi)存—固態(tài)盤”分級存儲策略,充分利用固態(tài)盤較好的讀性能,避免索引表存儲到磁盤,產(chǎn)生磁盤訪問性能瓶頸。 最后,對分級重復(fù)數(shù)據(jù)刪除系統(tǒng)進行了相關(guān)測試。首先對系統(tǒng)進行了性能對比測試,結(jié)果表明,重復(fù)數(shù)據(jù)刪除功能由于計算量較大,會帶來一定的性能損失,但與分級存儲技術(shù)相結(jié)合之后,整體性能反而有一定的提升;然后對重復(fù)數(shù)據(jù)刪除的壓縮比進行了測試,結(jié)果表明,重復(fù)數(shù)據(jù)刪除技術(shù)對于信息重復(fù)度較高的應(yīng)用環(huán)境,如文檔應(yīng)用,具有較好的壓縮效果;最后對指紋檢索過濾算法進行了測試,其過濾率和誤判率都達到了預(yù)期效果。
【圖文】:
紹了 iSCSI 存儲平臺,然后介紹了基于 iSCSI 平臺撲結(jié)構(gòu),最后講述了系統(tǒng)中所用到的關(guān)鍵技術(shù),存儲技術(shù)。臺介紹nternet SCSI, 是一種應(yīng)用較為廣泛的存儲協(xié)議[11]。CSI)和 IP 網(wǎng)絡(luò)的特點,使得存儲服務(wù)器可以通存儲設(shè)備相比,其性價比更高。SI 七層協(xié)議中屬于端到端的會話層協(xié)議,InitiatorSI 協(xié)議數(shù)據(jù)單元[11],經(jīng)由 TCP 層,IP 層,鏈路層arget 端。然后 Target 端再通過解包操作還原 SCS備。iSCSI 協(xié)議整合了 SCSI 和 TCP/IP 協(xié)議棧,實協(xié)議棧如圖 2.1 所示:
包裝和解析仍然由軟件來完。硬件方式是以 iSCSI HBA 卡的形式,HBA 卡實現(xiàn)了協(xié)議,不需要主機再來完成任何事情。三種方式可以看出,純軟件方式由于不需要任何專用硬會占用主機的 CPU 等資源,所以性能最差;半軟件方式占用主機網(wǎng)絡(luò)帶寬,性能稍好,但成本稍高;純硬件方成所有的 iSCSI 相關(guān)操作,性能最好,,但硬件成本最高用第一種以太網(wǎng)卡+軟件方式來實現(xiàn),成本最低,也最為用 Linux 操作系統(tǒng)平臺,同時采用了開源的 iSCSI Ente數(shù)據(jù)刪除的功能就在此開源 iSCSI Target 軟件平臺上實現(xiàn)臺,也可采用 Windows 平臺,都有相應(yīng)的 iSCSI Initiato圖 2.2 所示:
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP333
本文編號:2641395
【圖文】:
紹了 iSCSI 存儲平臺,然后介紹了基于 iSCSI 平臺撲結(jié)構(gòu),最后講述了系統(tǒng)中所用到的關(guān)鍵技術(shù),存儲技術(shù)。臺介紹nternet SCSI, 是一種應(yīng)用較為廣泛的存儲協(xié)議[11]。CSI)和 IP 網(wǎng)絡(luò)的特點,使得存儲服務(wù)器可以通存儲設(shè)備相比,其性價比更高。SI 七層協(xié)議中屬于端到端的會話層協(xié)議,InitiatorSI 協(xié)議數(shù)據(jù)單元[11],經(jīng)由 TCP 層,IP 層,鏈路層arget 端。然后 Target 端再通過解包操作還原 SCS備。iSCSI 協(xié)議整合了 SCSI 和 TCP/IP 協(xié)議棧,實協(xié)議棧如圖 2.1 所示:
包裝和解析仍然由軟件來完。硬件方式是以 iSCSI HBA 卡的形式,HBA 卡實現(xiàn)了協(xié)議,不需要主機再來完成任何事情。三種方式可以看出,純軟件方式由于不需要任何專用硬會占用主機的 CPU 等資源,所以性能最差;半軟件方式占用主機網(wǎng)絡(luò)帶寬,性能稍好,但成本稍高;純硬件方成所有的 iSCSI 相關(guān)操作,性能最好,,但硬件成本最高用第一種以太網(wǎng)卡+軟件方式來實現(xiàn),成本最低,也最為用 Linux 操作系統(tǒng)平臺,同時采用了開源的 iSCSI Ente數(shù)據(jù)刪除的功能就在此開源 iSCSI Target 軟件平臺上實現(xiàn)臺,也可采用 Windows 平臺,都有相應(yīng)的 iSCSI Initiato圖 2.2 所示:
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP333
【參考文獻】
相關(guān)期刊論文 前1條
1 韓茜,羅豐,吳順君;高速大容量固態(tài)存儲系統(tǒng)的設(shè)計[J];雷達科學(xué)與技術(shù);2005年02期
本文編號:2641395
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2641395.html
最近更新
教材專著