RAID-6存儲(chǔ)系統(tǒng)中故障修復(fù)問題研究
發(fā)布時(shí)間:2018-10-10 18:29
【摘要】:現(xiàn)代社會(huì)對信息技術(shù)的高度依賴,導(dǎo)致人們對數(shù)據(jù)存儲(chǔ)的可靠性和可用性需求不斷提高。然而,隨著存儲(chǔ)系統(tǒng)規(guī)模的不斷擴(kuò)大,以及廉價(jià)存儲(chǔ)設(shè)備的廣泛采用,導(dǎo)致當(dāng)前存儲(chǔ)系統(tǒng)中發(fā)生故障的概率不斷提高。存儲(chǔ)系統(tǒng)中通常采用容錯(cuò)技術(shù)來保證數(shù)據(jù)的可靠存儲(chǔ),一旦發(fā)生磁盤(或其他存儲(chǔ)設(shè)備)故障,系統(tǒng)可以根據(jù)采用的容錯(cuò)技術(shù),從存活磁盤讀取一定量數(shù)據(jù),重構(gòu)出故障盤中的丟失數(shù)據(jù)。由于故障修復(fù)過程中從存活磁盤讀取的數(shù)據(jù)量直接影響著系統(tǒng)的可靠性以及用戶請求的服務(wù)性能。因此,如何進(jìn)行有效的數(shù)據(jù)修復(fù),最小化修復(fù)過程中所消耗的系統(tǒng)資源是存儲(chǔ)系統(tǒng)中容錯(cuò)修復(fù)的關(guān)鍵性問題。本文主要研究了在基于RAID-6編碼的存儲(chǔ)系統(tǒng)中,發(fā)生磁盤故障時(shí)的數(shù)據(jù)修復(fù)問題,主要研究內(nèi)容與貢獻(xiàn)如下: (1)基于RDP碼的單盤故障修復(fù)算法。 RDP碼是存儲(chǔ)系統(tǒng)中最常采用的RAID-6編碼之一,它通過在系統(tǒng)中添加兩個(gè)磁盤的冗余數(shù)據(jù)來保證任意兩個(gè)磁盤同時(shí)故障時(shí),數(shù)據(jù)不會(huì)丟失。本文研究了基于RDP碼的單盤故障修復(fù)問題,分析了任意單個(gè)磁盤的故障修復(fù)過程中,從存活磁盤讀取的數(shù)據(jù)量的理論下界,同時(shí)設(shè)計(jì)了一種混合修復(fù)算法RDOR-RDP (Row Diagonal Optimal Recovery-RDP),該算法綜合利用RDP碼的兩類校驗(yàn),行校驗(yàn)和對角線校驗(yàn),共同修復(fù)單個(gè)故障盤中的數(shù)據(jù),實(shí)現(xiàn)了修復(fù)過程中的數(shù)據(jù)讀取量達(dá)到理論下界。此外,RDOR-RDP從系統(tǒng)中各存活磁盤讀取等量的數(shù)據(jù)用于故障恢復(fù),從而保證了修復(fù)過程中各存活磁盤的負(fù)載均衡。理論分析表明,RDOR-RDP在修復(fù)過程中的數(shù)據(jù)讀取量與傳統(tǒng)單盤修復(fù)算法相比減少了將近25%。模擬實(shí)驗(yàn)結(jié)果表明,與RDP碼的傳統(tǒng)單盤修復(fù)算法相比,RDOR-RDP的平均磁盤訪問時(shí)間減少了15.16%~22.60%,總修復(fù)時(shí)間減少了5.72%~12.60%。 (2)基于EVENODD碼的單盤故障修復(fù)算法。 EVENODD碼是另一種常用的RAID-6編碼策略,結(jié)合EVENODD碼的編碼特性,本文將RDP碼單盤故障的混合修復(fù)思想應(yīng)用于EVENODD碼的單盤故障修復(fù)過程中。本文證明了在基于EVENODD碼的存儲(chǔ)系統(tǒng)中,任意單個(gè)磁盤故障時(shí),數(shù)據(jù)讀取量的理論下界。此外,為了保證修復(fù)過程中各存活磁盤的負(fù)載均衡,本文給出了從各存活磁盤讀取等量數(shù)據(jù)進(jìn)行修復(fù)的充分條件。結(jié)合數(shù)據(jù)讀取量的理論下界和負(fù)載均衡的充分條件,本文為EVENODD編碼設(shè)計(jì)了單盤修復(fù)算法RDOR-EVENODD (Row Diagonal Optimal Recovery-EVENODD),該算法實(shí)現(xiàn)了故障修復(fù)過程中的數(shù)據(jù)讀取量達(dá)到理論下界,同時(shí)保證了各存活磁盤在故障修復(fù)過程中的負(fù)載均衡。與EVENODD碼的傳統(tǒng)單盤修復(fù)算法相比,RDOR-EVENODD同樣減少了近25%的數(shù)據(jù)讀取量。模擬實(shí)驗(yàn)結(jié)果表明,RDOR-EVENODD在總恢復(fù)時(shí)間以及平均磁盤訪問時(shí)間方面均優(yōu)于傳統(tǒng)單盤修復(fù)算法。 (3)基于RAID-6碼的扇區(qū)故障修復(fù)算法。 在RAID-6存儲(chǔ)系統(tǒng)中,除了整盤故障之外,還存在其他的故障模式,例如磁盤部分扇區(qū)發(fā)生故障(也即磁盤中部分?jǐn)?shù)據(jù)塊發(fā)生丟失),磁盤和扇區(qū)同時(shí)發(fā)生故障等,這些故障模式同樣影響著整個(gè)系統(tǒng)的可靠性。本文研究了在基于RAID-6碼的存儲(chǔ)系統(tǒng)中,任意故障模式下的數(shù)據(jù)修復(fù)問題。針對任意的RAID-6編碼和任意的故障模式(單磁盤故障、多磁盤故障、磁盤扇區(qū)故障等),本文設(shè)計(jì)了一種用于描述故障模式的二分圖模型�;谠摱謭D模型,本文給出了丟失數(shù)據(jù)塊理論上可修復(fù)的充分必要條件�;谏鲜龀浞直匾獥l件,本文設(shè)計(jì)了兩種通用的修復(fù)算法,GSR (Graph Shrink Recovery)和IGSR (Improved Graph Shrink Recovery)。與現(xiàn)有的修復(fù)策略相比,GSR和IGSR可以修復(fù)任意故障模式下所有理論上可恢復(fù)的數(shù)據(jù)塊,同時(shí)減少了修復(fù)過程中的計(jì)算開銷。
[Abstract]:......
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2013
【分類號】:TP333
[Abstract]:......
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2013
【分類號】:TP333
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 楊向東;數(shù)據(jù)存儲(chǔ)——金融電子化的基石[J];中國金融電腦;2002年03期
相關(guān)博士學(xué)位論文 前1條
1 胡q,
本文編號:2262801
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2262801.html
最近更新
教材專著