基于糾刪碼的容錯(cuò)存儲(chǔ)系統(tǒng)中數(shù)據(jù)布局優(yōu)化
發(fā)布時(shí)間:2021-07-14 02:14
大規(guī)模存儲(chǔ)系統(tǒng)出錯(cuò)成為常態(tài),糾刪碼技術(shù)廣泛應(yīng)用于存儲(chǔ)系統(tǒng)中,以提供低存儲(chǔ)開銷的容錯(cuò)能力。然而,糾刪碼在存儲(chǔ)系統(tǒng)中的數(shù)據(jù)布局,即塊與存儲(chǔ)設(shè)備之間的映射,與容錯(cuò)存儲(chǔ)系統(tǒng)的可擴(kuò)展性、可靠性、修復(fù)性能等指標(biāo)有著緊密的關(guān)聯(lián)。本文從數(shù)據(jù)布局的角度出發(fā),在擴(kuò)容(塊的重新映射)算法設(shè)計(jì)、提高系統(tǒng)可靠性方案、高效故障修復(fù)策略三個(gè)方面展開研究。主要的研究?jī)?nèi)容與貢獻(xiàn)如下:·提出基于部署Parity Declustering數(shù)據(jù)布局的磁盤陣列存儲(chǔ)系統(tǒng)的高效擴(kuò)容方案PDS(Parity Declustering Scaling)。PDS利用平衡不完全區(qū)組設(shè)計(jì)(Balanced Incomplete Block Design)定義數(shù)據(jù)遷移,實(shí)現(xiàn)了擴(kuò)容所需數(shù)據(jù)遷移量最小,擴(kuò)容后仍保持Parity Declustering數(shù)據(jù)布局,以及數(shù)據(jù)塊與校驗(yàn)塊的均勻分布。實(shí)驗(yàn)結(jié)果表明,PDS可有效縮短擴(kuò)容時(shí)間和擴(kuò)容過程中用戶響應(yīng)時(shí)間!ぬ岢龌赑DS數(shù)據(jù)遷移的提高磁盤陣列容錯(cuò)能力方案,以支持PDS擴(kuò)容方案提高系統(tǒng)可靠性。PDS通過在條帶中添加校驗(yàn)塊來提高容錯(cuò)能力,并利用平衡不完全區(qū)組設(shè)計(jì)定義新加塊在磁盤陣列中的放置,實(shí)現(xiàn)了提高...
【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:102 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1全球每年數(shù)據(jù)增量(2018年后為預(yù)測(cè)值)lsl??
系統(tǒng)的設(shè)計(jì)和管理趨于復(fù)雜,從而導(dǎo)致部件出錯(cuò)(如磁盤故障、網(wǎng)絡(luò)連接失效和??軟件崩潰)成為常態(tài)。例如,8311^111〇〇1111)^等[17]研宄了?Facebook公司中一個(gè)具??有3?000個(gè)節(jié)點(diǎn)的集群在一個(gè)月期間的節(jié)點(diǎn)失效事件(如圖1.2所示),發(fā)現(xiàn)節(jié)點(diǎn)??失效每天都在發(fā)生,并且一天最多有近110個(gè)節(jié)點(diǎn)發(fā)生故障。??存儲(chǔ)系統(tǒng)出錯(cuò)將造成巨大的經(jīng)濟(jì)損失以及社會(huì)負(fù)面效應(yīng)。例如,2017年2月??28日,AWS的S3云存儲(chǔ)服務(wù)因操作失誤宕機(jī)四小時(shí)[18],導(dǎo)致GitHub、Adobe、??Quora等無法正常提供服務(wù)造成的損失達(dá)1.5億美元根據(jù)EMC公司的??報(bào)告[21]和丨22],在2018年,全球有41%的組織遭受過計(jì)劃外系統(tǒng)宕機(jī),平均??每次宕機(jī)持續(xù)20小時(shí)造成52.6萬美元的損失,28%的組織遭受過數(shù)據(jù)丟失,平??均每次丟失2.13?TB數(shù)據(jù)造成99.5萬美元的損失。而2018年我國(guó)29%的組織經(jīng)??歷過宕機(jī),平均代價(jià)86.3萬美元,26%的組織經(jīng)歷過數(shù)據(jù)丟失,平均代價(jià)126.9??2??
相同的&份數(shù)據(jù),將份數(shù)據(jù)通過特定規(guī)則的運(yùn)算生成份冗將這k?w份數(shù)據(jù)存儲(chǔ)在不同的設(shè)備上。這+?m份數(shù)據(jù)中的都可以從任何其他A份數(shù)據(jù)運(yùn)算得出。由此可見,糾刪碼的存儲(chǔ)fc?+?m)/k〇??海量數(shù)據(jù)存儲(chǔ)的背景下,大規(guī)模系統(tǒng)的存儲(chǔ)成本受到越來越多多副本技術(shù),糾刪碼可以在保證相同可靠性的前提下有效地降低此糾刪碼技術(shù)被廣泛地應(yīng)用于各大存儲(chǔ)系統(tǒng)以及數(shù)據(jù)中心(例如丨15]、Facebook?的?f4[28】)。??糾刪碼容錯(cuò)存儲(chǔ)技術(shù)??.4.1糾刪碼的基本概念??便于理解全文,本小節(jié)將介紹糾刪碼的一些常用概念。圖1.3給出的示意圖,以便解釋說明;诖耸纠,下面將介紹糾刪碼是如何的,它是如何工作的,以及本文后續(xù)用到的一些概念。??C?=?A?B??
本文編號(hào):3283198
【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:102 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1全球每年數(shù)據(jù)增量(2018年后為預(yù)測(cè)值)lsl??
系統(tǒng)的設(shè)計(jì)和管理趨于復(fù)雜,從而導(dǎo)致部件出錯(cuò)(如磁盤故障、網(wǎng)絡(luò)連接失效和??軟件崩潰)成為常態(tài)。例如,8311^111〇〇1111)^等[17]研宄了?Facebook公司中一個(gè)具??有3?000個(gè)節(jié)點(diǎn)的集群在一個(gè)月期間的節(jié)點(diǎn)失效事件(如圖1.2所示),發(fā)現(xiàn)節(jié)點(diǎn)??失效每天都在發(fā)生,并且一天最多有近110個(gè)節(jié)點(diǎn)發(fā)生故障。??存儲(chǔ)系統(tǒng)出錯(cuò)將造成巨大的經(jīng)濟(jì)損失以及社會(huì)負(fù)面效應(yīng)。例如,2017年2月??28日,AWS的S3云存儲(chǔ)服務(wù)因操作失誤宕機(jī)四小時(shí)[18],導(dǎo)致GitHub、Adobe、??Quora等無法正常提供服務(wù)造成的損失達(dá)1.5億美元根據(jù)EMC公司的??報(bào)告[21]和丨22],在2018年,全球有41%的組織遭受過計(jì)劃外系統(tǒng)宕機(jī),平均??每次宕機(jī)持續(xù)20小時(shí)造成52.6萬美元的損失,28%的組織遭受過數(shù)據(jù)丟失,平??均每次丟失2.13?TB數(shù)據(jù)造成99.5萬美元的損失。而2018年我國(guó)29%的組織經(jīng)??歷過宕機(jī),平均代價(jià)86.3萬美元,26%的組織經(jīng)歷過數(shù)據(jù)丟失,平均代價(jià)126.9??2??
相同的&份數(shù)據(jù),將份數(shù)據(jù)通過特定規(guī)則的運(yùn)算生成份冗將這k?w份數(shù)據(jù)存儲(chǔ)在不同的設(shè)備上。這+?m份數(shù)據(jù)中的都可以從任何其他A份數(shù)據(jù)運(yùn)算得出。由此可見,糾刪碼的存儲(chǔ)fc?+?m)/k〇??海量數(shù)據(jù)存儲(chǔ)的背景下,大規(guī)模系統(tǒng)的存儲(chǔ)成本受到越來越多多副本技術(shù),糾刪碼可以在保證相同可靠性的前提下有效地降低此糾刪碼技術(shù)被廣泛地應(yīng)用于各大存儲(chǔ)系統(tǒng)以及數(shù)據(jù)中心(例如丨15]、Facebook?的?f4[28】)。??糾刪碼容錯(cuò)存儲(chǔ)技術(shù)??.4.1糾刪碼的基本概念??便于理解全文,本小節(jié)將介紹糾刪碼的一些常用概念。圖1.3給出的示意圖,以便解釋說明;诖耸纠,下面將介紹糾刪碼是如何的,它是如何工作的,以及本文后續(xù)用到的一些概念。??C?=?A?B??
本文編號(hào):3283198
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3283198.html
最近更新
教材專著