天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

高性能磁盤陣列自修復(fù)技術(shù)研究

發(fā)布時(shí)間:2021-07-07 08:43
  隨著并行計(jì)算機(jī)體系結(jié)構(gòu)和半導(dǎo)體工藝技術(shù)的發(fā)展,高性能計(jì)算機(jī)(HPC)的計(jì)算速度已經(jīng)達(dá)到千萬億次量級(jí)[1],對(duì)應(yīng)的外圍存儲(chǔ)容量達(dá)到PB量級(jí)。以當(dāng)今單磁盤容量最大為1TB計(jì)算,總?cè)萘繛镻B的外圍存儲(chǔ)系統(tǒng)中的磁盤數(shù)量將達(dá)到千個(gè)的量級(jí)。磁盤是機(jī)電磁一體的設(shè)備,廠家標(biāo)稱的平均無故障工作時(shí)間一般在十萬小時(shí)左右,但實(shí)際使用過程中故障率較高,可靠性遠(yuǎn)低于CPU、主存等純電子部件。因此,對(duì)于高性能計(jì)算機(jī)系統(tǒng),磁盤存儲(chǔ)系統(tǒng)的可靠性在很大程度上決定了整個(gè)系統(tǒng)的可靠性。當(dāng)前存儲(chǔ)系統(tǒng)通過RAID技術(shù)提高性能和可靠性。但是目前通用的RAID系統(tǒng)單盤故障時(shí),系統(tǒng)將進(jìn)行數(shù)據(jù)重構(gòu),這使讀數(shù)據(jù)的時(shí)間增加,同時(shí)限制了寫操作。若兩個(gè)或者兩個(gè)以上的磁盤同時(shí)故障,則可能導(dǎo)致數(shù)據(jù)損壞,無法恢復(fù),對(duì)核心數(shù)據(jù)這將是災(zāi)難性的損壞。根據(jù)在美國(guó)加州大學(xué)進(jìn)行的伯克利Tertiary Disk系統(tǒng)項(xiàng)目的統(tǒng)計(jì),部件在故障之前的很長(zhǎng)一段時(shí)間就會(huì)有不正常的情況出現(xiàn),磁盤故障也是一個(gè)漸變的過程。本課題分析了磁盤可靠性工作狀態(tài)的漸變過程,研究了可監(jiān)測(cè)的磁盤工作參數(shù)對(duì)磁盤可能發(fā)生故障的預(yù)警方法和提前替換工作狀態(tài)不正常的磁盤的方法,以及對(duì)被預(yù)警故障磁盤實(shí)現(xiàn)對(duì)... 

【文章來源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:82 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

高性能磁盤陣列自修復(fù)技術(shù)研究


磁盤差錯(cuò)引起系統(tǒng)故障本章在分析影響存儲(chǔ)系統(tǒng)整體可靠性各重要因素的基礎(chǔ)上,結(jié)合可靠性理論

磁盤陣列


統(tǒng)容量、可靠性和速率對(duì)于三個(gè)基本功能部件的要求很多時(shí)候到一個(gè)平衡。當(dāng)前存儲(chǔ)系統(tǒng)設(shè)計(jì)中,系統(tǒng)容量可以通過增加磁速率可以通過多磁盤并行,并采用高性能接口技術(shù)實(shí)現(xiàn)。只有磁盤固有的低可靠性的限制,很難有質(zhì)的飛躍。磁盤存儲(chǔ)系統(tǒng)故障分布個(gè) GB 級(jí)帶寬和數(shù)十 TB 級(jí)存儲(chǔ)容量的存儲(chǔ)系統(tǒng)的典型構(gòu)成為內(nèi)存、磁盤控制器、風(fēng)扇、磁盤存儲(chǔ)介質(zhì)和電源等。基本結(jié)構(gòu)

分布圖,軟件故障,硬件,分布圖


差錯(cuò):由于磁盤內(nèi)部部件或讀寫過程出現(xiàn)差錯(cuò);系統(tǒng)差錯(cuò):在系統(tǒng)中表現(xiàn)為磁盤丟失,一般源于系統(tǒng)連接器件差錯(cuò):指系統(tǒng)中出現(xiàn)的局部性差錯(cuò),表現(xiàn)為系統(tǒng)不能正常工一般起源于協(xié)議差錯(cuò),錯(cuò)誤的原因是硬盤驅(qū)動(dòng)器和控制器協(xié)的 Bug。,任意一個(gè)或者幾個(gè)低層次的事件可能導(dǎo)致上一級(jí)事件發(fā)生,的引起存儲(chǔ)系統(tǒng)故障的錯(cuò)誤類型。靠性理論中故障的層次定義,錯(cuò)誤、差錯(cuò)和故障三者的關(guān)系如錯(cuò)誤引起一個(gè)或多個(gè)隱藏差錯(cuò)。在服務(wù)啟動(dòng)時(shí)啟動(dòng),一直在有效和隱藏兩個(gè)狀態(tài)之間循環(huán)同它差錯(cuò)。錯(cuò)造成系統(tǒng)提供服務(wù)與期望不符時(shí),產(chǎn)生組件故障。 Kanevsky通過對(duì)大約 39,000 個(gè)分布式商用存儲(chǔ)系統(tǒng),約 1,000 個(gè)存放磁盤的機(jī)柜長(zhǎng)達(dá) 44 個(gè)月的調(diào)查統(tǒng)計(jì),將具體的試后,硬件故障失效和軟件故障失效的分布如圖 2.4 所示[12]:

【參考文獻(xiàn)】:
期刊論文
[1]一種基于S.M.A.R.T的保障RAID數(shù)據(jù)高可靠性的方法[J]. 劉景寧,饒國(guó)林,馮丹.  計(jì)算機(jī)工程與科學(xué). 2007(05)
[2]磁盤陣列RAID可靠性分析[J]. 陳華英.  電子科技大學(xué)學(xué)報(bào). 2006(03)
[3]基于雙容錯(cuò)編碼的DP-RAID數(shù)據(jù)布局研究[J]. 劉衛(wèi)平,蔡皖東,任建奇.  西北工業(yè)大學(xué)學(xué)報(bào). 2006(02)



本文編號(hào):3269320

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3269320.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶455f5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com