大規(guī)模低功耗數(shù)據(jù)存儲(chǔ)系統(tǒng)的關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2022-12-10 14:33
當(dāng)今社會(huì)信息化程度日益提高,數(shù)據(jù)已經(jīng)成為我們?nèi)粘9ぷ骱蜕畹闹匾Y源。人們?cè)缫堰M(jìn)入一個(gè)數(shù)據(jù)爆炸的時(shí)代,全球數(shù)據(jù)總量正在以驚人的速度增長(zhǎng)。據(jù)統(tǒng)計(jì),2018年全球產(chǎn)生的數(shù)據(jù)總量為33ZB,而到2025年該數(shù)值預(yù)計(jì)將達(dá)到175ZB。隨著數(shù)據(jù)規(guī)模的不斷增大,海量數(shù)據(jù)的存儲(chǔ)成為迫切的需求。另一方面,海量數(shù)據(jù)存儲(chǔ)所帶來(lái)的高能耗問(wèn)題也越來(lái)越凸顯。據(jù)統(tǒng)計(jì),2017年中國(guó)數(shù)據(jù)中心總耗電量達(dá)到了 1300億千瓦時(shí),該數(shù)值遠(yuǎn)超過(guò)當(dāng)年三峽大壩全年發(fā)電總量976億千瓦時(shí)。在數(shù)據(jù)中心能源消耗中,存儲(chǔ)設(shè)備能耗所占的比例為25-35%。此外,存儲(chǔ)設(shè)備運(yùn)行過(guò)程中產(chǎn)生的熱量會(huì)加重機(jī)房制冷系統(tǒng)的負(fù)擔(dān),從而這又進(jìn)一步提高了數(shù)據(jù)中心的能源開(kāi)銷。因此,合理降低存儲(chǔ)系統(tǒng)的能源開(kāi)銷對(duì)實(shí)現(xiàn)數(shù)據(jù)中心節(jié)能環(huán)保具有十分重要的意義。在數(shù)據(jù)中心,通常只有10~15%的數(shù)據(jù)處于被頻繁訪問(wèn)的狀態(tài),而剩余部分?jǐn)?shù)據(jù)則被稱為冷數(shù)據(jù)。對(duì)于冷數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)而言,其沒(méi)有較高的計(jì)算能力需求,而傳統(tǒng)的存儲(chǔ)系統(tǒng)通常采用單一的高性能存儲(chǔ)方案,因此會(huì)產(chǎn)生硬件成本高、系統(tǒng)功耗高等問(wèn)題。特別是當(dāng)存儲(chǔ)規(guī)模逐步擴(kuò)大時(shí),硬件成本和能耗開(kāi)銷將顯著攀升。本文對(duì)大規(guī)模冷數(shù)據(jù)的高效存儲(chǔ)相關(guān)...
【文章頁(yè)數(shù)】:143 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 存儲(chǔ)系統(tǒng)發(fā)展簡(jiǎn)介
1.2.1 硬盤驅(qū)動(dòng)器
1.2.2 硬盤陣列
1.2.3 傳統(tǒng)網(wǎng)絡(luò)存儲(chǔ)
1.2.4 分布式存儲(chǔ)系統(tǒng)
1.3 存儲(chǔ)系統(tǒng)相關(guān)技術(shù)研究現(xiàn)狀
1.3.1 數(shù)據(jù)校驗(yàn)技術(shù)
1.3.2 數(shù)據(jù)容錯(cuò)技術(shù)
1.3.3 硬盤故障預(yù)測(cè)技術(shù)
1.3.4 存儲(chǔ)系統(tǒng)節(jié)能技術(shù)
1.4 論文的研究?jī)?nèi)容與創(chuàng)新點(diǎn)
1.4.1 并行CRC算法
1.4.2 基于硬件加速的Reed-Solomon編碼
1.4.3 基于LSTM的硬盤健康狀態(tài)預(yù)測(cè)方法
1.4.4 大規(guī)模低功耗存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
1.5 論文結(jié)構(gòu)
第二章 并行CRC算法
2.1 概述
2.2 CRC算法
2.2.1 算法描述
2.2.2 Sarwate算法
2.2.3 Slicing-by-4算法
2.3 多數(shù)據(jù)流并行CRC算法
2.3.1 數(shù)據(jù)折疊
2.3.2 多數(shù)據(jù)流交織的CRC并行算法
2.4 多線程并行CRC算法
2.4.1 模乘法運(yùn)算
2.4.2 系數(shù)β_p的快速計(jì)算
2.5 實(shí)驗(yàn)與算法評(píng)估
2.5.1 實(shí)驗(yàn)環(huán)境及流程
2.5.2 多數(shù)據(jù)流并行CRC算法實(shí)驗(yàn)結(jié)果
2.5.3 多線程并行CRC算法實(shí)驗(yàn)結(jié)果
2.6 本章小結(jié)
第三章 基于硬件加速的Reed-Solomon編碼
3.1 概述
3.2 Reed-Solomon編碼
3.2.1 Reed-Solomon算法的編碼策略
3.2.2 Reed-Solomon算法的編碼過(guò)程
3.2.3 Reed-Solomon編碼的恢復(fù)過(guò)程
3.2.4 有限域上的運(yùn)算
3.3 基于硬件加速的Reed-Solomon編碼
3.3.1 指令集簡(jiǎn)介
3.3.2 算法設(shè)計(jì)
3.4 實(shí)驗(yàn)與算法評(píng)估
3.4.1 實(shí)驗(yàn)環(huán)境及流程
3.4.2 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
第四章 基于LSTM的硬盤健康狀態(tài)預(yù)測(cè)方法
4.1 概述
4.2 理論背景
4.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
4.2.2 長(zhǎng)短期記憶網(wǎng)絡(luò)
4.2.3 隨機(jī)森林
4.3 基于LSTM的硬盤健康狀態(tài)預(yù)測(cè)方法
4.3.1 特征選擇
4.3.2 SMART屬性變化率特征
4.3.3 硬盤健康等級(jí)劃分
4.3.4 構(gòu)建預(yù)測(cè)模型
4.3.5 遷移學(xué)習(xí)
4.4 實(shí)驗(yàn)與模型評(píng)估
4.4.1 數(shù)據(jù)集
4.4.2 數(shù)據(jù)預(yù)處理
4.4.3 性能評(píng)估指標(biāo)
4.4.4 實(shí)驗(yàn)設(shè)置
4.4.5 實(shí)驗(yàn)結(jié)果
4.5 本章小結(jié)
第五章 大規(guī)模低功耗存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 概述
5.2 系統(tǒng)整體框架介紹
5.2.1 虛擬節(jié)點(diǎn)
5.2.2 元數(shù)據(jù)節(jié)點(diǎn)
5.2.3 傳輸節(jié)點(diǎn)
5.2.4 存儲(chǔ)節(jié)點(diǎn)
5.2.5 客戶端
5.3 名稱空間管理
5.3.1 文件元數(shù)據(jù)記錄
5.3.2 名稱空間相關(guān)操作
5.4 存儲(chǔ)空間管理
5.4.1 數(shù)據(jù)塊大小
5.4.2 硬盤組
5.4.3 可用空間列表
5.4.4 硬盤空間分配算法
5.5 系統(tǒng)性能測(cè)試
5.5.1 系統(tǒng)硬件配置
5.5.2 實(shí)驗(yàn)結(jié)果
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文主要工作總結(jié)
6.2 未來(lái)工作的展望
參考文獻(xiàn)
附錄: 縮寫(xiě)詞說(shuō)明
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文和專利目錄
【參考文獻(xiàn)】:
期刊論文
[1]如何存儲(chǔ)“冷數(shù)據(jù)”?[J]. 郭嘉凱. 軟件和信息服務(wù). 2013(10)
本文編號(hào):3716923
【文章頁(yè)數(shù)】:143 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 存儲(chǔ)系統(tǒng)發(fā)展簡(jiǎn)介
1.2.1 硬盤驅(qū)動(dòng)器
1.2.2 硬盤陣列
1.2.3 傳統(tǒng)網(wǎng)絡(luò)存儲(chǔ)
1.2.4 分布式存儲(chǔ)系統(tǒng)
1.3 存儲(chǔ)系統(tǒng)相關(guān)技術(shù)研究現(xiàn)狀
1.3.1 數(shù)據(jù)校驗(yàn)技術(shù)
1.3.2 數(shù)據(jù)容錯(cuò)技術(shù)
1.3.3 硬盤故障預(yù)測(cè)技術(shù)
1.3.4 存儲(chǔ)系統(tǒng)節(jié)能技術(shù)
1.4 論文的研究?jī)?nèi)容與創(chuàng)新點(diǎn)
1.4.1 并行CRC算法
1.4.2 基于硬件加速的Reed-Solomon編碼
1.4.3 基于LSTM的硬盤健康狀態(tài)預(yù)測(cè)方法
1.4.4 大規(guī)模低功耗存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
1.5 論文結(jié)構(gòu)
第二章 并行CRC算法
2.1 概述
2.2 CRC算法
2.2.1 算法描述
2.2.2 Sarwate算法
2.2.3 Slicing-by-4算法
2.3 多數(shù)據(jù)流并行CRC算法
2.3.1 數(shù)據(jù)折疊
2.3.2 多數(shù)據(jù)流交織的CRC并行算法
2.4 多線程并行CRC算法
2.4.1 模乘法運(yùn)算
2.4.2 系數(shù)β_p的快速計(jì)算
2.5 實(shí)驗(yàn)與算法評(píng)估
2.5.1 實(shí)驗(yàn)環(huán)境及流程
2.5.2 多數(shù)據(jù)流并行CRC算法實(shí)驗(yàn)結(jié)果
2.5.3 多線程并行CRC算法實(shí)驗(yàn)結(jié)果
2.6 本章小結(jié)
第三章 基于硬件加速的Reed-Solomon編碼
3.1 概述
3.2 Reed-Solomon編碼
3.2.1 Reed-Solomon算法的編碼策略
3.2.2 Reed-Solomon算法的編碼過(guò)程
3.2.3 Reed-Solomon編碼的恢復(fù)過(guò)程
3.2.4 有限域上的運(yùn)算
3.3 基于硬件加速的Reed-Solomon編碼
3.3.1 指令集簡(jiǎn)介
3.3.2 算法設(shè)計(jì)
3.4 實(shí)驗(yàn)與算法評(píng)估
3.4.1 實(shí)驗(yàn)環(huán)境及流程
3.4.2 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
第四章 基于LSTM的硬盤健康狀態(tài)預(yù)測(cè)方法
4.1 概述
4.2 理論背景
4.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
4.2.2 長(zhǎng)短期記憶網(wǎng)絡(luò)
4.2.3 隨機(jī)森林
4.3 基于LSTM的硬盤健康狀態(tài)預(yù)測(cè)方法
4.3.1 特征選擇
4.3.2 SMART屬性變化率特征
4.3.3 硬盤健康等級(jí)劃分
4.3.4 構(gòu)建預(yù)測(cè)模型
4.3.5 遷移學(xué)習(xí)
4.4 實(shí)驗(yàn)與模型評(píng)估
4.4.1 數(shù)據(jù)集
4.4.2 數(shù)據(jù)預(yù)處理
4.4.3 性能評(píng)估指標(biāo)
4.4.4 實(shí)驗(yàn)設(shè)置
4.4.5 實(shí)驗(yàn)結(jié)果
4.5 本章小結(jié)
第五章 大規(guī)模低功耗存儲(chǔ)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 概述
5.2 系統(tǒng)整體框架介紹
5.2.1 虛擬節(jié)點(diǎn)
5.2.2 元數(shù)據(jù)節(jié)點(diǎn)
5.2.3 傳輸節(jié)點(diǎn)
5.2.4 存儲(chǔ)節(jié)點(diǎn)
5.2.5 客戶端
5.3 名稱空間管理
5.3.1 文件元數(shù)據(jù)記錄
5.3.2 名稱空間相關(guān)操作
5.4 存儲(chǔ)空間管理
5.4.1 數(shù)據(jù)塊大小
5.4.2 硬盤組
5.4.3 可用空間列表
5.4.4 硬盤空間分配算法
5.5 系統(tǒng)性能測(cè)試
5.5.1 系統(tǒng)硬件配置
5.5.2 實(shí)驗(yàn)結(jié)果
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文主要工作總結(jié)
6.2 未來(lái)工作的展望
參考文獻(xiàn)
附錄: 縮寫(xiě)詞說(shuō)明
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文和專利目錄
【參考文獻(xiàn)】:
期刊論文
[1]如何存儲(chǔ)“冷數(shù)據(jù)”?[J]. 郭嘉凱. 軟件和信息服務(wù). 2013(10)
本文編號(hào):3716923
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3716923.html
最近更新
教材專著