天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

基于網(wǎng)絡(luò)編碼的hadoop分布式文件系統(tǒng)優(yōu)化方法的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-05-07 10:51
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的不斷飛速發(fā)展,數(shù)字信息和科技信息等各種數(shù)據(jù)出現(xiàn)爆炸式增長(zhǎng),海量數(shù)據(jù)的存儲(chǔ)和管理成為一個(gè)重要研究?jī)?nèi)容。分布式存儲(chǔ)系統(tǒng)由于其存儲(chǔ)容量大、擴(kuò)展性強(qiáng)等性能方面的優(yōu)勢(shì)而被廣泛使用。分布式存儲(chǔ)系統(tǒng)多用副本機(jī)制實(shí)現(xiàn)冗余,這種方式往往導(dǎo)致系統(tǒng)有比較大的存儲(chǔ)開銷和修復(fù)帶寬開銷。為了提高系統(tǒng)的整體性能,人們?cè)诜植际酱鎯?chǔ)系統(tǒng)中引入了網(wǎng)絡(luò)編碼。雖然網(wǎng)絡(luò)編碼可以顯著提高系統(tǒng)性能,但是需要連接很多節(jié)點(diǎn)去進(jìn)行修復(fù)操作,即嚴(yán)重提高了磁盤I/O。同時(shí)引入的網(wǎng)絡(luò)編碼的分布式存儲(chǔ)系統(tǒng)的數(shù)據(jù)加密問題也受到了大家的一致關(guān)注。本文針對(duì)分布式存儲(chǔ)系統(tǒng)的容錯(cuò)問題和加密問題,以Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)為目標(biāo)系統(tǒng),對(duì)糾刪碼和網(wǎng)絡(luò)編碼應(yīng)用于分布式文件存儲(chǔ)系統(tǒng)中的系統(tǒng)性能問題及數(shù)據(jù)加密問題進(jìn)行了研究。論文的主要工作包括:(1)針對(duì)網(wǎng)絡(luò)編碼應(yīng)用于分布式存儲(chǔ)系統(tǒng)中時(shí),在故障數(shù)據(jù)修復(fù)過程的磁盤I/O較大的問題,對(duì)系統(tǒng)最小存儲(chǔ)再生碼(Minimum Storage Regeneration Code,MSR)進(jìn)行改進(jìn),考慮其局部修復(fù)性,提出一種以系統(tǒng)MSR碼為基礎(chǔ)的局部修復(fù)編碼。將副本機(jī)制、糾刪碼機(jī)制和以系統(tǒng)MSR碼為基礎(chǔ)的局部修復(fù)編碼的機(jī)制分別應(yīng)用于HDFS中,研究了存儲(chǔ)開銷、修復(fù)帶寬開銷和磁盤I/O開銷等性能。通過理論分析和實(shí)驗(yàn)證明,在付出一定的存儲(chǔ)開銷的情況下,本文中提出的方法能夠明顯降低磁盤的I/O操作。(2)針對(duì)分布式文件系統(tǒng)中數(shù)據(jù)加密量較多的問題,研究了基于網(wǎng)絡(luò)編碼的HDFS系統(tǒng)的加密機(jī)制,提出了一種輕量級(jí)的加密機(jī)制。該機(jī)制不再將所有的數(shù)據(jù)或者編碼數(shù)據(jù)進(jìn)行加密,而是只對(duì)其中編碼過程中使用的編碼矩陣進(jìn)行加密操作,將網(wǎng)絡(luò)編碼和加密操作結(jié)合在一起。通過數(shù)據(jù)分析和實(shí)驗(yàn)證明,這種加密方式在保證了系統(tǒng)安全性的前提下,減少了需要加密的數(shù)據(jù)量,提高了整個(gè)系統(tǒng)的效率。
【圖文】:

示意圖,網(wǎng)絡(luò)編碼,示意圖,節(jié)點(diǎn)


北京交通大學(xué)碩士學(xué)位論文邐相關(guān)技術(shù)逡逑間單元內(nèi),源點(diǎn)最多只能通過多播同時(shí)傳輸1.5個(gè)字符到達(dá)宿點(diǎn)。若是節(jié)點(diǎn)S采逡逑用網(wǎng)絡(luò)編碼技術(shù)進(jìn)行多播操作,節(jié)點(diǎn)4會(huì)對(duì)來自節(jié)點(diǎn)2和節(jié)點(diǎn)3的數(shù)據(jù)進(jìn)行異或逡逑運(yùn)算,然后傳輸給節(jié)點(diǎn)5,在宿點(diǎn)中,,可以同時(shí)通過異或運(yùn)算獲。矀(gè)字符。逡逑

原理圖,冗余存儲(chǔ),副本,原理圖


北京交通大學(xué)碩士學(xué)位論文邐相關(guān)技術(shù)逡逑要的服務(wù),保證了數(shù)據(jù)的可用性。完全副本機(jī)制的存儲(chǔ)原理如圖2-2所示。逡逑原始數(shù)據(jù)邐12345逡逑副本數(shù)據(jù)邐123斗|5邐12345逡逑訪問數(shù)據(jù)邐n邐I邋0邐.邐■逡逑塊邐|邐1邐2邐3邐4邐5逡逑邐邐邐邐逡逑原始數(shù)據(jù)邐12345逡逑圖2-2完全副本冗余存儲(chǔ)的原理圖逡逑Fig.2-2邋Schematic邋of邋full邋copy邋redundant邋storage逡逑(2)完全副本機(jī)制修復(fù)原理逡逑當(dāng)分布式文件系統(tǒng)中的某個(gè)機(jī)器宕機(jī)、數(shù)據(jù)節(jié)點(diǎn)故障或者節(jié)點(diǎn)數(shù)據(jù)發(fā)生錯(cuò)誤,逡逑將啟動(dòng)修復(fù)進(jìn)程。修復(fù)的整個(gè)過程十分簡(jiǎn)單,即選擇失效節(jié)點(diǎn)的原始數(shù)據(jù)塊的其逡逑中一個(gè)備份進(jìn)行復(fù)制操作,將復(fù)制出的新的數(shù)據(jù)塊置入選擇好的一個(gè)節(jié)點(diǎn)中。完逡逑全副本機(jī)制的修復(fù)原理如圖2-3所示逡逑副本數(shù)據(jù)邐1邐2逡逑O逡逑4逡逑寫入逡逑邐邐邐邐邐邋邐邐邋邐逡逑原始數(shù)據(jù)邐1234
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP333;TN918.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 花育聰;;基于Hadoop分布式文件系統(tǒng)的模型分析[J];信息通信;2015年12期

2 余林琛;章巍;林強(qiáng);許杰星;鐘貝;;RS糾刪碼在云存儲(chǔ)中的應(yīng)用[J];微電子學(xué)與計(jì)算機(jī);2011年08期

相關(guān)博士學(xué)位論文 前2條

1 朱云鋒;分布式存儲(chǔ)系統(tǒng)中基于糾刪碼的容錯(cuò)技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年

2 王禹;分布式存儲(chǔ)系統(tǒng)中的數(shù)據(jù)冗余與維護(hù)技術(shù)研究[D];華南理工大學(xué);2011年

相關(guān)碩士學(xué)位論文 前5條

1 李大江;HDFS糾刪碼機(jī)制的優(yōu)化研究[D];哈爾濱工業(yè)大學(xué);2018年

2 鄧銳;分布式存儲(chǔ)系統(tǒng)中再生碼的性能分析和優(yōu)化設(shè)計(jì)[D];哈爾濱工業(yè)大學(xué);2017年

3 莊園;基于Lustre文件系統(tǒng)MPI-I/O優(yōu)化的改進(jìn)與實(shí)現(xiàn)[D];山東大學(xué);2017年

4 盧旭;基于網(wǎng)絡(luò)編碼的WSN輕量級(jí)安全研究[D];北京郵電大學(xué);2013年

5 陳寅;基于網(wǎng)絡(luò)編碼的分布式存儲(chǔ)技術(shù)研究[D];西安電子科技大學(xué);2011年



本文編號(hào):2652865

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2652865.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶40127***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com