天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

Hadoop中數(shù)據(jù)放置優(yōu)化機(jī)制的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-10-12 06:53
   Hadoop分布式文件系統(tǒng)(Hadoop Distributed File System,HDFS)作為新一代企業(yè)級存儲架構(gòu)的核心,是云計(jì)算和大數(shù)據(jù)時(shí)代應(yīng)對存儲容量壓力、I/O性能瓶頸、存儲成本危機(jī)等諸多挑戰(zhàn)的重要支撐技術(shù)。HDFS將大數(shù)據(jù)進(jìn)行分塊存儲并按照一定的數(shù)據(jù)放置策略分布存儲到各個(gè)數(shù)據(jù)節(jié)點(diǎn),來提升數(shù)據(jù)中心的存儲和處理效率,從而達(dá)到整個(gè)云平臺的高可用性和高可靠性等目標(biāo)。然而,隨著云計(jì)算應(yīng)用的不斷拓展和數(shù)據(jù)中心模式的不斷演化,上層大數(shù)據(jù)應(yīng)用所產(chǎn)生的業(yè)務(wù)數(shù)據(jù)呈現(xiàn)出越來越明顯的“冷”、“熱”屬性,給HDFS的數(shù)據(jù)管理帶來了新的挑戰(zhàn):一方面,對于存儲占比較大且訪問頻率較低的冷數(shù)據(jù),如果仍采用HDFS默認(rèn)的三副本冗余策略,將會給數(shù)據(jù)中心帶來巨大的存儲代價(jià);另一方面,數(shù)據(jù)量的劇增使得數(shù)據(jù)中心不斷擴(kuò)容,節(jié)點(diǎn)異構(gòu)性愈發(fā)突顯,HDFS機(jī)架感知的數(shù)據(jù)放置策略由于忽略了節(jié)點(diǎn)及數(shù)據(jù)熱度的異構(gòu)性,導(dǎo)致節(jié)點(diǎn)負(fù)載和數(shù)據(jù)資源分配不均,從而降低了存儲系統(tǒng)的整體性能。為了解決以上問題,本碩士論文針對數(shù)據(jù)熱度劃分和數(shù)據(jù)放置優(yōu)化兩個(gè)關(guān)鍵技術(shù),研究相關(guān)的機(jī)制和算法,期望在保證數(shù)據(jù)可靠性的同時(shí),能夠減少存儲代價(jià)并提高系統(tǒng)整體性能。具體地,本論文從以下三個(gè)方面開展研究工作:首先,研究基于時(shí)間序列的數(shù)據(jù)熱度劃分方法。針對現(xiàn)有HDFS三副本冗余策略忽略了數(shù)據(jù)熱度導(dǎo)致存儲成本過高的問題,提出了熱度感知劃分算法,即得到用戶對于數(shù)據(jù)訪問頻率的時(shí)間序列,計(jì)算出時(shí)間序列的DTW距離,然后通過K-means聚類算法,將時(shí)間序列轉(zhuǎn)化為數(shù)據(jù)的熱度屬性,為后面數(shù)據(jù)放置策略提供基礎(chǔ)。其次,研究熱度敏感的數(shù)據(jù)放置優(yōu)化策略。針對HDFS數(shù)據(jù)放置過程中忽視了節(jié)點(diǎn)異構(gòu)性導(dǎo)致系統(tǒng)性能下降的問題,對于冷、熱數(shù)據(jù)分別提出了相應(yīng)的放置優(yōu)化策略:對于訪問頻率高的熱數(shù)據(jù),提出了一個(gè)動態(tài)副本感知的數(shù)據(jù)放置方法,用以提高存儲系統(tǒng)的整體性能;對于訪問頻率低的冷數(shù)據(jù),提出了一個(gè)基于糾刪碼冗余的數(shù)據(jù)放置機(jī)制,在保證數(shù)據(jù)可用性的前提下,降低存儲成本。最后,基于上述理論研究成果,設(shè)計(jì)并開發(fā)面向HDFS的數(shù)據(jù)放置優(yōu)化系統(tǒng)KittyTwinkle。通過增加數(shù)據(jù)統(tǒng)計(jì)模塊并修改數(shù)據(jù)放置過程等,實(shí)現(xiàn)HDFS中數(shù)據(jù)放置的優(yōu)化管理,并部署于東南大學(xué)云計(jì)算中心環(huán)境中進(jìn)行應(yīng)用驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,本文所提基于時(shí)間序列的數(shù)據(jù)熱度劃分方法和熱度敏感的數(shù)據(jù)放置優(yōu)化策略,在保證數(shù)據(jù)可用性的同時(shí),能夠顯著地減少數(shù)據(jù)中心的存儲代價(jià),并能有效提升存儲系統(tǒng)的性能,為大數(shù)據(jù)的存儲和管理提供了行之有效的解決方案。
【學(xué)位單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP333;TP311.13
【部分圖文】:

原理圖,分布式文件系統(tǒng),原理


圖 1 - 2 Hadoop 分布式文件系統(tǒng)原理Hadoop 分布式文件系統(tǒng)的冗余方式是靜態(tài)的復(fù)制策略,即數(shù)據(jù)存儲時(shí)有三個(gè)副本且運(yùn)行過程中不再改變。但靜態(tài)復(fù)制策略卻不能依據(jù)環(huán)境的變化做出動態(tài)的調(diào)整,同時(shí)三副本策略的存儲效率僅為 33%,易造成存儲資源的浪費(fèi)。另一方面,大數(shù)據(jù)的訪問過程同樣遵循著 80/20 原則[14],即大部分應(yīng)用在其訪問情況中,80%的訪問對象都固定地訪問 20%的存儲數(shù)據(jù)。同時(shí),大數(shù)據(jù)的數(shù)據(jù)量浩大,而訪問請求只集中在小部分的數(shù)據(jù)上,其余數(shù)據(jù)只有較少的訪問請求。這些被高頻請求的小部分?jǐn)?shù)據(jù)被稱為熱數(shù)據(jù),請求量稀少的大部分?jǐn)?shù)據(jù)被稱為冷數(shù)據(jù)。經(jīng)統(tǒng)計(jì)分析發(fā)現(xiàn),大部分 Hadoop 集群數(shù)據(jù)塊的訪問具有較強(qiáng)的規(guī)律性,數(shù)據(jù)均表現(xiàn)出明顯的冷熱屬性。文獻(xiàn)[15]通過對 Yahoo!公司 HDFS 集群內(nèi)部數(shù)據(jù)塊訪問日志分析得出,90.26%的數(shù)據(jù)塊都會在其上傳 2 天內(nèi)進(jìn)行第一次訪問,89.61%的數(shù)據(jù)塊都會在其上傳后的 10 天內(nèi)進(jìn)行最后一次訪問,40%的數(shù)據(jù)塊最后一次讀取時(shí)間到最后刪除的時(shí)間跨度都不會超過 20 天。因此,對于一個(gè)數(shù)據(jù)中心,在當(dāng)前這種大部分都是冷數(shù)據(jù)的情況下,如果所有的數(shù)據(jù)都采用靜態(tài)三副本策略實(shí)現(xiàn)冗余

原理圖,糾刪碼,原理圖


算法[29] 高讀寫可用性e-Like 算法[30] 負(fù)載均衡P 算法[31] 減小平均響應(yīng)時(shí)間糾刪碼的放置策略碼源于通信及其相關(guān)學(xué)科,主要解決了數(shù)據(jù)傳輸中的檢錯和糾錯問用到存儲系統(tǒng)中,并且其根據(jù)存儲系統(tǒng)應(yīng)用的特點(diǎn)逐步得到相應(yīng)的統(tǒng)中,糾刪碼技術(shù)[32]主要是利用編碼算法將原始數(shù)據(jù)轉(zhuǎn)化為冗余據(jù)和冗余數(shù)據(jù)一起存儲起來進(jìn)行容錯。如圖 2 - 1 所示,其基本思路即矩陣數(shù)據(jù) D,通過相應(yīng)的編碼計(jì)算(乘以矩陣數(shù)據(jù) B),得到 k 。對于這 n = m + k 個(gè)編碼后元素,如果任意的 k 個(gè)元素出錯(包據(jù)出錯)時(shí),原始的 m 個(gè)數(shù)據(jù)都可以通過對應(yīng)的重構(gòu)編碼算法計(jì)算式冗余會增加 200%的存儲開銷,而糾刪碼的冗余方式具有冗余度幅度節(jié)約存儲空間等優(yōu)點(diǎn),這對于不經(jīng)常訪問的冷數(shù)據(jù)具有非常重

中歐,時(shí)間序列,歐式距離


東南大學(xué)碩士學(xué)位論文( ) = ( ) 其中 表示點(diǎn) 在第 i 維的值,同理 。從上述定義可以知道歐式距離適合是“匹配”的距離計(jì)算,即每一點(diǎn)都有另一對應(yīng),而對于計(jì)算時(shí)間序列的距離來說,兩個(gè)時(shí)間序列的長度是不一定相等文使用 DTW 距離來度量兩個(gè)時(shí)間序列的距離,從而得到其相似程度。DTW 表示 DynamicTimeWarping,其原理是找到兩個(gè)時(shí)間序列“對應(yīng)”的相似通過計(jì)算這些點(diǎn)的距離和來表示兩個(gè)時(shí)間序列的相似程度。這里的“對應(yīng)”僅的意思,即一個(gè)點(diǎn)可以對應(yīng)多個(gè)點(diǎn),點(diǎn)與點(diǎn)之間存在著一對多、多對一、一對映射關(guān)系。從時(shí)間維度上將點(diǎn)扭曲(Warping)得到序列總體的最小距離稱為 D如圖 3 - 1 所示,該圖展示了歐式距離和 DTW 距離的區(qū)別。
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 古仙;UUCP網(wǎng)分析與移植通過鑒定[J];計(jì)算機(jī)應(yīng)用研究;1988年01期

2 萬天明,孟志青;一種基于C/S的分布式PowerBuilder數(shù)據(jù)傳送方法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2000年04期

3 趙學(xué)華;網(wǎng)絡(luò)數(shù)據(jù)傳送方法[J];廣西氣象;1999年03期

4 劉念君,許向東,范強(qiáng);運(yùn)用網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)無線數(shù)據(jù)傳送[J];水運(yùn)工程;2000年04期

5 李一武,李樂民;單跳波分復(fù)用網(wǎng)絡(luò)中的優(yōu)化數(shù)據(jù)傳送策略[J];通信學(xué)報(bào);1998年10期

6 趙郁森;;SD2003系統(tǒng)數(shù)據(jù)傳送軟件包[J];中國原子能科學(xué)研究院年報(bào);1986年00期

7 謝峰;;ASP.NET頁面間數(shù)據(jù)傳送方法研究[J];科技信息;2012年08期

8 董慧如;SCSI—2的高速數(shù)據(jù)傳送技術(shù)與進(jìn)展[J];電子計(jì)算機(jī)外部設(shè)備;1994年04期

9 羅詩星;淺談數(shù)據(jù)傳送過程中的“數(shù)據(jù)頭”[J];中國有線電視;2001年20期

10 莊哲民;提高單片機(jī)數(shù)據(jù)傳送速度的新方法[J];自動化儀表;1999年08期


相關(guān)博士學(xué)位論文 前5條

1 林路;基于面向數(shù)據(jù)的智慧園區(qū)體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];成都理工大學(xué);2018年

2 吳禮華;基于手機(jī)記錄數(shù)據(jù)的城市空間感知及應(yīng)用研究[D];武漢大學(xué);2016年

3 陳靖;帶實(shí)時(shí)的傳值與移動系統(tǒng)研究[D];中國科學(xué)院研究生院(軟件研究所);2003年

4 董贊強(qiáng);基于網(wǎng)絡(luò)編碼的數(shù)據(jù)通信技術(shù)研究[D];南京郵電大學(xué);2013年

5 王海勇;無線傳感器網(wǎng)絡(luò)數(shù)據(jù)可靠傳輸關(guān)鍵技術(shù)研究[D];南京郵電大學(xué);2016年


相關(guān)碩士學(xué)位論文 前10條

1 王熊;網(wǎng)絡(luò)空間國家大數(shù)據(jù)主權(quán)安全危機(jī)治理研究[D];南京師范大學(xué);2018年

2 杜瑤;Hadoop中數(shù)據(jù)放置優(yōu)化機(jī)制的研究與實(shí)現(xiàn)[D];東南大學(xué);2018年

3 閔少穎;云數(shù)據(jù)精確修復(fù)方法研究[D];武漢科技大學(xué);2018年

4 張沁馨;基于PXIe高速接口的高速數(shù)據(jù)傳輸平臺的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2018年

5 宋秉華;車聯(lián)網(wǎng)大數(shù)據(jù)處理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國科學(xué)院大學(xué)(中國科學(xué)院工程管理與信息技術(shù)學(xué)院);2017年

6 馬力;面向高頻證券大數(shù)據(jù)的流式處理框架及關(guān)鍵技術(shù)研究[D];西北大學(xué);2017年

7 董淮南;新型數(shù)據(jù)傳送協(xié)議及其實(shí)現(xiàn)驗(yàn)證[D];西安電子科技大學(xué);2006年

8 蔡龍;掃描電鏡圖像數(shù)據(jù)采集傳輸系統(tǒng)的設(shè)計(jì)[D];南京師范大學(xué);2014年

9 余尚仁;基于Web的數(shù)據(jù)截獲分析與網(wǎng)絡(luò)攻擊技術(shù)研究[D];武漢工程大學(xué);2017年

10 徐超;基于分片技術(shù)的無線傳感網(wǎng)數(shù)據(jù)隱私保護(hù)算法研究[D];南京郵電大學(xué);2017年



本文編號:2837811

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2837811.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8cd5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
91欧美日韩中在线视频| 偷拍美女洗澡免费视频| 亚洲熟女国产熟女二区三区| 亚洲品质一区二区三区| 亚洲中文字幕三区四区| 欧美六区视频在线观看| 91老熟妇嗷嗷叫太91| 自拍偷女厕所拍偷区亚洲综合| 久久精品中文字幕人妻中文| 国产成人亚洲精品青草天美| 国产精品不卡高清在线观看| 久久99爱爱视频视频| 日韩免费成人福利在线| 亚洲免费视频中文字幕在线观看| 国产亚洲中文日韩欧美综合网| 欧美乱视频一区二区三区| 国产精欧美一区二区三区久久| 久久热麻豆国产精品视频| 国产日韩精品欧美综合区| 国内真实露脸偷拍视频| 日韩成人动作片在线观看| 四季av一区二区播放| 亚洲欧洲一区二区中文字幕| 欧美日韩视频中文字幕| 国产亚洲二区精品美女久久| 欧美性高清一区二区三区视频| 美女被后入视频在线观看| 国产真人无遮挡免费视频一区| 日韩免费午夜福利视频| 91国内视频一区二区三区| 精品一区二区三区免费看| 91亚洲人人在字幕国产| a久久天堂国产毛片精品| 亚洲国产精品无遮挡羞羞| 免费观看一级欧美大片| 中文字幕日韩无套内射| 91久久精品国产一区蜜臀| 亚洲视频一区自拍偷拍另类| 少妇成人精品一区二区| 在线观看日韩欧美综合黄片| 尤物久久91欧美人禽亚洲|