天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

MapReduce下容錯機制的研究與優(yōu)化

發(fā)布時間:2017-05-08 17:08

  本文關(guān)鍵詞:MapReduce下容錯機制的研究與優(yōu)化,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)的高速發(fā)展,云計算集群系統(tǒng)越來越大,處理數(shù)據(jù)的規(guī)模越來越大,這樣就需要一個高效的分布式處理系統(tǒng)進行數(shù)據(jù)挖掘、計算等任務(wù)。MapReduce是Hadoop下的計算框架,也是云計算Hadoop的核心模塊。MapReduce的容錯性關(guān)乎Hadoop集群的性能。MapReduce有很好的容錯機制和表現(xiàn)不錯的容錯性能,但是隨著使用對象和場景的不一樣,在專有任務(wù)的情況下反而會降低系統(tǒng)性能。因此本文利用原有的MapReduce下的容錯機制進行改善和優(yōu)化,使它更加適用于各種任務(wù)的系統(tǒng)中,并在節(jié)點失效時系統(tǒng)的容錯能力更強。 本文主要從節(jié)點的失效到數(shù)據(jù)處理過程對MapReduce下容錯性能進行改善和優(yōu)化,主要研究成果如下: 在任務(wù)運行前,通過預(yù)取數(shù)據(jù)執(zhí)行估算出任務(wù)的執(zhí)行時間,根據(jù)任務(wù)執(zhí)行時間設(shè)定超時檢測時間(TASKTRACKER_EXPIRY_INT-ERVAL),當節(jié)點在超時檢測時間未收到節(jié)點發(fā)送回來的心跳程序時判斷該節(jié)點失效;在任務(wù)運行過程中,系統(tǒng)會對每個節(jié)點設(shè)定一個信譽值,根據(jù)節(jié)點的數(shù)據(jù)獲取錯誤對節(jié)點的信譽值進行衰減和通過心跳匯報對的信譽值進行恢復(fù),當節(jié)點的信譽值低于最低閾值就判斷該節(jié)點失效。在運行過程中,產(chǎn)生的中間值存儲在本地,當節(jié)點失效就會丟失,本文采用異步復(fù)制,,不同機器存儲的方式存儲,使得中間值在節(jié)點失效時同樣能取得。通過在任務(wù)運行前對失效時間進行設(shè)定,在運行中對節(jié)點失效進行評估和對中間值進行備份存儲的方法增強了系統(tǒng)的容錯能力。
【關(guān)鍵詞】:Hadoop MapReduce 容錯性 信譽值 自適應(yīng)
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP302.8
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 第1章 緒論9-14
  • 1.1 課題來源9
  • 1.2 課題研究的背景和意義9-10
  • 1.3 國內(nèi)外在該方向的研究現(xiàn)狀10-11
  • 1.4 論文主要研究內(nèi)容11-12
  • 1.5 論文內(nèi)容及結(jié)構(gòu)12-14
  • 第2章 MapReduce 體系結(jié)構(gòu)及容錯機制的研究14-26
  • 2.1 MapReduce 體系結(jié)構(gòu)概述14
  • 2.2 Hadoop 分布式文件系統(tǒng)14-15
  • 2.3 HDFS 的基本結(jié)構(gòu)15-18
  • 2.3.1 MapReduce 的基本結(jié)構(gòu)16-18
  • 2.4 目錄文件結(jié)構(gòu)18-19
  • 2.5 MapReduce 的失效檢測19-22
  • 2.5.1 worker 節(jié)點失效20
  • 2.5.2 Master 節(jié)點失效20
  • 2.5.3 失效檢測的流程和機理20-22
  • 2.6 MapReduce 的節(jié)點調(diào)度方式22-23
  • 2.7 其他容錯機制23-24
  • 2.7.1 中間值容錯23-24
  • 2.7.2 JobTracker 容錯24
  • 2.7.3 任務(wù)推測執(zhí)行24
  • 2.8 MapReduce 的容錯性能不足24
  • 2.9 本章小結(jié)24-26
  • 第3章 MapReduce 下容錯機制的優(yōu)化設(shè)計26-36
  • 3.1 MapReduce 自適應(yīng)檢測時間設(shè)計28-30
  • 3.1.1 設(shè)計動機28
  • 3.1.2 設(shè)計原理28
  • 3.1.3 作業(yè)任務(wù)時間估計設(shè)計方法28-30
  • 3.2 MapReduce 下信譽機制的研究與設(shè)計30-33
  • 3.2.1 設(shè)計動機30-31
  • 3.2.2 設(shè)計原理31
  • 3.2.3 MapReduce 下信譽機制的設(shè)計方法31-33
  • 3.3 中間值的安全性的設(shè)計33-34
  • 3.3.1 設(shè)計原理33-34
  • 3.3.2 設(shè)計方法34
  • 3.4 本章小結(jié)34-36
  • 第4章 系統(tǒng)實現(xiàn)36-47
  • 4.1 MapReduce 自適應(yīng)時間檢測實現(xiàn)36-39
  • 4.1.1 執(zhí)行過程36-38
  • 4.1.2 類依賴關(guān)系38-39
  • 4.2 MapReduce 信譽機制實現(xiàn)39-43
  • 4.2.1 執(zhí)行過程39-41
  • 4.2.2 數(shù)據(jù)結(jié)構(gòu)41-42
  • 4.2.3 程序執(zhí)行流程42-43
  • 4.3 中間值的安全性實現(xiàn)43-46
  • 4.3.1 中間數(shù)據(jù)的處理過程43-44
  • 4.3.2 數(shù)據(jù)結(jié)構(gòu)與算法44-46
  • 4.4 本章小結(jié)46-47
  • 第5章 實驗結(jié)果和分析47-59
  • 5.1 實驗環(huán)境和集群架構(gòu)47-49
  • 5.1.1 Hadoop 集群架構(gòu)47-48
  • 5.1.2 實驗環(huán)境和配置48-49
  • 5.1.3 系統(tǒng)概況49
  • 5.2 測試方案和測試過程49-52
  • 5.2.1 實驗配置和進行過程50-51
  • 5.2.2 信譽機制時間的參數(shù)和配置51-52
  • 5.2.3 作業(yè)的選取52
  • 5.3 實驗結(jié)果和數(shù)據(jù)分析52-58
  • 5.3.1 集群系統(tǒng)中沒有節(jié)點失效52-54
  • 5.3.2 系統(tǒng)中有一個節(jié)點失效54-56
  • 5.3.3 系統(tǒng)的整體測試56-57
  • 5.3.4 對比分析57-58
  • 5.4 本章小結(jié)58-59
  • 結(jié)論59-60
  • 參考文獻60-64
  • 致謝64

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前5條

1 孫健;賈曉菁;;Google云計算平臺的技術(shù)架構(gòu)及對其成本的影響研究[J];電信科學;2010年01期

2 丁文定;;基于服務(wù)集成管理的SaaS解決方案[J];計算機與現(xiàn)代化;2010年01期

3 江務(wù)學;張t

本文編號:351527


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/351527.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶95b49***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com