高可用集群系統(tǒng)關(guān)鍵技術(shù)的研究與實現(xiàn)
本文關(guān)鍵詞:高可用集群系統(tǒng)關(guān)鍵技術(shù)的研究與實現(xiàn)
更多相關(guān)文章: 集群 高可用 容錯 任務(wù)分配 心跳檢測 負載均衡
【摘要】:目前,計算機系統(tǒng)已全面進入“云計算”、“大數(shù)據(jù)”時代,由大規(guī)模服務(wù)器集群響應(yīng)海量請求和處理海量數(shù)據(jù)已經(jīng)成為必然趨勢。但是僅僅具有高性能計算能力的集群系統(tǒng)還遠遠不能滿足這種大規(guī)模應(yīng)用的需要,它必須還能夠提供連續(xù)的服務(wù)。所以如何提高集群系統(tǒng)的可用性,盡最大可能避免因系統(tǒng)失效而導(dǎo)致的嚴重后果,,并設(shè)計可擴展的高可用集群系統(tǒng),已經(jīng)成為當(dāng)前集群系統(tǒng)研究的熱點問題之一。 本文對高可用集群系統(tǒng)進行了研究,設(shè)計了一個高可用集群系統(tǒng)的框架,并對高可用集群系統(tǒng)的兩個重要問題:容錯機制和任務(wù)分配與遷移機制進行了深入研究。針對目前心跳檢測算法普遍將心跳包的超時時間閾值設(shè)定為固定值而導(dǎo)致誤判的問題,本文提出了一個基于ARMA預(yù)測的雙層心跳檢測算法,該算法采用ARMA方法預(yù)測心跳包的到達時間間隔,動態(tài)設(shè)置心跳包的超時時間,從而減少對節(jié)點狀態(tài)的誤判;針對目前負載均衡分配算法未考慮任務(wù)與資源的相關(guān)度問題,本文提出一個資源相關(guān)度關(guān)鍵的負載均衡分配算法,該算法充分考慮任務(wù)與各節(jié)點資源的相關(guān)度,能夠在保證系統(tǒng)負載均衡的前提下,盡可能地將任務(wù)分配給與其相關(guān)度高的資源運行。 論文將提出的心跳檢測算法應(yīng)用于容錯機制中,負載均衡算法應(yīng)用于任務(wù)分配機制中,并初步實現(xiàn)了高可用集群核心部分的原型系統(tǒng)。對所實現(xiàn)的系統(tǒng)進行了性能測試實驗,對實驗數(shù)據(jù)的分析表明:系統(tǒng)具有故障檢測正確率高、可用性高、負載均衡性能優(yōu)秀以及任務(wù)等待時間短等優(yōu)點。
【關(guān)鍵詞】:集群 高可用 容錯 任務(wù)分配 心跳檢測 負載均衡
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP302.8
【目錄】:
- 摘要4-5
- ABSTRACT5-6
- 目錄6-9
- 圖表清單9-11
- 注釋表11-12
- 縮略詞12-13
- 第一章 緒論13-19
- 1.1 概述13-14
- 1.2 國內(nèi)外相關(guān)研究工作14-16
- 1.3 論文主要工作16-17
- 1.4 論文組織結(jié)構(gòu)17-19
- 第二章 集群相關(guān)理論與技術(shù)19-31
- 2.1 集群系統(tǒng)概念與結(jié)構(gòu)19-24
- 2.1.1 集群概念與分類19-20
- 2.1.2 典型集群模型與結(jié)構(gòu)20-23
- 2.1.3 高可用集群技術(shù)23-24
- 2.2 高可用集群系統(tǒng)需求分析24-25
- 2.3 高可用集群系統(tǒng)的容錯機制25-28
- 2.3.1 容錯概念25-26
- 2.3.2 容錯相關(guān)技術(shù)26-27
- 2.3.3 容錯機制的實現(xiàn)方法27-28
- 2.4 高可用集群系統(tǒng)的任務(wù)分配機制28-29
- 2.4.1 任務(wù)分配的目標(biāo)28
- 2.4.2 任務(wù)分配算法的分類28-29
- 2.5 高可用集群系統(tǒng)框架設(shè)計29-31
- 第三章 容錯機制設(shè)計31-44
- 3.1 容錯機制結(jié)構(gòu)設(shè)計31-32
- 3.2 心跳技術(shù)及常用實現(xiàn)方法32-35
- 3.2.1 心跳技術(shù)32-33
- 3.2.2 心跳技術(shù)的常用實現(xiàn)方式33-35
- 3.3 基于 ARMA 預(yù)測的集群雙層心跳檢測算法35-44
- 3.3.1 DLHB 算法模型35-36
- 3.3.2 基于 ARMA 的心跳包到達時間預(yù)測算法36-38
- 3.3.3 域間主控節(jié)點心跳檢測算法38-39
- 3.3.4 域內(nèi)節(jié)點心跳檢測算法39-41
- 3.3.5 仿真實驗及性能分析41-44
- 第四章 任務(wù)分配與遷移機制設(shè)計44-65
- 4.1 任務(wù)分配機制設(shè)計44-45
- 4.2 集群負載均衡算法45-51
- 4.2.1 節(jié)點負載評價45-48
- 4.2.2 負載均衡算法48-50
- 4.2.3 現(xiàn)有算法分析50-51
- 4.3 一種資源相關(guān)度關(guān)鍵的負載均衡算法51-61
- 4.3.1 資源相關(guān)度關(guān)鍵的負載均衡模型51-53
- 4.3.2 負載信息計算53-54
- 4.3.3 資源組間優(yōu)先級調(diào)度策略54-56
- 4.3.4 資源組內(nèi)負載均衡調(diào)度策略56-58
- 4.3.5 仿真實驗及性能分析58-61
- 4.4 任務(wù)遷移機制設(shè)計61-65
- 4.4.1 任務(wù)遷移機制模塊結(jié)構(gòu)61-62
- 4.4.2 任務(wù)遷移流程設(shè)計62-63
- 4.4.3 任務(wù)的備份與恢復(fù)63-65
- 第五章 高可用集群系統(tǒng)的實現(xiàn)及性能分析65-75
- 5.1 系統(tǒng)實現(xiàn)65-70
- 5.1.1 通信機制的實現(xiàn)67-68
- 5.1.2 容錯機制的實現(xiàn)68-69
- 5.1.3 任務(wù)分配機制的實現(xiàn)69-70
- 5.1.4 任務(wù)遷移機制的實現(xiàn)70
- 5.2 系統(tǒng)性能測試與分析70-75
- 5.2.1 系統(tǒng)高可用性測試與分析71-72
- 5.2.2 任務(wù)分配性能測試與分析72-74
- 5.2.3 任務(wù)遷移性能測試與分析74-75
- 第六章 總結(jié)與展望75-76
- 6.1 結(jié)論75
- 6.2 后期研究工作75-76
- 參考文獻76-82
- 致謝82-83
- 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文83
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孟相武,程勁,羅克露,韓淙;基于Linux的高可用集群系統(tǒng)的設(shè)計及實現(xiàn)[J];電子科技大學(xué)學(xué)報;2005年04期
2 鄒柏賢,劉強;基于ARMA模型的網(wǎng)絡(luò)流量預(yù)測[J];計算機研究與發(fā)展;2002年12期
3 王霜,修保新,肖衛(wèi)東;Web服務(wù)器集群的負載均衡算法研究[J];計算機工程與應(yīng)用;2004年25期
4 來曉;馮冬芹;褚健;;分布式網(wǎng)絡(luò)故障檢測及恢復(fù)技術(shù)研究[J];計算機工程與應(yīng)用;2010年24期
5 張小芳,胡正國,鄭繼川,唐焱;高可用性集群技術(shù)的研究和應(yīng)用[J];計算機工程;2003年04期
6 姚耀文,唐華松;Linux群集任務(wù)分配算法的探討[J];計算機工程;2003年08期
7 羅娟,曹陽,鄭剛,張俊新;高可用性軟件的設(shè)計與實現(xiàn)[J];計算機工程;2004年08期
8 胡志剛;閻朝坤;劉長庚;;基于平均等待時間約束的松弛預(yù)留機制[J];計算機工程;2012年10期
9 劉健,徐磊,張維明;基于動態(tài)反饋的負載均衡算法[J];計算機工程與科學(xué);2003年05期
10 楊磊;黃浩;李仁發(fā);李肯立;;P2P存儲系統(tǒng)拜占庭容錯機制研究[J];計算機應(yīng)用研究;2009年01期
本文編號:535168
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/535168.html