分布式系統(tǒng)中基于檢查點容錯服務的設計與實現(xiàn)
本文關鍵詞:分布式系統(tǒng)中基于檢查點容錯服務的設計與實現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:分布式系統(tǒng)的錯誤頻率的增加導致運行應用任務完成時間增長,并且近年來大量記錄了大規(guī)模分布式系統(tǒng)運行狀態(tài)的現(xiàn)場失效數(shù)據(jù)以規(guī)范格式公布,在此背景下,本文研究分布式系統(tǒng)下基于檢查點的容錯服務,利用系統(tǒng)失效關聯(lián)性特征來建立模型,得到減小分布式任務的完成時間的檢查點放置策略,從而在保證系統(tǒng)可靠性的前提下,降低容錯服務的實現(xiàn)代價,提高分布式系統(tǒng)的運行效率。論文主要的工作和貢獻包括:(1)研究檢查點/恢復技術的基本機制及其實現(xiàn)方式,分析分布式系統(tǒng)中保存通信狀態(tài)以及保證其一致性的難點,通過實現(xiàn)了一個原型系統(tǒng),研究全局檢查點的代價、分布式系統(tǒng)的規(guī)模以及應用程序大小之間的關系;(2)提出一個基于檢查點和系統(tǒng)失效關聯(lián)性特征的容錯模型,根據(jù)失效事件相關性分析結果,提出一種分布式系統(tǒng)節(jié)點關聯(lián)性分組方法,利用節(jié)點分組信息建立以最小化浪費時間為目標的優(yōu)化方程,得出了主動檢查點的放置周期,并提出了一個包含主動檢查點以及被動檢查點的兩類檢查點放置策略;(3)基于FTA中失效數(shù)據(jù)格式,設計并實現(xiàn)了基于檢查點的容錯服務,并進行了對比仿真。首先選取FTA中部分系統(tǒng)失效數(shù)據(jù),分別實現(xiàn)了本文提出的容錯服務以及其他檢查點容錯服務,評估其中的參數(shù),再利用剩下的系統(tǒng)失效數(shù)據(jù)進行性能評估,實驗結果表明本文提出的容錯服務的額外浪費時間較低,達到了預期目的。
【關鍵詞】:失效關聯(lián)性分析 檢查點/恢復容錯 同步檢查點實現(xiàn) FTA失效數(shù)據(jù)
【學位授予單位】:東南大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP302.8
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-15
- 1.1 研究背景11-13
- 1.1.1 分布式系統(tǒng)容錯11
- 1.1.2 檢查點/恢復容錯技術11-12
- 1.1.3 分布式系統(tǒng)的現(xiàn)場失效數(shù)據(jù)12-13
- 1.1.4 分布式系統(tǒng)的錯誤相關性分析13
- 1.2 本文研究內容和工作13
- 1.3 本文組織結構13-15
- 第二章 研究現(xiàn)狀及相關技術15-22
- 2.1 分布式系統(tǒng)的容錯研究現(xiàn)狀15-16
- 2.1.1 全局檢查點容錯技術15
- 2.1.2 消息緩存日志技術15-16
- 2.2 檢查點/恢復的容錯技術研究現(xiàn)狀16-20
- 2.2.1 檢查點/恢復機制的技術實現(xiàn)16-18
- 2.2.2 分布式系統(tǒng)的檢查點/恢復算法18-19
- 2.2.3 檢查點放置策略研究現(xiàn)狀19-20
- 2.3 系統(tǒng)失效數(shù)據(jù)關聯(lián)性分析研究現(xiàn)狀20
- 2.3.1 時間相關性分析20
- 2.3.2 空間相關性分析20
- 2.4 尚存在的問題20-21
- 2.5 本章小結21-22
- 第三章 檢查點/恢復容錯服務22-35
- 3.1 容錯服務概述22-23
- 3.2 問題建模23-26
- 3.2.1 模型假設23
- 3.2.2 模型描述與符號說明23-25
- 3.2.3 問題描述25-26
- 3.3 事件關聯(lián)性分析與系統(tǒng)節(jié)點分組26-29
- 3.3.1 事件相關性分析26-28
- 3.3.2 系統(tǒng)節(jié)點分組28-29
- 3.4 相關節(jié)點事件合并與系統(tǒng)事件合并29-30
- 3.5 主動檢查點周期求解30-33
- 3.6 容錯服務檢查點放置策略33-34
- 3.7 本章小結34-35
- 第四章 檢查點/恢復容錯服務實現(xiàn)35-39
- 4.1 單進程檢查點/恢復的實現(xiàn)35-37
- 4.2 分布式系統(tǒng)檢查點/恢復原型系統(tǒng)37-38
- 4.3 本章小結38-39
- 第五章 檢查點/恢復容錯服務的實驗分析39-54
- 5.1 實驗方法39-40
- 5.2 實驗環(huán)境40
- 5.3 FTA事件格式分析以及數(shù)據(jù)預處理40-43
- 5.4 模型參數(shù)的評估以及合理性分析43-48
- 5.4.1 時間窗參數(shù)θ值評估43-44
- 5.4.2 關聯(lián)度閾值Tconst評估44-46
- 5.4.3 擬合參數(shù)M評估46-47
- 5.4.4 檢查點代價Tgcp評估47
- 5.4.5 回退因子K評估47-48
- 5.5 Liu-Raga檢查點策略參數(shù)評估48-51
- 5.6 實驗結果與分析51-53
- 5.7 本章小結53-54
- 第六章 總結及未來工作54-55
- 6.1 總結54
- 6.2 未來工作54-55
- 致謝55-56
- 參考文獻56-58
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉玉華;分布式系統(tǒng)[J];微電子學與計算機;1983年05期
2 杜興,謝立,孫鐘秀;一種基于對象的分布式系統(tǒng)描述求精方法[J];計算機學報;1994年07期
3 趙宏;;分布式系統(tǒng)中合作進程及其同步關系[J];計算機科學;1995年02期
4 柴振榮;分布式系統(tǒng)的管理問題[J];管理科學文摘;1996年06期
5 歲豐;對分布式系統(tǒng)項目的領導[J];管理科學文摘;1996年12期
6 李斌;解決科學問題的分布式系統(tǒng)[J];管理科學文摘;1997年02期
7 楊運偉,張戈,高建華;分布式系統(tǒng)中的投票協(xié)議[J];計算機應用研究;2000年08期
8 徐海云;部件對象技術與分布式系統(tǒng)的開發(fā)[J];濟南交通高等?茖W校學報;2001年01期
9 唐少先,陳建二;分布式系統(tǒng)中有向流的最優(yōu)調控算法[J];計算技術與自動化;2001年03期
10 錢斌,徐海云;部件對象技術與分布式系統(tǒng)的開發(fā)[J];管理信息系統(tǒng);2001年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 許趙云;黃林鵬;;分布式系統(tǒng)動態(tài)更新的研究[A];2007年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2007年
2 殷躍鵬;郭長國;李小玲;王懷民;;基于事件的分布式系統(tǒng)行為分析框架[A];2010年全國開放式分布與并行計算機學術會議論文集[C];2010年
3 王曉鵬;蘇亮;韓偉紅;周斌;;大型分布式系統(tǒng)部署一致性的研究與實現(xiàn)[A];2006年全國開放式分布與并行計算機學術會議論文集(三)[C];2006年
4 何明;裘杭萍;楊飛;劉勇;;基于可信分布式系統(tǒng)的可信認證技術研究[A];全國計算機安全學術交流會論文集(第二十三卷)[C];2008年
5 王剛;喬純捷;王躍科;;基于時鐘同步的分布式系統(tǒng)一致全局狀態(tài)[A];第三屆全國虛擬儀器大會論文集[C];2008年
6 周方;周光霞;;分布式系統(tǒng)軟件可靠性評估的研究[A];2005第二屆電子信息系統(tǒng)質量與可靠性學術研討會論文集[C];2005年
7 馮錫煒;賈傳熒;楊家軒;;JMS技術在分布式系統(tǒng)中的應用與實現(xiàn)[A];促進企業(yè)信息化進程——第十屆中國Java技術及應用大會文集[C];2007年
8 蔣勇;李光文;張若文;;多業(yè)務數(shù)字分布式系統(tǒng)(MDAS)及其應用[A];四川省通信學會2013年學術年會論文集[C];2013年
9 徐長盛;高欣;;分布式系統(tǒng)與Ice[A];全國冶金自動化信息網(wǎng)2009年會論文集[C];2009年
10 劉淵;姜建國;繆繼東;范曉嵐;;一個分布式系統(tǒng)通信控制軟件的設計與實現(xiàn)[A];中國工程物理研究院科技年報(2002)[C];2002年
中國重要報紙全文數(shù)據(jù)庫 前6條
1 撫蘇;大數(shù)據(jù)帶來價值[N];電腦報;2013年
2 ;首席“云”官[N];中國計算機報;2009年
3 本報記者 黃舍予;得“數(shù)據(jù)”者得天下[N];人民郵電;2012年
4 范范 編譯;Docker威力:輕松化解“云鎖定”[N];網(wǎng)絡世界;2014年
5 ;IBM改進大機管理[N];網(wǎng)絡世界;2006年
6 首都經(jīng)濟貿易大學 金勇;用Java和XML構建分布式系統(tǒng)[N];計算機世界;2002年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 鄭紅;分布式系統(tǒng)形式化建模技術研究[D];中國科學院研究生院(軟件研究所);2003年
2 尚慶紅;半分布式系統(tǒng)資源發(fā)現(xiàn)與資源分配研究[D];電子科技大學;2013年
3 王德俊;面向服務的分布式系統(tǒng)動態(tài)更新研究[D];上海交通大學;2010年
4 陳曉江;分布式系統(tǒng)軟件體系結構建模與開發(fā)方法研究[D];西北大學;2010年
5 何盼;面向可靠性優(yōu)化設計的分布式系統(tǒng)資源分配研究[D];重慶大學;2012年
6 唐小勇;異構并行分布式系統(tǒng)可信調度理論與方法研究[D];湖南大學;2013年
7 龔奕利;分布式環(huán)境中的資源發(fā)現(xiàn)研究[D];中國科學院研究生院(計算技術研究所);2006年
8 彭艦;基于CORBA的分布式系統(tǒng)中實時—容錯性的研究——分布式系統(tǒng)中動態(tài)調度的設計與實現(xiàn)[D];電子科技大學;2004年
9 劉國良;分布式系統(tǒng)中回卷恢復技術研究[D];重慶大學;2012年
10 閔帆;基于試探的任務分配算法研究[D];電子科技大學;2003年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 遲云飛;基于分布式控制架構的信號機設計研究[D];長安大學;2015年
2 高文;基于DDS的分布式系統(tǒng)的建模與仿真[D];東南大學;2015年
3 冒佳明;基于DDS的分布式系統(tǒng)的性能評估模型研究與實現(xiàn)[D];東南大學;2015年
4 周永江;分布式系統(tǒng)結構可發(fā)育模型研究[D];東華大學;2013年
5 陳均滔;分布式角色協(xié)同控制系統(tǒng)stage的設計與實現(xiàn)[D];電子科技大學;2016年
6 趙立斌;分布式MongoDB集群高可用性的研究和性能優(yōu)化[D];電子科技大學;2016年
7 黃志勇;分布式系統(tǒng)中基于檢查點容錯服務的設計與實現(xiàn)[D];東南大學;2016年
8 殷躍鵬;基于事件的分布式系統(tǒng)行為分析框架的設計與實現(xiàn)[D];國防科學技術大學;2010年
9 胡俊;構建分布式系統(tǒng)的關鍵技術研究與實現(xiàn)[D];南京郵電大學;2012年
10 謝志海;分布式系統(tǒng)測試關鍵技術研究[D];西安電子科技大學;2013年
本文關鍵詞:分布式系統(tǒng)中基于檢查點容錯服務的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號:264107
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/264107.html