分布式系統(tǒng)中基于檢查點(diǎn)容錯(cuò)服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:分布式系統(tǒng)中基于檢查點(diǎn)容錯(cuò)服務(wù)的設(shè)計(jì)與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:分布式系統(tǒng)的錯(cuò)誤頻率的增加導(dǎo)致運(yùn)行應(yīng)用任務(wù)完成時(shí)間增長,并且近年來大量記錄了大規(guī)模分布式系統(tǒng)運(yùn)行狀態(tài)的現(xiàn)場失效數(shù)據(jù)以規(guī)范格式公布,在此背景下,本文研究分布式系統(tǒng)下基于檢查點(diǎn)的容錯(cuò)服務(wù),利用系統(tǒng)失效關(guān)聯(lián)性特征來建立模型,得到減小分布式任務(wù)的完成時(shí)間的檢查點(diǎn)放置策略,從而在保證系統(tǒng)可靠性的前提下,降低容錯(cuò)服務(wù)的實(shí)現(xiàn)代價(jià),提高分布式系統(tǒng)的運(yùn)行效率。論文主要的工作和貢獻(xiàn)包括:(1)研究檢查點(diǎn)/恢復(fù)技術(shù)的基本機(jī)制及其實(shí)現(xiàn)方式,分析分布式系統(tǒng)中保存通信狀態(tài)以及保證其一致性的難點(diǎn),通過實(shí)現(xiàn)了一個(gè)原型系統(tǒng),研究全局檢查點(diǎn)的代價(jià)、分布式系統(tǒng)的規(guī)模以及應(yīng)用程序大小之間的關(guān)系;(2)提出一個(gè)基于檢查點(diǎn)和系統(tǒng)失效關(guān)聯(lián)性特征的容錯(cuò)模型,根據(jù)失效事件相關(guān)性分析結(jié)果,提出一種分布式系統(tǒng)節(jié)點(diǎn)關(guān)聯(lián)性分組方法,利用節(jié)點(diǎn)分組信息建立以最小化浪費(fèi)時(shí)間為目標(biāo)的優(yōu)化方程,得出了主動(dòng)檢查點(diǎn)的放置周期,并提出了一個(gè)包含主動(dòng)檢查點(diǎn)以及被動(dòng)檢查點(diǎn)的兩類檢查點(diǎn)放置策略;(3)基于FTA中失效數(shù)據(jù)格式,設(shè)計(jì)并實(shí)現(xiàn)了基于檢查點(diǎn)的容錯(cuò)服務(wù),并進(jìn)行了對(duì)比仿真。首先選取FTA中部分系統(tǒng)失效數(shù)據(jù),分別實(shí)現(xiàn)了本文提出的容錯(cuò)服務(wù)以及其他檢查點(diǎn)容錯(cuò)服務(wù),評(píng)估其中的參數(shù),再利用剩下的系統(tǒng)失效數(shù)據(jù)進(jìn)行性能評(píng)估,實(shí)驗(yàn)結(jié)果表明本文提出的容錯(cuò)服務(wù)的額外浪費(fèi)時(shí)間較低,達(dá)到了預(yù)期目的。
【關(guān)鍵詞】:失效關(guān)聯(lián)性分析 檢查點(diǎn)/恢復(fù)容錯(cuò) 同步檢查點(diǎn)實(shí)現(xiàn) FTA失效數(shù)據(jù)
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP302.8
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 第一章 緒論11-15
- 1.1 研究背景11-13
- 1.1.1 分布式系統(tǒng)容錯(cuò)11
- 1.1.2 檢查點(diǎn)/恢復(fù)容錯(cuò)技術(shù)11-12
- 1.1.3 分布式系統(tǒng)的現(xiàn)場失效數(shù)據(jù)12-13
- 1.1.4 分布式系統(tǒng)的錯(cuò)誤相關(guān)性分析13
- 1.2 本文研究內(nèi)容和工作13
- 1.3 本文組織結(jié)構(gòu)13-15
- 第二章 研究現(xiàn)狀及相關(guān)技術(shù)15-22
- 2.1 分布式系統(tǒng)的容錯(cuò)研究現(xiàn)狀15-16
- 2.1.1 全局檢查點(diǎn)容錯(cuò)技術(shù)15
- 2.1.2 消息緩存日志技術(shù)15-16
- 2.2 檢查點(diǎn)/恢復(fù)的容錯(cuò)技術(shù)研究現(xiàn)狀16-20
- 2.2.1 檢查點(diǎn)/恢復(fù)機(jī)制的技術(shù)實(shí)現(xiàn)16-18
- 2.2.2 分布式系統(tǒng)的檢查點(diǎn)/恢復(fù)算法18-19
- 2.2.3 檢查點(diǎn)放置策略研究現(xiàn)狀19-20
- 2.3 系統(tǒng)失效數(shù)據(jù)關(guān)聯(lián)性分析研究現(xiàn)狀20
- 2.3.1 時(shí)間相關(guān)性分析20
- 2.3.2 空間相關(guān)性分析20
- 2.4 尚存在的問題20-21
- 2.5 本章小結(jié)21-22
- 第三章 檢查點(diǎn)/恢復(fù)容錯(cuò)服務(wù)22-35
- 3.1 容錯(cuò)服務(wù)概述22-23
- 3.2 問題建模23-26
- 3.2.1 模型假設(shè)23
- 3.2.2 模型描述與符號(hào)說明23-25
- 3.2.3 問題描述25-26
- 3.3 事件關(guān)聯(lián)性分析與系統(tǒng)節(jié)點(diǎn)分組26-29
- 3.3.1 事件相關(guān)性分析26-28
- 3.3.2 系統(tǒng)節(jié)點(diǎn)分組28-29
- 3.4 相關(guān)節(jié)點(diǎn)事件合并與系統(tǒng)事件合并29-30
- 3.5 主動(dòng)檢查點(diǎn)周期求解30-33
- 3.6 容錯(cuò)服務(wù)檢查點(diǎn)放置策略33-34
- 3.7 本章小結(jié)34-35
- 第四章 檢查點(diǎn)/恢復(fù)容錯(cuò)服務(wù)實(shí)現(xiàn)35-39
- 4.1 單進(jìn)程檢查點(diǎn)/恢復(fù)的實(shí)現(xiàn)35-37
- 4.2 分布式系統(tǒng)檢查點(diǎn)/恢復(fù)原型系統(tǒng)37-38
- 4.3 本章小結(jié)38-39
- 第五章 檢查點(diǎn)/恢復(fù)容錯(cuò)服務(wù)的實(shí)驗(yàn)分析39-54
- 5.1 實(shí)驗(yàn)方法39-40
- 5.2 實(shí)驗(yàn)環(huán)境40
- 5.3 FTA事件格式分析以及數(shù)據(jù)預(yù)處理40-43
- 5.4 模型參數(shù)的評(píng)估以及合理性分析43-48
- 5.4.1 時(shí)間窗參數(shù)θ值評(píng)估43-44
- 5.4.2 關(guān)聯(lián)度閾值Tconst評(píng)估44-46
- 5.4.3 擬合參數(shù)M評(píng)估46-47
- 5.4.4 檢查點(diǎn)代價(jià)Tgcp評(píng)估47
- 5.4.5 回退因子K評(píng)估47-48
- 5.5 Liu-Raga檢查點(diǎn)策略參數(shù)評(píng)估48-51
- 5.6 實(shí)驗(yàn)結(jié)果與分析51-53
- 5.7 本章小結(jié)53-54
- 第六章 總結(jié)及未來工作54-55
- 6.1 總結(jié)54
- 6.2 未來工作54-55
- 致謝55-56
- 參考文獻(xiàn)56-58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉玉華;分布式系統(tǒng)[J];微電子學(xué)與計(jì)算機(jī);1983年05期
2 杜興,謝立,孫鐘秀;一種基于對(duì)象的分布式系統(tǒng)描述求精方法[J];計(jì)算機(jī)學(xué)報(bào);1994年07期
3 趙宏;;分布式系統(tǒng)中合作進(jìn)程及其同步關(guān)系[J];計(jì)算機(jī)科學(xué);1995年02期
4 柴振榮;分布式系統(tǒng)的管理問題[J];管理科學(xué)文摘;1996年06期
5 歲豐;對(duì)分布式系統(tǒng)項(xiàng)目的領(lǐng)導(dǎo)[J];管理科學(xué)文摘;1996年12期
6 李斌;解決科學(xué)問題的分布式系統(tǒng)[J];管理科學(xué)文摘;1997年02期
7 楊運(yùn)偉,張戈,高建華;分布式系統(tǒng)中的投票協(xié)議[J];計(jì)算機(jī)應(yīng)用研究;2000年08期
8 徐海云;部件對(duì)象技術(shù)與分布式系統(tǒng)的開發(fā)[J];濟(jì)南交通高等專科學(xué)校學(xué)報(bào);2001年01期
9 唐少先,陳建二;分布式系統(tǒng)中有向流的最優(yōu)調(diào)控算法[J];計(jì)算技術(shù)與自動(dòng)化;2001年03期
10 錢斌,徐海云;部件對(duì)象技術(shù)與分布式系統(tǒng)的開發(fā)[J];管理信息系統(tǒng);2001年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 許趙云;黃林鵬;;分布式系統(tǒng)動(dòng)態(tài)更新的研究[A];2007年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2007年
2 殷躍鵬;郭長國;李小玲;王懷民;;基于事件的分布式系統(tǒng)行為分析框架[A];2010年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年
3 王曉鵬;蘇亮;韓偉紅;周斌;;大型分布式系統(tǒng)部署一致性的研究與實(shí)現(xiàn)[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
4 何明;裘杭萍;楊飛;劉勇;;基于可信分布式系統(tǒng)的可信認(rèn)證技術(shù)研究[A];全國計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十三卷)[C];2008年
5 王剛;喬純捷;王躍科;;基于時(shí)鐘同步的分布式系統(tǒng)一致全局狀態(tài)[A];第三屆全國虛擬儀器大會(huì)論文集[C];2008年
6 周方;周光霞;;分布式系統(tǒng)軟件可靠性評(píng)估的研究[A];2005第二屆電子信息系統(tǒng)質(zhì)量與可靠性學(xué)術(shù)研討會(huì)論文集[C];2005年
7 馮錫煒;賈傳熒;楊家軒;;JMS技術(shù)在分布式系統(tǒng)中的應(yīng)用與實(shí)現(xiàn)[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國Java技術(shù)及應(yīng)用大會(huì)文集[C];2007年
8 蔣勇;李光文;張若文;;多業(yè)務(wù)數(shù)字分布式系統(tǒng)(MDAS)及其應(yīng)用[A];四川省通信學(xué)會(huì)2013年學(xué)術(shù)年會(huì)論文集[C];2013年
9 徐長盛;高欣;;分布式系統(tǒng)與Ice[A];全國冶金自動(dòng)化信息網(wǎng)2009年會(huì)論文集[C];2009年
10 劉淵;姜建國;繆繼東;范曉嵐;;一個(gè)分布式系統(tǒng)通信控制軟件的設(shè)計(jì)與實(shí)現(xiàn)[A];中國工程物理研究院科技年報(bào)(2002)[C];2002年
中國重要報(bào)紙全文數(shù)據(jù)庫 前6條
1 撫蘇;大數(shù)據(jù)帶來價(jià)值[N];電腦報(bào);2013年
2 ;首席“云”官[N];中國計(jì)算機(jī)報(bào);2009年
3 本報(bào)記者 黃舍予;得“數(shù)據(jù)”者得天下[N];人民郵電;2012年
4 范范 編譯;Docker威力:輕松化解“云鎖定”[N];網(wǎng)絡(luò)世界;2014年
5 ;IBM改進(jìn)大機(jī)管理[N];網(wǎng)絡(luò)世界;2006年
6 首都經(jīng)濟(jì)貿(mào)易大學(xué) 金勇;用Java和XML構(gòu)建分布式系統(tǒng)[N];計(jì)算機(jī)世界;2002年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 鄭紅;分布式系統(tǒng)形式化建模技術(shù)研究[D];中國科學(xué)院研究生院(軟件研究所);2003年
2 尚慶紅;半分布式系統(tǒng)資源發(fā)現(xiàn)與資源分配研究[D];電子科技大學(xué);2013年
3 王德俊;面向服務(wù)的分布式系統(tǒng)動(dòng)態(tài)更新研究[D];上海交通大學(xué);2010年
4 陳曉江;分布式系統(tǒng)軟件體系結(jié)構(gòu)建模與開發(fā)方法研究[D];西北大學(xué);2010年
5 何盼;面向可靠性優(yōu)化設(shè)計(jì)的分布式系統(tǒng)資源分配研究[D];重慶大學(xué);2012年
6 唐小勇;異構(gòu)并行分布式系統(tǒng)可信調(diào)度理論與方法研究[D];湖南大學(xué);2013年
7 龔奕利;分布式環(huán)境中的資源發(fā)現(xiàn)研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
8 彭艦;基于CORBA的分布式系統(tǒng)中實(shí)時(shí)—容錯(cuò)性的研究——分布式系統(tǒng)中動(dòng)態(tài)調(diào)度的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2004年
9 劉國良;分布式系統(tǒng)中回卷恢復(fù)技術(shù)研究[D];重慶大學(xué);2012年
10 閔帆;基于試探的任務(wù)分配算法研究[D];電子科技大學(xué);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 遲云飛;基于分布式控制架構(gòu)的信號(hào)機(jī)設(shè)計(jì)研究[D];長安大學(xué);2015年
2 高文;基于DDS的分布式系統(tǒng)的建模與仿真[D];東南大學(xué);2015年
3 冒佳明;基于DDS的分布式系統(tǒng)的性能評(píng)估模型研究與實(shí)現(xiàn)[D];東南大學(xué);2015年
4 周永江;分布式系統(tǒng)結(jié)構(gòu)可發(fā)育模型研究[D];東華大學(xué);2013年
5 陳均滔;分布式角色協(xié)同控制系統(tǒng)stage的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2016年
6 趙立斌;分布式MongoDB集群高可用性的研究和性能優(yōu)化[D];電子科技大學(xué);2016年
7 黃志勇;分布式系統(tǒng)中基于檢查點(diǎn)容錯(cuò)服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)[D];東南大學(xué);2016年
8 殷躍鵬;基于事件的分布式系統(tǒng)行為分析框架的設(shè)計(jì)與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2010年
9 胡俊;構(gòu)建分布式系統(tǒng)的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];南京郵電大學(xué);2012年
10 謝志海;分布式系統(tǒng)測試關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2013年
本文關(guān)鍵詞:分布式系統(tǒng)中基于檢查點(diǎn)容錯(cuò)服務(wù)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):264107
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/264107.html