面向事務(wù)存儲(chǔ)系統(tǒng)的容錯(cuò)技術(shù)研究
發(fā)布時(shí)間:2020-12-05 13:23
隨著多核處理器的發(fā)展,事務(wù)存儲(chǔ)作為一種有潛力的并發(fā)控制機(jī)制受到了越來越多的關(guān)注。另一方面,隨著大規(guī)模集成電路的發(fā)展進(jìn)入深亞微米級甚至納米級,處理器更容易受電磁輻射、宇宙射線以及其它干擾源的影響,這使得處理器的可靠性問題變得日益突出。因此事務(wù)存儲(chǔ)機(jī)制下的容錯(cuò)問題也將逐漸成為一個(gè)值得關(guān)注的問題。本文針對事務(wù)存儲(chǔ)系統(tǒng)下的容錯(cuò)問題展開研究,以事務(wù)存儲(chǔ)系統(tǒng)中的錯(cuò)誤傳播行為為理論基礎(chǔ),圍繞故障檢測、故障恢復(fù)和故障屏蔽等幾個(gè)關(guān)鍵問題提出了理論方法、技術(shù)方案和實(shí)現(xiàn)框架。本文的主要貢獻(xiàn)如下:1.以基于程序語句序列的語句間的錯(cuò)誤傳播行為為始,層層遞進(jìn)的分析了錯(cuò)誤在事務(wù)存儲(chǔ)系統(tǒng)中的傳播行為。通過對事務(wù)自身的屬性和特點(diǎn)的分析,針對容錯(cuò)位置和容錯(cuò)對象集合這兩個(gè)容錯(cuò)技術(shù)主要關(guān)心的信息,給出了事務(wù)存儲(chǔ)系統(tǒng)中兩類天然的容錯(cuò)位置及對應(yīng)的容錯(cuò)對象集合,并證明了其所具有的不同的容錯(cuò)能力,從理論上揭示了事務(wù)存儲(chǔ)系統(tǒng)天然的容錯(cuò)特性。2.提出了基于事務(wù)冗余的錯(cuò)誤檢測方法——EDRT錯(cuò)誤檢測方法。該方法為事務(wù)創(chuàng)建冗余副本,并同時(shí)執(zhí)行事務(wù)及其副本,通過在提交前比較兩事務(wù)的寫集合實(shí)現(xiàn)了低錯(cuò)誤檢測開銷的基于冗余事務(wù)的錯(cuò)誤檢測方法。此外,...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:148 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.1.1 事務(wù)存儲(chǔ)的興起
1.1.2 微處理器的可靠性問題
1.2 事務(wù)存儲(chǔ)系統(tǒng)
1.2.1 事務(wù)存儲(chǔ)系統(tǒng)的基本概念和分類
1.2.2 事務(wù)存儲(chǔ)系統(tǒng)的實(shí)現(xiàn)
1.3 可靠性及容錯(cuò)研究基礎(chǔ)
1.3.1 系統(tǒng)可靠性的影響因素
1.3.2 容錯(cuò)技術(shù)
1.4 相關(guān)工作
1.4.1 故障檢測技術(shù)
1.4.2 故障恢復(fù)技術(shù)
1.4.3 故障屏蔽技術(shù)
1.4.4 基于事務(wù)存儲(chǔ)的容錯(cuò)技術(shù)
1.5 本文的研究內(nèi)容及主要?jiǎng)?chuàng)新點(diǎn)
1.5.1 本文的研究內(nèi)容
1.5.2 本文的創(chuàng)新點(diǎn)
1.6 論文結(jié)構(gòu)
第二章 錯(cuò)誤在事務(wù)存儲(chǔ)系統(tǒng)中的傳播行為分析
2.1 程序語句間的錯(cuò)誤傳播
2.1.1 語句間的錯(cuò)誤傳播
2.1.2 任務(wù)段的錯(cuò)誤隔離
2.2 事務(wù)間的錯(cuò)誤傳播
2.2.1 事務(wù)間的錯(cuò)誤傳播
2.2.2 事務(wù)存儲(chǔ)系統(tǒng)的錯(cuò)誤隔離
2.3 小結(jié)
第三章 基于事務(wù)冗余的錯(cuò)誤檢測
3.1 基于事務(wù)冗余的錯(cuò)誤檢測方法
3.1.1 EDRT 的基本思想
3.1.2 開銷分析
3.1.3 錯(cuò)誤檢測能力分析
3.2 容錯(cuò)日志事務(wù)存儲(chǔ)系統(tǒng):FTLogTM
3.2.1 數(shù)據(jù)比較集
3.2.2 沖突檢測機(jī)制
3.3 容錯(cuò)緩存事務(wù)存儲(chǔ)系統(tǒng):FTBufTM
3.3.1 數(shù)據(jù)比較集
3.3.2 沖突檢測機(jī)制
3.4 實(shí)驗(yàn)與評測
3.4.1 實(shí)驗(yàn)方法
3.4.2 實(shí)驗(yàn)結(jié)果
3.5 小結(jié)
第四章 基于事務(wù)回退的故障恢復(fù)
4.1 基于FRTR 的容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)
4.1.1 FRTR 的基本思想
4.1.2 一個(gè)例子
4.1.3 FRTR 的開銷分析
4.2 容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)的隔離性
4.2.1 基于Eager 沖突檢測機(jī)制的容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)的隔離性
4.2.2 基于Lazy 沖突檢測機(jī)制的容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)的隔離性
4.2.3 FRTR 對故障恢復(fù)的充分性
4.3 實(shí)驗(yàn)與評測
4.3.1 實(shí)驗(yàn)方法
4.3.2 實(shí)驗(yàn)結(jié)果
4.4 事務(wù)存儲(chǔ)系統(tǒng)中基于并行復(fù)算的故障恢復(fù)
4.4.1 基本思想
4.4.2 針對OpenTM 程序的并行復(fù)算
4.4.3 實(shí)驗(yàn)與評測
4.5 小結(jié)
第五章 基于三模冗余的容錯(cuò)方法
5.1 事務(wù)的三模冗余容錯(cuò)方法:TriTM
5.1.1 TriTM 的基本思想
5.1.2 TriTM 的性能優(yōu)化
5.1.3 TriTM 的比較點(diǎn)設(shè)置
5.2 基于Closed 嵌套事務(wù)的TriTM 的實(shí)現(xiàn)
5.2.1 嵌套事務(wù)存儲(chǔ)系統(tǒng)
5.2.2 TriTM 的實(shí)現(xiàn)
5.3 實(shí)驗(yàn)與評測
5.3.1 實(shí)驗(yàn)方法
5.3.2 實(shí)驗(yàn)結(jié)果
5.4 小結(jié)
第六章 結(jié)論與展望
6.1 工作總結(jié)
6.2 研究展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
作者在學(xué)期間參加的科研項(xiàng)目
本文編號:2899517
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:148 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.1.1 事務(wù)存儲(chǔ)的興起
1.1.2 微處理器的可靠性問題
1.2 事務(wù)存儲(chǔ)系統(tǒng)
1.2.1 事務(wù)存儲(chǔ)系統(tǒng)的基本概念和分類
1.2.2 事務(wù)存儲(chǔ)系統(tǒng)的實(shí)現(xiàn)
1.3 可靠性及容錯(cuò)研究基礎(chǔ)
1.3.1 系統(tǒng)可靠性的影響因素
1.3.2 容錯(cuò)技術(shù)
1.4 相關(guān)工作
1.4.1 故障檢測技術(shù)
1.4.2 故障恢復(fù)技術(shù)
1.4.3 故障屏蔽技術(shù)
1.4.4 基于事務(wù)存儲(chǔ)的容錯(cuò)技術(shù)
1.5 本文的研究內(nèi)容及主要?jiǎng)?chuàng)新點(diǎn)
1.5.1 本文的研究內(nèi)容
1.5.2 本文的創(chuàng)新點(diǎn)
1.6 論文結(jié)構(gòu)
第二章 錯(cuò)誤在事務(wù)存儲(chǔ)系統(tǒng)中的傳播行為分析
2.1 程序語句間的錯(cuò)誤傳播
2.1.1 語句間的錯(cuò)誤傳播
2.1.2 任務(wù)段的錯(cuò)誤隔離
2.2 事務(wù)間的錯(cuò)誤傳播
2.2.1 事務(wù)間的錯(cuò)誤傳播
2.2.2 事務(wù)存儲(chǔ)系統(tǒng)的錯(cuò)誤隔離
2.3 小結(jié)
第三章 基于事務(wù)冗余的錯(cuò)誤檢測
3.1 基于事務(wù)冗余的錯(cuò)誤檢測方法
3.1.1 EDRT 的基本思想
3.1.2 開銷分析
3.1.3 錯(cuò)誤檢測能力分析
3.2 容錯(cuò)日志事務(wù)存儲(chǔ)系統(tǒng):FTLogTM
3.2.1 數(shù)據(jù)比較集
3.2.2 沖突檢測機(jī)制
3.3 容錯(cuò)緩存事務(wù)存儲(chǔ)系統(tǒng):FTBufTM
3.3.1 數(shù)據(jù)比較集
3.3.2 沖突檢測機(jī)制
3.4 實(shí)驗(yàn)與評測
3.4.1 實(shí)驗(yàn)方法
3.4.2 實(shí)驗(yàn)結(jié)果
3.5 小結(jié)
第四章 基于事務(wù)回退的故障恢復(fù)
4.1 基于FRTR 的容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)
4.1.1 FRTR 的基本思想
4.1.2 一個(gè)例子
4.1.3 FRTR 的開銷分析
4.2 容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)的隔離性
4.2.1 基于Eager 沖突檢測機(jī)制的容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)的隔離性
4.2.2 基于Lazy 沖突檢測機(jī)制的容錯(cuò)事務(wù)存儲(chǔ)系統(tǒng)的隔離性
4.2.3 FRTR 對故障恢復(fù)的充分性
4.3 實(shí)驗(yàn)與評測
4.3.1 實(shí)驗(yàn)方法
4.3.2 實(shí)驗(yàn)結(jié)果
4.4 事務(wù)存儲(chǔ)系統(tǒng)中基于并行復(fù)算的故障恢復(fù)
4.4.1 基本思想
4.4.2 針對OpenTM 程序的并行復(fù)算
4.4.3 實(shí)驗(yàn)與評測
4.5 小結(jié)
第五章 基于三模冗余的容錯(cuò)方法
5.1 事務(wù)的三模冗余容錯(cuò)方法:TriTM
5.1.1 TriTM 的基本思想
5.1.2 TriTM 的性能優(yōu)化
5.1.3 TriTM 的比較點(diǎn)設(shè)置
5.2 基于Closed 嵌套事務(wù)的TriTM 的實(shí)現(xiàn)
5.2.1 嵌套事務(wù)存儲(chǔ)系統(tǒng)
5.2.2 TriTM 的實(shí)現(xiàn)
5.3 實(shí)驗(yàn)與評測
5.3.1 實(shí)驗(yàn)方法
5.3.2 實(shí)驗(yàn)結(jié)果
5.4 小結(jié)
第六章 結(jié)論與展望
6.1 工作總結(jié)
6.2 研究展望
致謝
參考文獻(xiàn)
作者在學(xué)期間取得的學(xué)術(shù)成果
作者在學(xué)期間參加的科研項(xiàng)目
本文編號:2899517
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2899517.html
最近更新
教材專著