并行分布式網(wǎng)絡(luò)模擬器PDNS容錯技術(shù)的研究
發(fā)布時間:2023-05-26 19:41
網(wǎng)絡(luò)模擬,是研究網(wǎng)絡(luò)行為、評估協(xié)議性能的重要方式。PDNS是應(yīng)用非常廣泛的一個并行分布式網(wǎng)絡(luò)模擬器。然而,PDNS也面臨著分布式應(yīng)用難以回避的系統(tǒng)可靠性方面的缺陷。檢查點/卷回恢復(fù)技術(shù)是實現(xiàn)系統(tǒng)容錯的重要手段。通過在系統(tǒng)正常運行過程中設(shè)置檢查點,保存任務(wù)的相關(guān)狀態(tài)。在程序崩潰后,可以根據(jù)檢查點文件中所記錄的系統(tǒng)及進(jìn)程的信息,將進(jìn)程卷回至最近保存的正常運行狀態(tài)繼續(xù)執(zhí)行,而不必重啟任務(wù),從而節(jié)省了大量的重復(fù)計算時間。 本文主要研究使用檢查點/卷回恢復(fù)技術(shù)來提高PDNS的容錯能力。分布式檢查算法以單進(jìn)程檢查點算法為基礎(chǔ),對于PDNS而言,則需要首先實現(xiàn)分布式模擬中單個模擬進(jìn)程的檢查點容錯。文章分析比較了單進(jìn)程檢查點算法不同實現(xiàn)層次之間的優(yōu)缺點,然后基于Condor實現(xiàn)了用戶級透明檢查點。文章通過實驗對該單進(jìn)程檢查點的性能進(jìn)行了測試,并分析了其時空開銷的規(guī)律。 PDNS檢查點容錯需要解決的第二個問題是如何備份恢復(fù)各個模擬節(jié)點之間的連接。在局域網(wǎng)中,PDNS通過TCP完成各個節(jié)點之間的交互。因此,文章對Linux中TCP連接通信過程進(jìn)行了分析,在此基礎(chǔ)上采用可裝載內(nèi)核模塊的方式實現(xiàn)了PDNS各個...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 檢查點簡介
1.2.2 成型的檢查點系統(tǒng)
1.3 本文的研究內(nèi)容與組織結(jié)構(gòu)
第2章 PDNS與檢查點恢復(fù)技術(shù)
2.1 并行分布式網(wǎng)絡(luò)模擬器PDNS
2.1.1 PDNS簡介
2.1.2 PDNS檢查點容錯需解決的問題
2.2 分布式檢查點算法
2.2.1 基本概念
2.2.2 異步檢查點算法
2.2.3 同步檢查點算法
2.3 檢查點性能
2.3.1 評價檢查點性能的指標(biāo)
2.3.2 改善檢查點性能的策略
2.4 本章小結(jié)
第3章 PDNS中單模擬節(jié)點容錯的實現(xiàn)
3.1 用戶級非透明檢查點
3.2 Condor的用戶級透明檢查點機(jī)制
3.3 基于Condor的NS-2 檢查點實現(xiàn)
3.3.1 使用Condor檢查點庫
3.3.2 對NS-2 的修改
3.4 實驗分析
3.5 本章小結(jié)
第4章 PDNS中 TCP連接的備份與恢復(fù)
4.1 Linux 內(nèi)核中套接字實現(xiàn)的分析
4.1.1 Linux 套接字層
4.1.2 Linux TCP 套接字通信過程分析
4.2 TCP 套接字狀態(tài)的獲取
4.2.1 TCP 連接套接字的狀態(tài)
4.2.2 TCP 監(jiān)聽套接字的狀態(tài)
4.2.3 接收與發(fā)送數(shù)據(jù)的狀態(tài)
4.3 PDNS 中TCP 連接的備份與恢復(fù)
4.3.1 主要數(shù)據(jù)結(jié)構(gòu)
4.3.2 程序流程
4.4 本章小結(jié)
第5章 PDNS 檢查點容錯系統(tǒng)
5.1 PDNS 分布式檢查點算法
5.1.1 Sync-and-Stop 算法
5.1.2 Chandy-Lamport 算法
5.1.3 PDNS 檢查點算法選擇
5.2 PDNS 檢查點容錯系統(tǒng)原型
5.2.1 相關(guān)函數(shù)介紹
5.2.2 PDNS 中SNS 算法的實現(xiàn)
5.2.3 PDNS 檢查點卷回恢復(fù)
5.2.4 進(jìn)一步的討論
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號:3823165
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 檢查點簡介
1.2.2 成型的檢查點系統(tǒng)
1.3 本文的研究內(nèi)容與組織結(jié)構(gòu)
第2章 PDNS與檢查點恢復(fù)技術(shù)
2.1 并行分布式網(wǎng)絡(luò)模擬器PDNS
2.1.1 PDNS簡介
2.1.2 PDNS檢查點容錯需解決的問題
2.2 分布式檢查點算法
2.2.1 基本概念
2.2.2 異步檢查點算法
2.2.3 同步檢查點算法
2.3 檢查點性能
2.3.1 評價檢查點性能的指標(biāo)
2.3.2 改善檢查點性能的策略
2.4 本章小結(jié)
第3章 PDNS中單模擬節(jié)點容錯的實現(xiàn)
3.1 用戶級非透明檢查點
3.2 Condor的用戶級透明檢查點機(jī)制
3.3 基于Condor的NS-2 檢查點實現(xiàn)
3.3.1 使用Condor檢查點庫
3.3.2 對NS-2 的修改
3.4 實驗分析
3.5 本章小結(jié)
第4章 PDNS中 TCP連接的備份與恢復(fù)
4.1 Linux 內(nèi)核中套接字實現(xiàn)的分析
4.1.1 Linux 套接字層
4.1.2 Linux TCP 套接字通信過程分析
4.2 TCP 套接字狀態(tài)的獲取
4.2.1 TCP 連接套接字的狀態(tài)
4.2.2 TCP 監(jiān)聽套接字的狀態(tài)
4.2.3 接收與發(fā)送數(shù)據(jù)的狀態(tài)
4.3 PDNS 中TCP 連接的備份與恢復(fù)
4.3.1 主要數(shù)據(jù)結(jié)構(gòu)
4.3.2 程序流程
4.4 本章小結(jié)
第5章 PDNS 檢查點容錯系統(tǒng)
5.1 PDNS 分布式檢查點算法
5.1.1 Sync-and-Stop 算法
5.1.2 Chandy-Lamport 算法
5.1.3 PDNS 檢查點算法選擇
5.2 PDNS 檢查點容錯系統(tǒng)原型
5.2.1 相關(guān)函數(shù)介紹
5.2.2 PDNS 中SNS 算法的實現(xiàn)
5.2.3 PDNS 檢查點卷回恢復(fù)
5.2.4 進(jìn)一步的討論
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號:3823165
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3823165.html
最近更新
教材專著