并行分布式網絡模擬器PDNS容錯技術的研究
發(fā)布時間:2023-05-26 19:41
網絡模擬,是研究網絡行為、評估協(xié)議性能的重要方式。PDNS是應用非常廣泛的一個并行分布式網絡模擬器。然而,PDNS也面臨著分布式應用難以回避的系統(tǒng)可靠性方面的缺陷。檢查點/卷回恢復技術是實現系統(tǒng)容錯的重要手段。通過在系統(tǒng)正常運行過程中設置檢查點,保存任務的相關狀態(tài)。在程序崩潰后,可以根據檢查點文件中所記錄的系統(tǒng)及進程的信息,將進程卷回至最近保存的正常運行狀態(tài)繼續(xù)執(zhí)行,而不必重啟任務,從而節(jié)省了大量的重復計算時間。 本文主要研究使用檢查點/卷回恢復技術來提高PDNS的容錯能力。分布式檢查算法以單進程檢查點算法為基礎,對于PDNS而言,則需要首先實現分布式模擬中單個模擬進程的檢查點容錯。文章分析比較了單進程檢查點算法不同實現層次之間的優(yōu)缺點,然后基于Condor實現了用戶級透明檢查點。文章通過實驗對該單進程檢查點的性能進行了測試,并分析了其時空開銷的規(guī)律。 PDNS檢查點容錯需要解決的第二個問題是如何備份恢復各個模擬節(jié)點之間的連接。在局域網中,PDNS通過TCP完成各個節(jié)點之間的交互。因此,文章對Linux中TCP連接通信過程進行了分析,在此基礎上采用可裝載內核模塊的方式實現了PDNS各個...
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景
1.2 國內外研究現狀
1.2.1 檢查點簡介
1.2.2 成型的檢查點系統(tǒng)
1.3 本文的研究內容與組織結構
第2章 PDNS與檢查點恢復技術
2.1 并行分布式網絡模擬器PDNS
2.1.1 PDNS簡介
2.1.2 PDNS檢查點容錯需解決的問題
2.2 分布式檢查點算法
2.2.1 基本概念
2.2.2 異步檢查點算法
2.2.3 同步檢查點算法
2.3 檢查點性能
2.3.1 評價檢查點性能的指標
2.3.2 改善檢查點性能的策略
2.4 本章小結
第3章 PDNS中單模擬節(jié)點容錯的實現
3.1 用戶級非透明檢查點
3.2 Condor的用戶級透明檢查點機制
3.3 基于Condor的NS-2 檢查點實現
3.3.1 使用Condor檢查點庫
3.3.2 對NS-2 的修改
3.4 實驗分析
3.5 本章小結
第4章 PDNS中 TCP連接的備份與恢復
4.1 Linux 內核中套接字實現的分析
4.1.1 Linux 套接字層
4.1.2 Linux TCP 套接字通信過程分析
4.2 TCP 套接字狀態(tài)的獲取
4.2.1 TCP 連接套接字的狀態(tài)
4.2.2 TCP 監(jiān)聽套接字的狀態(tài)
4.2.3 接收與發(fā)送數據的狀態(tài)
4.3 PDNS 中TCP 連接的備份與恢復
4.3.1 主要數據結構
4.3.2 程序流程
4.4 本章小結
第5章 PDNS 檢查點容錯系統(tǒng)
5.1 PDNS 分布式檢查點算法
5.1.1 Sync-and-Stop 算法
5.1.2 Chandy-Lamport 算法
5.1.3 PDNS 檢查點算法選擇
5.2 PDNS 檢查點容錯系統(tǒng)原型
5.2.1 相關函數介紹
5.2.2 PDNS 中SNS 算法的實現
5.2.3 PDNS 檢查點卷回恢復
5.2.4 進一步的討論
5.3 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的學術論文
致謝
本文編號:3823165
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景
1.2 國內外研究現狀
1.2.1 檢查點簡介
1.2.2 成型的檢查點系統(tǒng)
1.3 本文的研究內容與組織結構
第2章 PDNS與檢查點恢復技術
2.1 并行分布式網絡模擬器PDNS
2.1.1 PDNS簡介
2.1.2 PDNS檢查點容錯需解決的問題
2.2 分布式檢查點算法
2.2.1 基本概念
2.2.2 異步檢查點算法
2.2.3 同步檢查點算法
2.3 檢查點性能
2.3.1 評價檢查點性能的指標
2.3.2 改善檢查點性能的策略
2.4 本章小結
第3章 PDNS中單模擬節(jié)點容錯的實現
3.1 用戶級非透明檢查點
3.2 Condor的用戶級透明檢查點機制
3.3 基于Condor的NS-2 檢查點實現
3.3.1 使用Condor檢查點庫
3.3.2 對NS-2 的修改
3.4 實驗分析
3.5 本章小結
第4章 PDNS中 TCP連接的備份與恢復
4.1 Linux 內核中套接字實現的分析
4.1.1 Linux 套接字層
4.1.2 Linux TCP 套接字通信過程分析
4.2 TCP 套接字狀態(tài)的獲取
4.2.1 TCP 連接套接字的狀態(tài)
4.2.2 TCP 監(jiān)聽套接字的狀態(tài)
4.2.3 接收與發(fā)送數據的狀態(tài)
4.3 PDNS 中TCP 連接的備份與恢復
4.3.1 主要數據結構
4.3.2 程序流程
4.4 本章小結
第5章 PDNS 檢查點容錯系統(tǒng)
5.1 PDNS 分布式檢查點算法
5.1.1 Sync-and-Stop 算法
5.1.2 Chandy-Lamport 算法
5.1.3 PDNS 檢查點算法選擇
5.2 PDNS 檢查點容錯系統(tǒng)原型
5.2.1 相關函數介紹
5.2.2 PDNS 中SNS 算法的實現
5.2.3 PDNS 檢查點卷回恢復
5.2.4 進一步的討論
5.3 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的學術論文
致謝
本文編號:3823165
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3823165.html