天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

高性能服務(wù)器故障診斷方法的研究與設(shè)計

發(fā)布時間:2020-10-26 15:38
   高性能服務(wù)器的應(yīng)用領(lǐng)域越來越廣,目前已經(jīng)廣泛應(yīng)用于銀行、軍事、航天、氣象服務(wù)等領(lǐng)域。在這些領(lǐng)域中,高性能服務(wù)器都是用來處理關(guān)鍵的業(yè)務(wù),系統(tǒng)數(shù)據(jù)丟失或者異常停機都會造成嚴(yán)重的后果。因此對高性能服務(wù)器的可用性提出了很高的要求。高可用性需要高效的故障檢測、故障診斷、故障恢復(fù)等技術(shù)來實現(xiàn)。 高性能服務(wù)器一般都采用集群的形式實現(xiàn),因為集群在價格、可擴展性等方面都要比其他形式的系統(tǒng)有明顯的優(yōu)勢。本文主要針對高性能集群服務(wù)器系統(tǒng)研究一種基于操作系統(tǒng)的快速高效的故障診斷方法。從系統(tǒng)可以提供不間斷服務(wù)的角度出發(fā),研究針對故障診斷的系統(tǒng)監(jiān)控方法,即故障監(jiān)控方法。在故障監(jiān)控的基礎(chǔ)上,研究故障診斷的方法。目標(biāo)是盡可能小的系統(tǒng)開銷,盡可能大的故障檢測覆蓋率。 實現(xiàn)了服務(wù)級和節(jié)點級的診斷粒度。整個診斷從流程上分為故障監(jiān)控和故障診斷,從實現(xiàn)的診斷粒度上分為了單機故障診斷和系統(tǒng)級故障診斷。能夠監(jiān)控到節(jié)點的硬件狀態(tài)信息,如CPU、內(nèi)存、網(wǎng)絡(luò)設(shè)備、電源等;能夠監(jiān)控基于linux的操作系統(tǒng)中的各種進程的信息,包括核心系統(tǒng)服務(wù)進程,用戶配置的進程等。從可用性角度設(shè)計了針對不同監(jiān)控信息的診斷規(guī)則,實現(xiàn)了單機故障的快速診斷。對整個集群系統(tǒng)設(shè)計了心跳模塊以及系統(tǒng)級的故障診斷。通過設(shè)計的心跳機制可以確定其他節(jié)點是否故障。通過單機故障診斷和系統(tǒng)級故障診斷的配合能夠快速的診斷出故障的節(jié)點,達到集群中所有節(jié)點對故障狀態(tài)的一致性描述。通過整個診斷系統(tǒng),能夠準(zhǔn)確及時的獲得診斷結(jié)果,及時的將故障節(jié)點隔離出系統(tǒng),進而提高系統(tǒng)的可用性。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2011
【中圖分類】:TP368.5
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題背景
    1.2 高可用技術(shù)概況
        1.2.1 可用性與可靠性
        1.2.2 冗余技術(shù)
        1.2.3 集群技術(shù)
        1.2.4 故障檢測技術(shù)
        1.2.5 故障恢復(fù)技術(shù)
    1.3 本文組織結(jié)構(gòu)
第2章 故障診斷關(guān)鍵技術(shù)研究
    2.1 引言
    2.2 集群系統(tǒng)
    2.3 系統(tǒng)監(jiān)控技術(shù)
        2.3.1 基于命令行的信息采集技術(shù)
        2.3.2 基于proc 文件系統(tǒng)的信息采集技術(shù)
        2.3.3 基于Linux 內(nèi)核的信息采集技術(shù)
    2.4 故障診斷方法
        2.4.1 系統(tǒng)級故障診斷
        2.4.2 單機故障診斷
    2.5 故障恢復(fù)技術(shù)
    2.6 本章小結(jié)
第3章 高性能服務(wù)器故障診斷方案的設(shè)計
    3.1 引言
    3.2 故障集
    3.3 故障診斷總體框架
    3.4 高性能服務(wù)器單機自診斷的設(shè)計
        3.4.1 單機故障監(jiān)控模塊的設(shè)計
        3.4.2 單機故障診斷模塊的設(shè)計
    3.5 高性能服務(wù)器系統(tǒng)級故障診斷的設(shè)計
        3.5.1 心跳模塊的設(shè)計
        3.5.2 系統(tǒng)級故障診斷模塊的設(shè)計
    3.6 本章小結(jié)
第4章 高性能服務(wù)器故障診斷方案的實現(xiàn)及實驗結(jié)果分析
    4.1 單機自診斷的實現(xiàn)
        4.1.1 單機故障監(jiān)控模塊的實現(xiàn)
        4.1.2 單機故障診斷模塊的實現(xiàn)
    4.2 系統(tǒng)級故障診斷的實現(xiàn)
        4.2.1 心跳模塊的實現(xiàn)
        4.2.2 系統(tǒng)級故障診斷模塊的實現(xiàn)
    4.3 實驗及結(jié)果分析
    4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝

【參考文獻】

相關(guān)期刊論文 前10條

1 張穎;李義杰;包劍;;計算機容錯技術(shù)的研究與應(yīng)用[J];遼寧工程技術(shù)大學(xué)學(xué)報;2004年S1期

2 李東亮;王;;;基于/proc文件系統(tǒng)及對內(nèi)核信息的獲取[J];河北工程大學(xué)學(xué)報(自然科學(xué)版);2007年02期

3 郭松;謝維波;;Linux下Proc文件系統(tǒng)的編程剖析[J];華僑大學(xué)學(xué)報(自然科學(xué)版);2010年05期

4 魏東林,盧正鼎,董俊,聶嵐;在用戶空間擴展Linux操作系統(tǒng)功能方法研究[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2002年07期

5 郭立,金海,韓宗芬;集群系統(tǒng)的單一系統(tǒng)映像研究[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2003年04期

6 董劍;左德承;劉宏偉;楊孝宗;任瀟;;一種基于無效鏈路的分布式故障診斷一致性協(xié)議[J];計算機研究與發(fā)展;2007年06期

7 左德承,楊孝宗,高巍;基于非完備性測試的一種分布式計算機系統(tǒng)診斷算法的設(shè)計[J];計算機工程與應(yīng)用;2001年03期

8 謝斌,高揚;Linux高可用集群心跳機制研究[J];計算機工程與應(yīng)用;2004年01期

9 牛峰,胡昌振;內(nèi)核信息獲取的通信方法[J];計算機工程;2003年08期

10 楊建軍,劉雄;基于Unix的負(fù)載均衡集群方案設(shè)計[J];計算機工程與設(shè)計;2005年07期


相關(guān)博士學(xué)位論文 前1條

1 陽惠;系統(tǒng)級故障診斷算法研究[D];重慶大學(xué);2009年


相關(guān)碩士學(xué)位論文 前1條

1 陳熠;大規(guī)模機群監(jiān)控系統(tǒng)的研究與實現(xiàn)[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年



本文編號:2857184

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2857184.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb64a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com