高可用服務(wù)器故障管理板的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:高可用服務(wù)器故障管理板的設(shè)計(jì)與實(shí)現(xiàn) 出處:《哈爾濱工業(yè)大學(xué)》2012年碩士論文 論文類(lèi)型:學(xué)位論文
更多相關(guān)文章: 高可用 自主計(jì)算 故障管理
【摘要】:服務(wù)器已經(jīng)被廣泛應(yīng)用于電信、銀行、航天、氣象、軍事等領(lǐng)域。在這些領(lǐng)域中,服務(wù)器作為關(guān)鍵設(shè)備承擔(dān)著主要的工作任務(wù)。但是無(wú)論是在航天、軍事等國(guó)防領(lǐng)域還是在電信、銀行等民用領(lǐng)域,決定這些行業(yè)選擇服務(wù)器的一個(gè)重要因素就是服務(wù)器的可用性。如何保證服務(wù)器的可用性,保障其持續(xù)工作的能力已經(jīng)成為人們的重要研究課題。 服務(wù)器的管理是保證服務(wù)器可用性的關(guān)鍵,為實(shí)現(xiàn)服務(wù)器的有效管理,設(shè)計(jì)了高可用服務(wù)器故障管理平臺(tái)。本文結(jié)合故障管理的一般過(guò)程,分析了自主計(jì)算的相關(guān)概念和管理模型,,討論了故障管理中需要解決的問(wèn)題,并對(duì)故障監(jiān)控、故障診斷和故障恢復(fù)等技術(shù)進(jìn)行了研究。在此基礎(chǔ)上,論文針對(duì)具有分布式結(jié)構(gòu)的高可用目標(biāo)系統(tǒng)設(shè)計(jì)了故障管理方案,采用雙層架構(gòu)實(shí)現(xiàn)服務(wù)器故障管理平臺(tái)對(duì)服務(wù)器進(jìn)行管理。管理平臺(tái)由本地管理模塊LMM和全局管理模塊GMM組成。LMM對(duì)應(yīng)于每個(gè)節(jié)點(diǎn),負(fù)責(zé)直接對(duì)計(jì)算節(jié)點(diǎn)的狀態(tài)進(jìn)行監(jiān)控;全局有兩個(gè)GMM,負(fù)責(zé)對(duì)LMM收集的狀態(tài)信息進(jìn)行分析、診斷,然后對(duì)故障進(jìn)行恢復(fù)。 本文設(shè)計(jì)實(shí)現(xiàn)了服務(wù)器故障管理的硬件平臺(tái),并在其基礎(chǔ)上設(shè)計(jì)了服務(wù)器故障管理的軟件框架,結(jié)合硬件平臺(tái),實(shí)現(xiàn)了服務(wù)器狀態(tài)信息的采集功能,包括從帶內(nèi)和帶外兩方面角度對(duì)服務(wù)器的狀態(tài)進(jìn)行采集;研究了故障定位和故障診斷的過(guò)程,實(shí)現(xiàn)了故障診斷的基本功能;制定了部分故障的管理策略;提供了用戶(hù)遠(yuǎn)程管理的接口。最后本文對(duì)管理平臺(tái)的功能做了簡(jiǎn)單的測(cè)試。
[Abstract]:The server has been widely used in the fields of telecom , banking , aerospace , meteorology , military , etc . In these fields , the server plays the main task as a key equipment . However , it is an important factor to determine the server availability in the fields of defense , such as space , military and other civilian areas . How to guarantee the availability of the server and guarantee the ability of its continuing work has become an important research topic . The management of the server is the key to ensure the availability of the server . In order to realize the effective management of the server , a high - availability server fault management platform is designed . Based on the general process of fault management , the paper analyzes the relevant concepts and management models of the self - calculation , discusses the problems that need to be solved in the fault management , and controls the fault monitoring , fault diagnosis and fault recovery . The management platform is composed of the local management module LMM and the global management module gmm . The management platform is composed of the local management module LMM and the global management module gmm . The management platform is composed of a local management module LMM and a global management module gmm . The management platform is composed of a local management module LMM and a global management module gmm . In this paper , the hardware platform of server fault management is designed , and the software framework of server fault management is designed on the basis of it , and the collection function of server state information is realized by combining hardware platform . The fault location and fault diagnosis process is researched , the basic function of fault diagnosis is realized , and the interface of remote management is provided . Finally , the function of management platform is tested .
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類(lèi)號(hào)】:TP368.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 彭鋼;關(guān)于知識(shí)推理的幾種常用不精確推理模型的探討[J];廣州師院學(xué)報(bào)(自然科學(xué)版);1998年07期
2 樊麗萍,袁愛(ài)進(jìn);COTS技術(shù)在遠(yuǎn)程技術(shù)支持系統(tǒng)中的應(yīng)用[J];電力自動(dòng)化設(shè)備;2005年07期
3 蔡桂芳;;基于模糊神經(jīng)網(wǎng)絡(luò)的故障預(yù)測(cè)方法研究[J];機(jī)電產(chǎn)品開(kāi)發(fā)與創(chuàng)新;2008年04期
4 張海俊;史忠植;;自主計(jì)算環(huán)境[J];計(jì)算機(jī)工程;2006年07期
5 劉文潔;李戰(zhàn)懷;;虛擬化技術(shù)在基于自律計(jì)算的高可用性系統(tǒng)中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2006年02期
6 樊星;李戰(zhàn)懷;劉全中;;服務(wù)器系統(tǒng)管理的自律計(jì)算模型[J];計(jì)算機(jī)應(yīng)用;2006年03期
7 胡偉;秦開(kāi)懷;袁國(guó)棟;;集群繪制系統(tǒng)中的自主計(jì)算[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年07期
8 廖備水;李石堅(jiān);姚遠(yuǎn);高濟(jì);;自主計(jì)算概念模型與實(shí)現(xiàn)方法[J];軟件學(xué)報(bào);2008年04期
9 于治樓;陳乃闊;牛玉峰;;基于IPMI的服務(wù)器遠(yuǎn)程管理的研究與實(shí)現(xiàn)[J];信息技術(shù)與信息化;2010年01期
10 李云春;張德生;李強(qiáng);;基于自主計(jì)算的集群管理軟件的設(shè)計(jì)與實(shí)現(xiàn)[J];中山大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期
本文編號(hào):1405264
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1405264.html