天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 組織管理論文 >

云服務(wù)基礎(chǔ)設(shè)施中故障診斷與識(shí)別策略管理研究

發(fā)布時(shí)間:2020-05-11 23:24
【摘要】:大型云服務(wù)基礎(chǔ)設(shè)施經(jīng)常出現(xiàn)故障,這成為了其管理成本的主要組成部分,并會(huì)導(dǎo)致托管服務(wù)違反服務(wù)級(jí)別協(xié)議(SLA)。近年來(lái),各主要云服務(wù)提供商,包括IBM、亞馬遜和谷歌的云服務(wù)基礎(chǔ)設(shè)施數(shù)量出現(xiàn)了前所未有的增長(zhǎng)。使云計(jì)算服務(wù)具有如此吸引力的一些獨(dú)特特性包括:無(wú)限可用的資源池、靈活的規(guī)模經(jīng)濟(jì)、多租戶(hù)和自組織特性,這些特性將云服務(wù)與傳統(tǒng)的分布式系統(tǒng)(例如,數(shù)據(jù)中心和網(wǎng)格)區(qū)別開(kāi)來(lái)。盡管云計(jì)算提供了以上服務(wù)并具有優(yōu)勢(shì),但也存在挑戰(zhàn)。復(fù)雜系統(tǒng)已經(jīng)成為一種流行的計(jì)算模式,它支持工作負(fù)載自動(dòng)伸縮,以適應(yīng)需求的變化和云服務(wù)中資源的虛擬化。通過(guò)持續(xù)配置虛擬資源和物理工作負(fù)載的分配使工作實(shí)現(xiàn)彈性,但也增加了故障和異常發(fā)生的可能性,特別是在提供基礎(chǔ)設(shè)施服務(wù)(IaaS)的層面。在云服務(wù)基礎(chǔ)設(shè)施中,對(duì)故障診斷和識(shí)別相關(guān)問(wèn)題的管理是至關(guān)重要的,這是本文研究的主要問(wèn)題。本文論述了云服務(wù)基礎(chǔ)設(shè)施故障診斷和識(shí)別策略管理的四個(gè)具體主題:(1)由于在異構(gòu)環(huán)境中虛擬化技術(shù)的可擴(kuò)展性和復(fù)雜性增大,使故障診斷變得更加困難。但因其在云基礎(chǔ)設(shè)施的故障管理框架中的重要性,故障診斷和識(shí)別仍受到廣泛關(guān)注。大多數(shù)故障診斷和識(shí)別方法都是基于主動(dòng)探測(cè)技術(shù),這些技術(shù)可用于快速準(zhǔn)確地檢測(cè)故障。然而,大多數(shù)方法都受到了通信開(kāi)銷(xiāo)和故障診斷的影響,導(dǎo)致了云服務(wù)系統(tǒng)性能的降低,例如IaaS。(2)由于數(shù)據(jù)量大,監(jiān)測(cè)成為一項(xiàng)特殊的挑戰(zhàn)。大型復(fù)雜系統(tǒng)的監(jiān)測(cè)需要對(duì)故障檢測(cè)和異常進(jìn)行高精度、低延遲和近實(shí)時(shí)分析,還需要通過(guò)運(yùn)行具有代表性的大型數(shù)據(jù)集處理應(yīng)用程序進(jìn)行優(yōu)化。(3)異常/故障的診斷和自我修復(fù)是云服務(wù)基礎(chǔ)設(shè)施的重要操作,需要自動(dòng)化的故障檢測(cè)和實(shí)時(shí)自我修復(fù)。(4)在IaaS中,有四個(gè)有效的測(cè)量標(biāo)準(zhǔn)來(lái)確定故障排除的有效性:優(yōu)先級(jí)、故障概率、風(fēng)險(xiǎn)和配置操作的持續(xù)時(shí)間。一些研究小組的目標(biāo)是通過(guò)將故障診斷擴(kuò)展到故障排除,來(lái)確定如何監(jiān)測(cè)集合、開(kāi)發(fā)分類(lèi)器并分析測(cè)量的屬性,而不是單個(gè)的測(cè)量閾值。本文針對(duì)云服務(wù)基礎(chǔ)設(shè)施中故障診斷和識(shí)別的策略管理進(jìn)行了研究。提出了有效的方法,并探討了潛在的動(dòng)機(jī)和解決方案。通過(guò)全面的實(shí)證分析和新的定量方法進(jìn)行了詳盡的評(píng)價(jià),并為今后的研究奠定了基礎(chǔ)。達(dá)成了四項(xiàng)獨(dú)立但相互關(guān)聯(lián)的成果:(1)首先,論文提出并開(kāi)發(fā)了一種新的混合模型,名為加速故障診斷和識(shí)別(AFDI),根據(jù)故障級(jí)別和異常的嚴(yán)重程度,監(jiān)測(cè)VM和物理服務(wù)器托管的各種系統(tǒng)指標(biāo),并研究細(xì)粒度容錯(cuò)算法;谶@些發(fā)現(xiàn),論文提出了一種新的方法來(lái)構(gòu)建一種模型,該模型可以?xún)?yōu)化實(shí)時(shí)監(jiān)控的性能,并基于Hadoop MapReduce和Apache Spark平臺(tái)提高預(yù)測(cè)的準(zhǔn)確性。(2)接下來(lái),論文提出了一種新的方法,通過(guò)對(duì)其定性指標(biāo)進(jìn)行分析和分類(lèi)來(lái)診斷異常/故障。使用機(jī)器學(xué)習(xí)算法確定的異常/故障的分布來(lái)創(chuàng)建時(shí)間序列診斷方法,以在運(yùn)行時(shí)檢測(cè)和分類(lèi)異常/故障,從而估計(jì)每個(gè)自修復(fù)系統(tǒng)組件對(duì)系統(tǒng)功能的影響,并實(shí)現(xiàn)服務(wù)的高可用性。(3)論文提出了一種新的理論方法來(lái)構(gòu)建故障檢測(cè)與修復(fù)(故障排除)模型的步驟,將樸素貝葉斯分類(lèi)(NBC)與多值決策圖(MDD)結(jié)合起來(lái),對(duì)云異常檢測(cè)的故障排除進(jìn)行構(gòu)建和管理。實(shí)施這種方法的實(shí)際考量是提供一種決策理論的方法來(lái)對(duì)云服務(wù)基礎(chǔ)設(shè)施的故障診斷步驟進(jìn)行建模。(4)最后,論文為IaaS提出了一個(gè)基于A(yíng)pache sparks的瓶頸故障排除性能框架,論文將其命名為CloudPT。CloudPT有許多優(yōu)點(diǎn):它具有高效的檢測(cè)能力;它有一個(gè)統(tǒng)一的、全方位的循環(huán)反饋,與云生態(tài)系統(tǒng)的管理相協(xié)作;并且包括故障診斷性能測(cè)試。CloudPT的目標(biāo)是通過(guò)擴(kuò)展故障排除來(lái)監(jiān)測(cè)集合、深入分析并對(duì)測(cè)量的屬性進(jìn)行分類(lèi),而不是單個(gè)測(cè)量閾值。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TP393.07


本文編號(hào):2659225

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/2659225.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)095c2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com