基于日志分析的超級計算機錯誤預測方法研究
發(fā)布時間:2025-02-07 18:00
大量的錯誤嚴重影響了超級計算機系統(tǒng)的穩(wěn)定性,錯誤預測對于提高其穩(wěn)定性有重要作用,日志分析是進行錯誤預測的有效方法。建立了錯誤預測的基本框架,包括日志的預處理、基礎(chǔ)預測器和聯(lián)合預測器,其中基礎(chǔ)預測器包括時間預測器和關(guān)聯(lián)預測器。在BlueGene/L日志上進行的實驗結(jié)果顯示聯(lián)合預測器的預測效果比基礎(chǔ)預測器好。這表明錯誤預測要充分挖掘錯誤的特性,將基于各種錯誤特性的基礎(chǔ)預測器聯(lián)合起來進行預測才能取得滿意的預測效果。
【文章頁數(shù)】:3 頁
【部分圖文】:
本文編號:4031084
【文章頁數(shù)】:3 頁
【部分圖文】:
圖5時l田預1DP1器.關(guān)聯(lián)預測R.0
進行關(guān)聯(lián)預測,Tw的選取十分重要,而在實驗過程中,發(fā)現(xiàn)Tw的選取對關(guān)聯(lián)規(guī)則的影響不大,本著盡可能少地占用系統(tǒng)資源的原則,選取Tw=5min。另一方面,min<sub>s</sub>upport對關(guān)聯(lián)規(guī)則的影響較大,故選擇了多個min<sub>s</sub>upport....
圖1錯誤預測框架
圖2時問預測原理
Te]。圖2描述了這一問題,圖2中F表示一種錯誤,F(xiàn)1表示這種錯誤第一次發(fā)生,F(xiàn)2表示第二次發(fā)生,F(xiàn)3表示第三次發(fā)生,F(xiàn)4表示第四次發(fā)生。F1可以用來預測F2,但是這種預測沒有任何意義,因為它們的間隔時間僅僅只有2s,可能是同一錯誤被記錄多次;而F1可以用來預測....
圖3關(guān)聯(lián)頂溯J效果圖
聯(lián)合預測器的查全率低于時間預測和關(guān)聯(lián)預測的查全率之和,如圖5所示(圖5中選取min<sub>s</sub>upport=12)。這主要是因為在進行聯(lián)合預測時,存在既能進行時間預測也能進行關(guān)聯(lián)預測的錯誤,而聯(lián)合預測不可能兩者同時選擇,必然會舍棄其中一種。圖5中....
本文編號:4031084
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/4031084.html
最近更新
教材專著