面向星載計算機的容錯并行算法研究與實現(xiàn)
發(fā)布時間:2020-04-01 13:10
【摘要】:星載計算機是衛(wèi)星進行星務(wù)管理和有效載荷計算的核心設(shè)備?臻g應(yīng)用需求的增長使多CPU并行成為星載計算機的未來發(fā)展方向。在空間運行期間,由于星載計算機設(shè)備將一直處于宇宙空間帶電粒子構(gòu)成的輻射環(huán)境中,周圍的高溫、高真空以及強輻射等會造成星載計算機出現(xiàn)瞬時故障或是永久故障而影響衛(wèi)星業(yè)務(wù)的正常運行,因此容錯技術(shù)一直是星載計算機研制領(lǐng)域的研究熱點。作為容錯技術(shù)的重要分支,軟件容錯為提高系統(tǒng)的可靠性提供了靈活有效的方法。本文在分析研究現(xiàn)有容錯技術(shù)的基礎(chǔ)上,運用應(yīng)用級軟件容錯的手段來容忍硬件的故障,能有效提高星載系統(tǒng)的可靠性。 本文主要完成的工作描述如下: 1、面向星載并行計算機易出現(xiàn)的單節(jié)點故障,基于并行復(fù)算的思想提出了容錯并行算法的概念,并且給出了容錯并行算法的設(shè)計流程:首先進行程序段的劃分,其次設(shè)計故障檢測段和數(shù)據(jù)保存段,最后設(shè)計復(fù)算程序段。通過分析星載并行計算機的結(jié)構(gòu)特點和應(yīng)用模式,有針對性地提出了兩種容錯并行算法的實現(xiàn)方式:分配任務(wù)型和啟動替換進程型。 2、根據(jù)容錯并行算法的設(shè)計流程和兩種不同的容錯實現(xiàn)方式,選取NPB(NAS parallel Benchmark)基準測試程序集基于MPI(Message Passing Interface)通信接口進行了相應(yīng)的容錯設(shè)計,并在四核微機平臺上進行了測試,實驗結(jié)果驗證了容錯并行算法的可行性。 3、面向星載計算機的容錯并行算法是一種在應(yīng)用級的利用軟件容錯來解決硬件故障的方法,其設(shè)計思路和實現(xiàn)方式能否得到實際應(yīng)用還需要進一步進行工程化實驗,并在真實的硬件環(huán)境下進行驗證性的測試。在深入研究嵌入式操作系統(tǒng)VxWorks的通信原理和通信方式的基礎(chǔ)上,對基于MPI消息傳遞接口實現(xiàn)的容錯并行算法進行工程化改造,并在VxWroks模擬器和實際的4節(jié)點并行原理樣機上進行了功能和性能測試,實驗結(jié)果表明容錯并行算法在提高應(yīng)用程序性能的同時可有效提高系統(tǒng)的可用性和可靠性。
【圖文】:
國防科學(xué)技術(shù)大學(xué)研究生院工程碩士學(xué)位論文 故 障 ( 不 在 同 一 時 間 ) 。 矩 陣 乘 算 法 的 運 行 I)*C+m*(R+d)。容錯的時間開銷為:ftT=(t/I)*C+m*(R+d上面的公式計算分析:矩陣乘算法在使用 checkpointing 方法幾個特點:常的計算過程中需要定期進行數(shù)據(jù)的保存,增加了算法運行次故障發(fā)生時,所有進程回滾到最近一次的檢測點狀態(tài),然eckpointing 方法隨著計算的規(guī)模增大,其容錯的開銷增大。
checkpointing 技術(shù)矩陣乘算法出現(xiàn)一個進程故障時的使用基于并行復(fù)算的容錯方法,在沒有故障發(fā),程序運算時間為:T=t 。在算法的運算過程永久性),,每出現(xiàn)一個次故障,系統(tǒng)會減少一銷,容錯的開銷為:rT=m/(n-m) 。容錯矩陣(n-m) ,容錯的時間開銷為:fT=t*m/(n-m)的工作過程。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2010
【分類號】:TP302.8
本文編號:2610497
【圖文】:
國防科學(xué)技術(shù)大學(xué)研究生院工程碩士學(xué)位論文 故 障 ( 不 在 同 一 時 間 ) 。 矩 陣 乘 算 法 的 運 行 I)*C+m*(R+d)。容錯的時間開銷為:ftT=(t/I)*C+m*(R+d上面的公式計算分析:矩陣乘算法在使用 checkpointing 方法幾個特點:常的計算過程中需要定期進行數(shù)據(jù)的保存,增加了算法運行次故障發(fā)生時,所有進程回滾到最近一次的檢測點狀態(tài),然eckpointing 方法隨著計算的規(guī)模增大,其容錯的開銷增大。
checkpointing 技術(shù)矩陣乘算法出現(xiàn)一個進程故障時的使用基于并行復(fù)算的容錯方法,在沒有故障發(fā),程序運算時間為:T=t 。在算法的運算過程永久性),,每出現(xiàn)一個次故障,系統(tǒng)會減少一銷,容錯的開銷為:rT=m/(n-m) 。容錯矩陣(n-m) ,容錯的時間開銷為:fT=t*m/(n-m)的工作過程。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2010
【分類號】:TP302.8
【參考文獻】
相關(guān)期刊論文 前4條
1 喬從連;Vx Works系統(tǒng)的BSP概念及啟動過程[J];艦船電子對抗;2005年01期
2 胡慶豐,劉杰,遲利華;NPB CG在分布式環(huán)境下的并行實現(xiàn)[J];計算機工程與科學(xué);1997年04期
3 李小群;張文君;潘遠明;肖賀;郭亮;姜志穎;;基于RTEMS的軟件容錯系統(tǒng)設(shè)計[J];計算機應(yīng)用研究;2009年03期
4 邢琰,吳宏鑫,王曉磊,李智斌;航天器故障診斷與容錯控制技術(shù)綜述[J];宇航學(xué)報;2003年03期
相關(guān)碩士學(xué)位論文 前1條
1 趙恒;星載并行計算機硬件系統(tǒng)可靠性設(shè)計與分析[D];國防科學(xué)技術(shù)大學(xué);2005年
本文編號:2610497
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2610497.html
最近更新
教材專著