面向星載計(jì)算機(jī)的容錯(cuò)并行算法研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-04-01 13:10
【摘要】:星載計(jì)算機(jī)是衛(wèi)星進(jìn)行星務(wù)管理和有效載荷計(jì)算的核心設(shè)備。空間應(yīng)用需求的增長(zhǎng)使多CPU并行成為星載計(jì)算機(jī)的未來(lái)發(fā)展方向。在空間運(yùn)行期間,由于星載計(jì)算機(jī)設(shè)備將一直處于宇宙空間帶電粒子構(gòu)成的輻射環(huán)境中,周?chē)母邷、高真空以及?qiáng)輻射等會(huì)造成星載計(jì)算機(jī)出現(xiàn)瞬時(shí)故障或是永久故障而影響衛(wèi)星業(yè)務(wù)的正常運(yùn)行,因此容錯(cuò)技術(shù)一直是星載計(jì)算機(jī)研制領(lǐng)域的研究熱點(diǎn)。作為容錯(cuò)技術(shù)的重要分支,軟件容錯(cuò)為提高系統(tǒng)的可靠性提供了靈活有效的方法。本文在分析研究現(xiàn)有容錯(cuò)技術(shù)的基礎(chǔ)上,運(yùn)用應(yīng)用級(jí)軟件容錯(cuò)的手段來(lái)容忍硬件的故障,能有效提高星載系統(tǒng)的可靠性。 本文主要完成的工作描述如下: 1、面向星載并行計(jì)算機(jī)易出現(xiàn)的單節(jié)點(diǎn)故障,基于并行復(fù)算的思想提出了容錯(cuò)并行算法的概念,并且給出了容錯(cuò)并行算法的設(shè)計(jì)流程:首先進(jìn)行程序段的劃分,其次設(shè)計(jì)故障檢測(cè)段和數(shù)據(jù)保存段,最后設(shè)計(jì)復(fù)算程序段。通過(guò)分析星載并行計(jì)算機(jī)的結(jié)構(gòu)特點(diǎn)和應(yīng)用模式,有針對(duì)性地提出了兩種容錯(cuò)并行算法的實(shí)現(xiàn)方式:分配任務(wù)型和啟動(dòng)替換進(jìn)程型。 2、根據(jù)容錯(cuò)并行算法的設(shè)計(jì)流程和兩種不同的容錯(cuò)實(shí)現(xiàn)方式,選取NPB(NAS parallel Benchmark)基準(zhǔn)測(cè)試程序集基于MPI(Message Passing Interface)通信接口進(jìn)行了相應(yīng)的容錯(cuò)設(shè)計(jì),并在四核微機(jī)平臺(tái)上進(jìn)行了測(cè)試,實(shí)驗(yàn)結(jié)果驗(yàn)證了容錯(cuò)并行算法的可行性。 3、面向星載計(jì)算機(jī)的容錯(cuò)并行算法是一種在應(yīng)用級(jí)的利用軟件容錯(cuò)來(lái)解決硬件故障的方法,其設(shè)計(jì)思路和實(shí)現(xiàn)方式能否得到實(shí)際應(yīng)用還需要進(jìn)一步進(jìn)行工程化實(shí)驗(yàn),并在真實(shí)的硬件環(huán)境下進(jìn)行驗(yàn)證性的測(cè)試。在深入研究嵌入式操作系統(tǒng)VxWorks的通信原理和通信方式的基礎(chǔ)上,對(duì)基于MPI消息傳遞接口實(shí)現(xiàn)的容錯(cuò)并行算法進(jìn)行工程化改造,并在VxWroks模擬器和實(shí)際的4節(jié)點(diǎn)并行原理樣機(jī)上進(jìn)行了功能和性能測(cè)試,實(shí)驗(yàn)結(jié)果表明容錯(cuò)并行算法在提高應(yīng)用程序性能的同時(shí)可有效提高系統(tǒng)的可用性和可靠性。
【圖文】:
國(guó)防科學(xué)技術(shù)大學(xué)研究生院工程碩士學(xué)位論文 故 障 ( 不 在 同 一 時(shí) 間 ) 。 矩 陣 乘 算 法 的 運(yùn) 行 I)*C+m*(R+d)。容錯(cuò)的時(shí)間開(kāi)銷(xiāo)為:ftT=(t/I)*C+m*(R+d上面的公式計(jì)算分析:矩陣乘算法在使用 checkpointing 方法幾個(gè)特點(diǎn):常的計(jì)算過(guò)程中需要定期進(jìn)行數(shù)據(jù)的保存,增加了算法運(yùn)行次故障發(fā)生時(shí),所有進(jìn)程回滾到最近一次的檢測(cè)點(diǎn)狀態(tài),然eckpointing 方法隨著計(jì)算的規(guī)模增大,其容錯(cuò)的開(kāi)銷(xiāo)增大。
checkpointing 技術(shù)矩陣乘算法出現(xiàn)一個(gè)進(jìn)程故障時(shí)的使用基于并行復(fù)算的容錯(cuò)方法,在沒(méi)有故障發(fā),程序運(yùn)算時(shí)間為:T=t 。在算法的運(yùn)算過(guò)程永久性),,每出現(xiàn)一個(gè)次故障,系統(tǒng)會(huì)減少一銷(xiāo),容錯(cuò)的開(kāi)銷(xiāo)為:rT=m/(n-m) 。容錯(cuò)矩陣(n-m) ,容錯(cuò)的時(shí)間開(kāi)銷(xiāo)為:fT=t*m/(n-m)的工作過(guò)程。
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類(lèi)號(hào)】:TP302.8
本文編號(hào):2610497
【圖文】:
國(guó)防科學(xué)技術(shù)大學(xué)研究生院工程碩士學(xué)位論文 故 障 ( 不 在 同 一 時(shí) 間 ) 。 矩 陣 乘 算 法 的 運(yùn) 行 I)*C+m*(R+d)。容錯(cuò)的時(shí)間開(kāi)銷(xiāo)為:ftT=(t/I)*C+m*(R+d上面的公式計(jì)算分析:矩陣乘算法在使用 checkpointing 方法幾個(gè)特點(diǎn):常的計(jì)算過(guò)程中需要定期進(jìn)行數(shù)據(jù)的保存,增加了算法運(yùn)行次故障發(fā)生時(shí),所有進(jìn)程回滾到最近一次的檢測(cè)點(diǎn)狀態(tài),然eckpointing 方法隨著計(jì)算的規(guī)模增大,其容錯(cuò)的開(kāi)銷(xiāo)增大。
checkpointing 技術(shù)矩陣乘算法出現(xiàn)一個(gè)進(jìn)程故障時(shí)的使用基于并行復(fù)算的容錯(cuò)方法,在沒(méi)有故障發(fā),程序運(yùn)算時(shí)間為:T=t 。在算法的運(yùn)算過(guò)程永久性),,每出現(xiàn)一個(gè)次故障,系統(tǒng)會(huì)減少一銷(xiāo),容錯(cuò)的開(kāi)銷(xiāo)為:rT=m/(n-m) 。容錯(cuò)矩陣(n-m) ,容錯(cuò)的時(shí)間開(kāi)銷(xiāo)為:fT=t*m/(n-m)的工作過(guò)程。
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類(lèi)號(hào)】:TP302.8
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 喬從連;Vx Works系統(tǒng)的BSP概念及啟動(dòng)過(guò)程[J];艦船電子對(duì)抗;2005年01期
2 胡慶豐,劉杰,遲利華;NPB CG在分布式環(huán)境下的并行實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);1997年04期
3 李小群;張文君;潘遠(yuǎn)明;肖賀;郭亮;姜志穎;;基于RTEMS的軟件容錯(cuò)系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)應(yīng)用研究;2009年03期
4 邢琰,吳宏鑫,王曉磊,李智斌;航天器故障診斷與容錯(cuò)控制技術(shù)綜述[J];宇航學(xué)報(bào);2003年03期
相關(guān)碩士學(xué)位論文 前1條
1 趙恒;星載并行計(jì)算機(jī)硬件系統(tǒng)可靠性設(shè)計(jì)與分析[D];國(guó)防科學(xué)技術(shù)大學(xué);2005年
本文編號(hào):2610497
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2610497.html
最近更新
教材專(zhuān)著