分層檢查點的近似最優(yōu)周期計算模型
本文關(guān)鍵詞: 高性能計算 容錯 分層檢查點 檢查點周期 近似最優(yōu)解 出處:《計算機應用》2017年01期 論文類型:期刊論文
【摘要】:針對大規(guī)模高性能計算(HPC)系統(tǒng)中檢查點效率提升問題,提出一種面向分層檢查點近似最優(yōu)周期計算模型。首先,通過分析一個HPC系統(tǒng)中應用程序的執(zhí)行過程,將檢查點周期優(yōu)化抽象為一個非線性的檢查點成本模型;其次,通過分析可能故障位置推導出分層檢查點成本公式,并引入兩個減速因子和一個加速因子來模擬消息日志對分層檢查點造成的影響。仿真實驗結(jié)果表明,所提模型與理論近似最優(yōu)周期檢查點成本平均誤差在5%以下,相對傳統(tǒng)檢查點周期優(yōu)化模型的平均誤差降低了20%,能夠有效提高檢查點的效率,提升HPC系統(tǒng)可用性。
[Abstract]:Aiming at the problem of improving checkpoint efficiency in large scale high performance computing (HPC) systems, an approximate optimal period calculation model for layered checkpoint is proposed. By analyzing the execution process of an application program in a HPC system, the checkpointing cycle optimization is abstracted into a nonlinear checkpoint cost model. Secondly, the cost formula of hierarchical checkpoint is deduced by analyzing the possible fault location, and two deceleration factors and one acceleration factor are introduced to simulate the effect of message log on hierarchical checkpoint. The average cost error of the proposed model is below 5%, compared with the traditional checkpointing cycle optimization model, the average error is reduced by 20%, which can effectively improve the efficiency of checkpoint. Improve HPC system availability.
【作者單位】: 哈爾濱工程大學計算機科學與技術(shù)學院;
【基金】:國家自然科學基金資助項目(61370212,61402127,61502118) 黑龍江省自然科學基金資助項目(F2015029)~~
【分類號】:TP38
【正文快照】: 0引言 隨著大規(guī)模和超大規(guī)模集成電路的問世,高性能計算(High Performance Computation,HPC)系統(tǒng)進入高速發(fā)展期,根據(jù)International Exascale Software Project(IESP)的研究報告[1]顯示,HPC系統(tǒng)及其相關(guān)技術(shù)會持續(xù)發(fā)展。然而在實際部署與運行中人們發(fā)現(xiàn),系統(tǒng)的高復雜性、高異
【相似文獻】
相關(guān)期刊論文 前10條
1 慈軼為;張展;左德承;吳智博;楊孝宗;;可擴展的多周期檢查點設置[J];軟件學報;2010年02期
2 蔣廷耀,李慶華;一種新的優(yōu)化的檢查點間隔的求解模型[J];小型微型計算機系統(tǒng);2003年03期
3 梁蓓,張大方,楊金民,季潔;用時間序列分析方法動態(tài)確定檢查點時間間隔[J];系統(tǒng)仿真學報;2004年10期
4 羅克露;向后滾動檢查點技術(shù)在虛存中的應用[J];計算機應用;1996年05期
5 李凱原,楊孝宗;減少檢查點開銷的一種方法[J];計算機工程與應用;2000年02期
6 廖劍偉;李莉;陳善雄;余建橋;;實時交互進程的并發(fā)檢查點技術(shù)[J];電子科技大學學報;2011年04期
7 李凱原,楊孝宗;提高用任務重復的檢查點方案的性能[J];電子學報;2000年05期
8 田甜;祝永志;;一種改進的同步檢查點設置算法[J];計算機技術(shù)與發(fā)展;2009年08期
9 羅元盛,閔應驊,張大方;一種基于索引的準同步檢查點協(xié)議[J];計算機學報;2005年10期
10 羅元盛,閔應驊,張大方;基于索引的準同步檢查點的重新計時策略[J];計算機工程與科學;2005年04期
相關(guān)會議論文 前5條
1 羅元盛;閔應驊;張大方;;基于索引的準同步檢查點的重新計時策略[A];第三屆中國測試學術(shù)會議論文集[C];2004年
2 陳海濤;韋中偉;盧宇彤;;一種檢查點感知的文件恢復算法[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年
3 黃敬堯;;分布式系統(tǒng)中檢查點的設計及實現(xiàn)[A];湖北省機械工程學會青年分會2006年年會暨第2屆機械學院院長(系主任)會議論文集(下)[C];2006年
4 周軍海;張大方;楊金民;;改進的快速N+1奇偶校驗檢查點[A];第三屆中國測試學術(shù)會議論文集[C];2004年
5 王學慧;張磊;;高性能仿真中檢查點設置研究[A];'2010系統(tǒng)仿真技術(shù)及其應用學術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前7條
1 本報記者 陸一波;躉船上建起安檢“鐵皮屋”[N];解放日報;2010年
2 本報記者 劉建 本報實習生 高原;為平安世博筑起安全濾網(wǎng)[N];法制日報;2010年
3 羅慶超;VxFS中的檢查點和快照技術(shù)[N];中國計算機報;2007年
4 梁肅平;“三聯(lián)合”執(zhí)法成效顯著[N];新鄉(xiāng)日報;2005年
5 記者 劉長青;我市警方嚴厲打擊交通違法行為[N];安陽日報;2006年
6 王倫華 一鳴;沙灣:愛心助殘進農(nóng)家[N];樂山日報;2006年
7 本報記者 葉佑平 本報通訊員 趙永軍;公路治超法律環(huán)境亟需完善[N];山西日報;2004年
相關(guān)博士學位論文 前2條
1 徐振朋;移動計算環(huán)境下檢查點回卷恢復容錯技術(shù)研究[D];哈爾濱工程大學;2011年
2 趙國冬;嵌入式系統(tǒng)彈性應對方法研究[D];哈爾濱工程大學;2011年
相關(guān)碩士學位論文 前10條
1 范鵬飛;基于自治車聯(lián)云環(huán)境下檢查點服務器的選取方案的研究[D];內(nèi)蒙古大學;2015年
2 王天喜;移動設備環(huán)境下功耗優(yōu)化的容錯策略設計與實現(xiàn)[D];武漢紡織大學;2015年
3 張?zhí)K超;基于面向方面技術(shù)的軟件檢查點及恢復技術(shù)研究[D];電子科技大學;2015年
4 王時興;基于檢查點優(yōu)化的進程級容錯系統(tǒng)設計與實現(xiàn)[D];西安電子科技大學;2014年
5 萬強;基于Profile檢查點的航天級軟件加固機制[D];國防科學技術(shù)大學;2013年
6 王浩;基于自適應策略的MapReduce檢查點技術(shù)的研究與優(yōu)化[D];上海交通大學;2015年
7 林茵;基于馬爾可夫決策過程的快件質(zhì)量檢查點研究[D];北京交通大學;2016年
8 王皓;基于異步檢查點的動態(tài)軟件升級系統(tǒng)[D];華中科技大學;2014年
9 遲文迪;基于鏈路穩(wěn)定性的車聯(lián)云檢查點服務器選取方案的研究[D];內(nèi)蒙古大學;2016年
10 謝爭;基于檢查點的進程級容錯設計與研究[D];哈爾濱工程大學;2009年
,本文編號:1469808
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1469808.html