基于GPGPU平臺的軟錯誤檢測模型研究
發(fā)布時間:2022-10-30 13:38
GPGPUs(general-purpose Graphics Processing Units)因為其高并發(fā)性和高吞吐量的優(yōu)勢,已經(jīng)成為多種科學(xué)領(lǐng)域不可或缺的計算單元。如此高的計算能力歸功于GPUs芯片上成百上千個高度集成的計算內(nèi)核。內(nèi)核是獨(dú)立的計算單元,計算任務(wù)被分發(fā)在這些單元上進(jìn)行并行計算從而提高計算性能。芯片晶體管體積的不斷縮小以及集成度的不斷提高,使得高度集成的GPGPU平臺更容易受到高能粒子的撞擊而導(dǎo)致邏輯單元發(fā)生比特位翻轉(zhuǎn)的故障,這種故障也被稱為軟錯誤。發(fā)生在底層芯片的軟錯誤很容易對運(yùn)行在上層的應(yīng)用造成影響,其中靜默數(shù)據(jù)損壞(Silent Data Corruption,SDC)由于會影響輸出的準(zhǔn)確性并且在運(yùn)行過程中不會產(chǎn)生異常的信息,無法通過基于癥狀的檢測機(jī)制所捕獲。為了保證GPGPU應(yīng)用的可靠執(zhí)行,針對SDC錯誤提出有效的檢測機(jī)制至關(guān)重要。指令全冗余技術(shù)是檢測SDC錯誤的最有效、直觀的手段,它通過比較副本指令和原始指令的運(yùn)算結(jié)果來檢測錯誤。但是由于指令的冗余執(zhí)行,該技術(shù)會產(chǎn)生過多的空間和計算開銷,嚴(yán)重影響GPGPU平臺的并行處理性能。針對指令全冗余技術(shù)開銷過高的問題,...
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景和意義
1.2 課題研究現(xiàn)狀
1.3 本文工作
1.4 本文結(jié)構(gòu)
第2章 相關(guān)背景介紹
2.1 GPU編程模型
2.1.1 GPU架構(gòu)
2.1.2 CUDA編程模型
2.1.3 CUDA編譯模型
2.2 軟錯誤定義
2.2.1 軟錯誤產(chǎn)生機(jī)制
2.2.2 軟錯誤的影響
2.2.3 軟錯誤的嚴(yán)重性
2.3 軟錯誤檢測
2.3.1 基于硬件的檢測
2.3.2 基于軟件的檢測
2.4 本章小結(jié)
第3章 面向軟錯誤的檢測設(shè)計
3.1 問題背景
3.2 故障模型
3.2.1 輸出質(zhì)量度量
3.2.2 故障模型實現(xiàn)
3.2.3 故障結(jié)果分類
3.3 SDC錯誤檢測總體設(shè)計
3.4 本章小結(jié)
第4章 指令SDC傾向性預(yù)測模型
4.1 相關(guān)定義
4.2 預(yù)測模型
4.3 指令SDC傾向性特征提取
4.3.1 指令屬性特征
4.3.2 指令依賴特征
4.4 基于SVM的預(yù)測模型構(gòu)建
4.5 本章小結(jié)
第5章 實驗和結(jié)果分析
5.1 實驗設(shè)計
5.2 實驗結(jié)果與分析
5.2.1 參數(shù)設(shè)定
5.2.2 SDC傾向性預(yù)測分析
5.2.3 SDC錯誤檢測驗證
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
作者簡介及在學(xué)期間所取得的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)的指令SDC脆弱性分析方法[J]. 張倩雯,莊毅. 小型微型計算機(jī)系統(tǒng). 2018(04)
[2]一種基于不變量的軟錯誤檢測方法[J]. 馬駿馳,汪蕓. 軟件學(xué)報. 2016(02)
碩士論文
[1]基于動態(tài)可重構(gòu)技術(shù)的FPGA中SEU故障容錯方法研究[D]. 費(fèi)亞男.哈爾濱工業(yè)大學(xué) 2013
本文編號:3698987
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景和意義
1.2 課題研究現(xiàn)狀
1.3 本文工作
1.4 本文結(jié)構(gòu)
第2章 相關(guān)背景介紹
2.1 GPU編程模型
2.1.1 GPU架構(gòu)
2.1.2 CUDA編程模型
2.1.3 CUDA編譯模型
2.2 軟錯誤定義
2.2.1 軟錯誤產(chǎn)生機(jī)制
2.2.2 軟錯誤的影響
2.2.3 軟錯誤的嚴(yán)重性
2.3 軟錯誤檢測
2.3.1 基于硬件的檢測
2.3.2 基于軟件的檢測
2.4 本章小結(jié)
第3章 面向軟錯誤的檢測設(shè)計
3.1 問題背景
3.2 故障模型
3.2.1 輸出質(zhì)量度量
3.2.2 故障模型實現(xiàn)
3.2.3 故障結(jié)果分類
3.3 SDC錯誤檢測總體設(shè)計
3.4 本章小結(jié)
第4章 指令SDC傾向性預(yù)測模型
4.1 相關(guān)定義
4.2 預(yù)測模型
4.3 指令SDC傾向性特征提取
4.3.1 指令屬性特征
4.3.2 指令依賴特征
4.4 基于SVM的預(yù)測模型構(gòu)建
4.5 本章小結(jié)
第5章 實驗和結(jié)果分析
5.1 實驗設(shè)計
5.2 實驗結(jié)果與分析
5.2.1 參數(shù)設(shè)定
5.2.2 SDC傾向性預(yù)測分析
5.2.3 SDC錯誤檢測驗證
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
作者簡介及在學(xué)期間所取得的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)的指令SDC脆弱性分析方法[J]. 張倩雯,莊毅. 小型微型計算機(jī)系統(tǒng). 2018(04)
[2]一種基于不變量的軟錯誤檢測方法[J]. 馬駿馳,汪蕓. 軟件學(xué)報. 2016(02)
碩士論文
[1]基于動態(tài)可重構(gòu)技術(shù)的FPGA中SEU故障容錯方法研究[D]. 費(fèi)亞男.哈爾濱工業(yè)大學(xué) 2013
本文編號:3698987
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3698987.html
最近更新
教材專著