面向異構平臺的OpenMP程序自動卸載及優(yōu)化
發(fā)布時間:2022-02-21 08:51
隨著信息化社會的飛速發(fā)展,互聯(lián)網(wǎng)需要處理的信息量也在短時間內(nèi)不斷累積,對于數(shù)據(jù)和計算處理的需求也在日益增長,這也推動高性能計算的飛速發(fā)展。CPU處理器逐漸無法匹配高性能計算程序的性能要求,由CPU和加速器構成的異構計算體系,成為了新的選擇。將復雜計算的程序移植到GPU等加速器上運行,不僅可以有效地提升計算性能,縮短計算時間,同時也可以充分發(fā)揮加速器的計算優(yōu)勢,降低能耗。本文針對并行程序的移植,提出了一種面向異構平臺的并行程序的自動卸載以及優(yōu)化方案,實質(zhì)是一個自動源到源的編譯器,定義名稱為Open MP Automated Offloading,簡稱為OAO。其針對Open MP程序,整個編譯器系統(tǒng)由信息收集模塊,自動轉換模塊和運行時模塊三部分組成。信息收集模塊使用LLVM編譯器的一個前端Clang來對源程序進行分析,同時在此模塊提出串并行圖的概念,實現(xiàn)對程序串行域和并行域的分割。為了保證數(shù)據(jù)傳輸過程中的一致性,在自動轉換模塊引入了自行設計的數(shù)據(jù)傳輸模型,并在此過程中對傳輸進行優(yōu)化,保證傳輸?shù)淖詈喕?此外,利用統(tǒng)一內(nèi)存對復雜數(shù)據(jù)結構進行技術支持。在運行時模塊,提出引入運行時API的方法,...
【文章來源】:哈爾濱工業(yè)大學黑龍江省211工程院校985工程院校
【文章頁數(shù)】:87 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 相關領域國內(nèi)外研究現(xiàn)狀
1.2.1 CPU/GPU異構并行編程模型
1.2.2 CPU/GPU異構程序自動轉換
1.2.3 數(shù)據(jù)傳輸及統(tǒng)一內(nèi)存
1.2.4 國內(nèi)外文獻綜述的簡析
1.3 本文主要研究內(nèi)容
1.4 本文的組織結構
第2章 Open MP程序自動卸載系統(tǒng)的需求分析
2.1 系統(tǒng)功能需求
2.1.1 信息收集模塊
2.1.2 自動轉換模塊
2.1.3 運行時模塊
2.2 系統(tǒng)性能需求
2.3 系統(tǒng)安全性需求
2.4 本章小結
第3章 Open MP程序自動卸載系統(tǒng)的設計
3.1 OPENMP程序自動卸載系統(tǒng)的總體設計
3.2 OPENMP程序自動卸載系統(tǒng)的詳細設計
3.2.1 信息收集模塊的設計
3.2.2 自動轉換模塊的設計
3.2.3 運行時模塊的設計
3.3 本章小結
第4章 Open MP程序自動卸載系統(tǒng)的實現(xiàn)
4.1 信息收集模塊實現(xiàn)
4.1.1 代碼分析方法
4.1.2 代碼分析過程
4.2 自動轉換模塊實現(xiàn)
4.2.1 標量處理
4.2.2 簡單數(shù)組類型處理
4.2.3 數(shù)據(jù)傳輸模型
4.2.4 復雜數(shù)據(jù)結構類型處理
4.2.5 代碼轉換
4.3 運行時模塊實現(xiàn)
4.3.1 引入運行時API
4.3.2 運行時內(nèi)部實現(xiàn)
4.3.3 運行時函數(shù)調(diào)用
4.4 本章小結
第5章 Open MP程序自動卸載系統(tǒng)的測試
5.1 實驗環(huán)境介紹
5.2 實驗設計及過程測試
5.3 實驗結果分析
5.3.1 運行時間
5.3.2 加速比
5.3.3 性能提升
5.3.4 數(shù)據(jù)傳輸
5.3.5 運行時開銷
5.3.6 統(tǒng)一內(nèi)存測試
5.4 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]高性能計算機發(fā)展與政策[J]. 孫凝暉,譚光明. 中國科學院院刊. 2019(06)
[2]基于混合分析的二進制程序控制流圖構建方法[J]. 朱凱龍,陸余良,黃暉,鄧兆琨,鄧一杰. 浙江大學學報(工學版). 2019(05)
[3]NVIDIA黃仁勛:未來GPU無處不在[J]. 姜姝姝. 機器人產(chǎn)業(yè). 2016(05)
[4]基于控制流分析的軟件源代碼靜態(tài)測試技術的研究[J]. 皮篩成,游輝敏. 科學大眾(科學教育). 2016(06)
[5]OpenACC到MIC平臺上并行程序的自動翻譯及優(yōu)化[J]. 江霞,安虹,梁偉浩,張愛民,李豐. 小型微型計算機系統(tǒng). 2016(04)
[6]摩爾定律終結,計算的未來在哪里[J]. 李雨蒙. 中國民商. 2016(04)
[7]異構并行編程模型研究與進展[J]. 劉穎,呂方,王蕾,陳莉,崔慧敏,馮曉兵. 軟件學報. 2014(07)
[8]C語言靜態(tài)代碼分析中的調(diào)用關系提取方法[J]. 江夢濤,荊琦. 計算機科學. 2014(S1)
[9]程序靜態(tài)分析技術與工具[J]. 楊宇,張健. 計算機科學. 2004(02)
博士論文
[1]面向多核的并行模式及編譯優(yōu)化技術研究[D]. 郭惠芳.解放軍信息工程大學 2011
碩士論文
[1]基于LLVM-Clang的軟件靜態(tài)檢測工具研究與實現(xiàn)[D]. 李昊.西安理工大學 2017
[2]基于GPU的外輻射源雷達DOA估計實現(xiàn)技術[D]. 周伯成.西安電子科技大學 2014
[3]基于靜態(tài)分析的C程序控制流圖構造方法研究[D]. 任浩.內(nèi)蒙古師范大學 2013
本文編號:3636916
【文章來源】:哈爾濱工業(yè)大學黑龍江省211工程院校985工程院校
【文章頁數(shù)】:87 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究的目的和意義
1.2 相關領域國內(nèi)外研究現(xiàn)狀
1.2.1 CPU/GPU異構并行編程模型
1.2.2 CPU/GPU異構程序自動轉換
1.2.3 數(shù)據(jù)傳輸及統(tǒng)一內(nèi)存
1.2.4 國內(nèi)外文獻綜述的簡析
1.3 本文主要研究內(nèi)容
1.4 本文的組織結構
第2章 Open MP程序自動卸載系統(tǒng)的需求分析
2.1 系統(tǒng)功能需求
2.1.1 信息收集模塊
2.1.2 自動轉換模塊
2.1.3 運行時模塊
2.2 系統(tǒng)性能需求
2.3 系統(tǒng)安全性需求
2.4 本章小結
第3章 Open MP程序自動卸載系統(tǒng)的設計
3.1 OPENMP程序自動卸載系統(tǒng)的總體設計
3.2 OPENMP程序自動卸載系統(tǒng)的詳細設計
3.2.1 信息收集模塊的設計
3.2.2 自動轉換模塊的設計
3.2.3 運行時模塊的設計
3.3 本章小結
第4章 Open MP程序自動卸載系統(tǒng)的實現(xiàn)
4.1 信息收集模塊實現(xiàn)
4.1.1 代碼分析方法
4.1.2 代碼分析過程
4.2 自動轉換模塊實現(xiàn)
4.2.1 標量處理
4.2.2 簡單數(shù)組類型處理
4.2.3 數(shù)據(jù)傳輸模型
4.2.4 復雜數(shù)據(jù)結構類型處理
4.2.5 代碼轉換
4.3 運行時模塊實現(xiàn)
4.3.1 引入運行時API
4.3.2 運行時內(nèi)部實現(xiàn)
4.3.3 運行時函數(shù)調(diào)用
4.4 本章小結
第5章 Open MP程序自動卸載系統(tǒng)的測試
5.1 實驗環(huán)境介紹
5.2 實驗設計及過程測試
5.3 實驗結果分析
5.3.1 運行時間
5.3.2 加速比
5.3.3 性能提升
5.3.4 數(shù)據(jù)傳輸
5.3.5 運行時開銷
5.3.6 統(tǒng)一內(nèi)存測試
5.4 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
個人簡歷
【參考文獻】:
期刊論文
[1]高性能計算機發(fā)展與政策[J]. 孫凝暉,譚光明. 中國科學院院刊. 2019(06)
[2]基于混合分析的二進制程序控制流圖構建方法[J]. 朱凱龍,陸余良,黃暉,鄧兆琨,鄧一杰. 浙江大學學報(工學版). 2019(05)
[3]NVIDIA黃仁勛:未來GPU無處不在[J]. 姜姝姝. 機器人產(chǎn)業(yè). 2016(05)
[4]基于控制流分析的軟件源代碼靜態(tài)測試技術的研究[J]. 皮篩成,游輝敏. 科學大眾(科學教育). 2016(06)
[5]OpenACC到MIC平臺上并行程序的自動翻譯及優(yōu)化[J]. 江霞,安虹,梁偉浩,張愛民,李豐. 小型微型計算機系統(tǒng). 2016(04)
[6]摩爾定律終結,計算的未來在哪里[J]. 李雨蒙. 中國民商. 2016(04)
[7]異構并行編程模型研究與進展[J]. 劉穎,呂方,王蕾,陳莉,崔慧敏,馮曉兵. 軟件學報. 2014(07)
[8]C語言靜態(tài)代碼分析中的調(diào)用關系提取方法[J]. 江夢濤,荊琦. 計算機科學. 2014(S1)
[9]程序靜態(tài)分析技術與工具[J]. 楊宇,張健. 計算機科學. 2004(02)
博士論文
[1]面向多核的并行模式及編譯優(yōu)化技術研究[D]. 郭惠芳.解放軍信息工程大學 2011
碩士論文
[1]基于LLVM-Clang的軟件靜態(tài)檢測工具研究與實現(xiàn)[D]. 李昊.西安理工大學 2017
[2]基于GPU的外輻射源雷達DOA估計實現(xiàn)技術[D]. 周伯成.西安電子科技大學 2014
[3]基于靜態(tài)分析的C程序控制流圖構造方法研究[D]. 任浩.內(nèi)蒙古師范大學 2013
本文編號:3636916
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3636916.html
最近更新
教材專著