CPU-GPU異構并行計算體系的設計與實現(xiàn)
發(fā)布時間:2017-04-16 10:00
本文關鍵詞:CPU-GPU異構并行計算體系的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著終端設備中CPU和GPU硬件的不斷升級,如何為低技術門檻用戶提供高性能計算成為了當前的研究熱點。在綠色高性能計算時代,CPU-GPU異構計算體系能夠提供良好的通用性、性能和效能,具有廣闊的發(fā)展前景。本文以現(xiàn)有桌面系統(tǒng)中的CPU和GPU硬件資源為基礎,從任務劃分和數(shù)據(jù)傳輸兩方面對原有CPU-GPU異構并行技術進行了優(yōu)化,降低用戶對數(shù)據(jù)分配和處理的復雜度,設計并實現(xiàn)了CPU-GPU異構并行計算體系,提高了終端設備的處理能力。本文的研究內(nèi)容及成果主要有以下幾個方面:(1)在分析和研究了桌面系統(tǒng)中多核CPU、GPU架構,以及原有CPU-GPU異構并行技術的基礎上,優(yōu)化異構并行計算的解決方法,設計了異構并行計算架構,通過部署基于異構桌面系統(tǒng)的結點組成了并行計算體系。(2)任務分配上,計算體系按照任務的可并行性對任務進行劃分,根據(jù)各異構結點的計算資源和帶寬條件,從并行執(zhí)行時間出發(fā),對任務調(diào)度算法進行優(yōu)化,設計負載平衡調(diào)度方案,以實現(xiàn)資源的最優(yōu)配置。(3)計算體系在存儲資源上,整體采用分布式存儲的方式,桌面系統(tǒng)內(nèi)CPU-GPU異構并行采用虛擬統(tǒng)一存儲的方式,通過全局分布式存儲與局部共享存儲來平衡整體性能與編程復雜性。(4)體系采用CUDA+MPI的方式對分布式并行通信進行了優(yōu)化,實現(xiàn)異步處理模式,以及GPU-GPU之間的數(shù)據(jù)直接傳輸;結點內(nèi)在原有CPU-GPU異構通信方式的基礎上,優(yōu)化了基于總線方式的異構通信方法,通過全局數(shù)組映射數(shù)據(jù)存儲的方式,減少數(shù)據(jù)傳輸次數(shù),節(jié)約計算時間。本文針對體系中并行執(zhí)行效率和通信傳輸性能,通過自建數(shù)據(jù)特征匹配庫對該異構并行計算體系進行了測試。通過實驗數(shù)據(jù)的對比,相比傳統(tǒng)CPU-GPU異構并行計算結構,本文所做的優(yōu)化設計明顯提高了計算性能;異構并行計算體系的性能也優(yōu)于傳統(tǒng)以CPU主導的單GPU和單CPU并行計算體系。
【關鍵詞】:并行計算 高性能計算 CPU-GPU異構 負載平衡算法
【學位授予單位】:江蘇科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41;TP338.6
【目錄】:
- 摘要6-7
- Abstract7-13
- 第1章 緒論13-21
- 1.1 課題研究背景和意義13-14
- 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢14-19
- 1.2.1 CPU并行計算發(fā)展及研究現(xiàn)狀15-16
- 1.2.2 GPU并行計算發(fā)展及研究現(xiàn)狀16-17
- 1.2.3 異構并行計算的研究現(xiàn)狀及不足17-19
- 1.3 本文的主要工作19
- 1.4 論文的組織結構19-21
- 第2章 并行計算關鍵技術的研究21-37
- 2.1 多核CPU并行計算的關鍵技術21-23
- 2.2 多核GPU并行計算的關鍵技術23-26
- 2.3 現(xiàn)有并行計算體系結構26-28
- 2.3.1 現(xiàn)有高性能計算體系結構26-27
- 2.3.2 分布式并行計算體系結構27-28
- 2.4 并行計算訪存模型28-31
- 2.5 并行計算通信研究31-36
- 2.5.1 并行計算體系數(shù)據(jù)傳輸研究31-33
- 2.5.2 消息傳輸編程原理33-36
- 2.6 本章小結36-37
- 第3章 異構并行計算設計與實現(xiàn)37-45
- 3.1 CPU-GPU異構方法的優(yōu)化37
- 3.2 CPU-GPU異構并行架構37-39
- 3.3 負載平衡設計39-40
- 3.3.1 CPU-GPU任務劃分39
- 3.3.2 CPU-GPU通信傳輸設計39-40
- 3.4 CPU-GPU存儲模型40
- 3.5 整體流程40-41
- 3.6 數(shù)據(jù)測試與分析41-44
- 3.6.1 實驗測試環(huán)境41-42
- 3.6.2 實驗測試結果42-43
- 3.6.3 結果分析43-44
- 3.7 本章小結44-45
- 第4章 體系的整體設計與實現(xiàn)45-63
- 4.1 設計思路45-47
- 4.1.1 體系設計目標45-46
- 4.1.2 設計細節(jié)分析46-47
- 4.2 體系架構設計與分析47-49
- 4.3 異構并行計算體系網(wǎng)絡架構49-50
- 4.3.1 以太網(wǎng)下計算結點I/O架構49
- 4.3.2 Infiniband計算結點I/O架構49-50
- 4.4 負載平衡50-56
- 4.4.1 任務分析和劃分52-53
- 4.4.2 數(shù)據(jù)傳輸控制53-56
- 4.5 詳細設計56-61
- 4.5.1 整體設計56-58
- 4.5.2 負載平衡算法設計58-61
- 4.6 整體流程61
- 4.7 本章小結61-63
- 第5章 體系平臺測試和總結63-67
- 5.1 測試環(huán)境準備63-64
- 5.2 體系性能測試64-65
- 5.3 測試數(shù)據(jù)分析65-66
- 5.4 本章小結66-67
- 總結與展望67-69
- 參考文獻69-72
- 攻讀碩士學位期間發(fā)表的論文72-74
- 致謝74
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 陳華平 ;黃劉生 ;安虹 ;陳國良;;并行分布計算中的任務調(diào)度及其分類[J];計算機科學;2001年01期
2 柴亞輝;沈文楓;張倬;唐振;;Cell BE高性能計算實驗平臺設計與實現(xiàn)[J];實驗室研究與探索;2011年05期
本文關鍵詞:CPU-GPU異構并行計算體系的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:310539
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/310539.html
最近更新
教材專著