天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

CPU-GPU異構(gòu)并行計算體系的設(shè)計與實現(xiàn)

發(fā)布時間:2017-04-16 10:00

  本文關(guān)鍵詞:CPU-GPU異構(gòu)并行計算體系的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:隨著終端設(shè)備中CPU和GPU硬件的不斷升級,如何為低技術(shù)門檻用戶提供高性能計算成為了當(dāng)前的研究熱點。在綠色高性能計算時代,CPU-GPU異構(gòu)計算體系能夠提供良好的通用性、性能和效能,具有廣闊的發(fā)展前景。本文以現(xiàn)有桌面系統(tǒng)中的CPU和GPU硬件資源為基礎(chǔ),從任務(wù)劃分和數(shù)據(jù)傳輸兩方面對原有CPU-GPU異構(gòu)并行技術(shù)進(jìn)行了優(yōu)化,降低用戶對數(shù)據(jù)分配和處理的復(fù)雜度,設(shè)計并實現(xiàn)了CPU-GPU異構(gòu)并行計算體系,提高了終端設(shè)備的處理能力。本文的研究內(nèi)容及成果主要有以下幾個方面:(1)在分析和研究了桌面系統(tǒng)中多核CPU、GPU架構(gòu),以及原有CPU-GPU異構(gòu)并行技術(shù)的基礎(chǔ)上,優(yōu)化異構(gòu)并行計算的解決方法,設(shè)計了異構(gòu)并行計算架構(gòu),通過部署基于異構(gòu)桌面系統(tǒng)的結(jié)點組成了并行計算體系。(2)任務(wù)分配上,計算體系按照任務(wù)的可并行性對任務(wù)進(jìn)行劃分,根據(jù)各異構(gòu)結(jié)點的計算資源和帶寬條件,從并行執(zhí)行時間出發(fā),對任務(wù)調(diào)度算法進(jìn)行優(yōu)化,設(shè)計負(fù)載平衡調(diào)度方案,以實現(xiàn)資源的最優(yōu)配置。(3)計算體系在存儲資源上,整體采用分布式存儲的方式,桌面系統(tǒng)內(nèi)CPU-GPU異構(gòu)并行采用虛擬統(tǒng)一存儲的方式,通過全局分布式存儲與局部共享存儲來平衡整體性能與編程復(fù)雜性。(4)體系采用CUDA+MPI的方式對分布式并行通信進(jìn)行了優(yōu)化,實現(xiàn)異步處理模式,以及GPU-GPU之間的數(shù)據(jù)直接傳輸;結(jié)點內(nèi)在原有CPU-GPU異構(gòu)通信方式的基礎(chǔ)上,優(yōu)化了基于總線方式的異構(gòu)通信方法,通過全局?jǐn)?shù)組映射數(shù)據(jù)存儲的方式,減少數(shù)據(jù)傳輸次數(shù),節(jié)約計算時間。本文針對體系中并行執(zhí)行效率和通信傳輸性能,通過自建數(shù)據(jù)特征匹配庫對該異構(gòu)并行計算體系進(jìn)行了測試。通過實驗數(shù)據(jù)的對比,相比傳統(tǒng)CPU-GPU異構(gòu)并行計算結(jié)構(gòu),本文所做的優(yōu)化設(shè)計明顯提高了計算性能;異構(gòu)并行計算體系的性能也優(yōu)于傳統(tǒng)以CPU主導(dǎo)的單GPU和單CPU并行計算體系。
【關(guān)鍵詞】:并行計算 高性能計算 CPU-GPU異構(gòu) 負(fù)載平衡算法
【學(xué)位授予單位】:江蘇科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.41;TP338.6
【目錄】:
  • 摘要6-7
  • Abstract7-13
  • 第1章 緒論13-21
  • 1.1 課題研究背景和意義13-14
  • 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢14-19
  • 1.2.1 CPU并行計算發(fā)展及研究現(xiàn)狀15-16
  • 1.2.2 GPU并行計算發(fā)展及研究現(xiàn)狀16-17
  • 1.2.3 異構(gòu)并行計算的研究現(xiàn)狀及不足17-19
  • 1.3 本文的主要工作19
  • 1.4 論文的組織結(jié)構(gòu)19-21
  • 第2章 并行計算關(guān)鍵技術(shù)的研究21-37
  • 2.1 多核CPU并行計算的關(guān)鍵技術(shù)21-23
  • 2.2 多核GPU并行計算的關(guān)鍵技術(shù)23-26
  • 2.3 現(xiàn)有并行計算體系結(jié)構(gòu)26-28
  • 2.3.1 現(xiàn)有高性能計算體系結(jié)構(gòu)26-27
  • 2.3.2 分布式并行計算體系結(jié)構(gòu)27-28
  • 2.4 并行計算訪存模型28-31
  • 2.5 并行計算通信研究31-36
  • 2.5.1 并行計算體系數(shù)據(jù)傳輸研究31-33
  • 2.5.2 消息傳輸編程原理33-36
  • 2.6 本章小結(jié)36-37
  • 第3章 異構(gòu)并行計算設(shè)計與實現(xiàn)37-45
  • 3.1 CPU-GPU異構(gòu)方法的優(yōu)化37
  • 3.2 CPU-GPU異構(gòu)并行架構(gòu)37-39
  • 3.3 負(fù)載平衡設(shè)計39-40
  • 3.3.1 CPU-GPU任務(wù)劃分39
  • 3.3.2 CPU-GPU通信傳輸設(shè)計39-40
  • 3.4 CPU-GPU存儲模型40
  • 3.5 整體流程40-41
  • 3.6 數(shù)據(jù)測試與分析41-44
  • 3.6.1 實驗測試環(huán)境41-42
  • 3.6.2 實驗測試結(jié)果42-43
  • 3.6.3 結(jié)果分析43-44
  • 3.7 本章小結(jié)44-45
  • 第4章 體系的整體設(shè)計與實現(xiàn)45-63
  • 4.1 設(shè)計思路45-47
  • 4.1.1 體系設(shè)計目標(biāo)45-46
  • 4.1.2 設(shè)計細(xì)節(jié)分析46-47
  • 4.2 體系架構(gòu)設(shè)計與分析47-49
  • 4.3 異構(gòu)并行計算體系網(wǎng)絡(luò)架構(gòu)49-50
  • 4.3.1 以太網(wǎng)下計算結(jié)點I/O架構(gòu)49
  • 4.3.2 Infiniband計算結(jié)點I/O架構(gòu)49-50
  • 4.4 負(fù)載平衡50-56
  • 4.4.1 任務(wù)分析和劃分52-53
  • 4.4.2 數(shù)據(jù)傳輸控制53-56
  • 4.5 詳細(xì)設(shè)計56-61
  • 4.5.1 整體設(shè)計56-58
  • 4.5.2 負(fù)載平衡算法設(shè)計58-61
  • 4.6 整體流程61
  • 4.7 本章小結(jié)61-63
  • 第5章 體系平臺測試和總結(jié)63-67
  • 5.1 測試環(huán)境準(zhǔn)備63-64
  • 5.2 體系性能測試64-65
  • 5.3 測試數(shù)據(jù)分析65-66
  • 5.4 本章小結(jié)66-67
  • 總結(jié)與展望67-69
  • 參考文獻(xiàn)69-72
  • 攻讀碩士學(xué)位期間發(fā)表的論文72-74
  • 致謝74

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 陳華平 ;黃劉生 ;安虹 ;陳國良;;并行分布計算中的任務(wù)調(diào)度及其分類[J];計算機(jī)科學(xué);2001年01期

2 柴亞輝;沈文楓;張倬;唐振;;Cell BE高性能計算實驗平臺設(shè)計與實現(xiàn)[J];實驗室研究與探索;2011年05期


  本文關(guān)鍵詞:CPU-GPU異構(gòu)并行計算體系的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。

,

本文編號:310539

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/310539.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶56b90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com