天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

CPU-GPU異構并行計算體系的設計與實現(xiàn)

發(fā)布時間:2017-04-16 10:00

  本文關鍵詞:CPU-GPU異構并行計算體系的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。


【摘要】:隨著終端設備中CPU和GPU硬件的不斷升級,如何為低技術門檻用戶提供高性能計算成為了當前的研究熱點。在綠色高性能計算時代,CPU-GPU異構計算體系能夠提供良好的通用性、性能和效能,具有廣闊的發(fā)展前景。本文以現(xiàn)有桌面系統(tǒng)中的CPU和GPU硬件資源為基礎,從任務劃分和數(shù)據(jù)傳輸兩方面對原有CPU-GPU異構并行技術進行了優(yōu)化,降低用戶對數(shù)據(jù)分配和處理的復雜度,設計并實現(xiàn)了CPU-GPU異構并行計算體系,提高了終端設備的處理能力。本文的研究內(nèi)容及成果主要有以下幾個方面:(1)在分析和研究了桌面系統(tǒng)中多核CPU、GPU架構,以及原有CPU-GPU異構并行技術的基礎上,優(yōu)化異構并行計算的解決方法,設計了異構并行計算架構,通過部署基于異構桌面系統(tǒng)的結點組成了并行計算體系。(2)任務分配上,計算體系按照任務的可并行性對任務進行劃分,根據(jù)各異構結點的計算資源和帶寬條件,從并行執(zhí)行時間出發(fā),對任務調(diào)度算法進行優(yōu)化,設計負載平衡調(diào)度方案,以實現(xiàn)資源的最優(yōu)配置。(3)計算體系在存儲資源上,整體采用分布式存儲的方式,桌面系統(tǒng)內(nèi)CPU-GPU異構并行采用虛擬統(tǒng)一存儲的方式,通過全局分布式存儲與局部共享存儲來平衡整體性能與編程復雜性。(4)體系采用CUDA+MPI的方式對分布式并行通信進行了優(yōu)化,實現(xiàn)異步處理模式,以及GPU-GPU之間的數(shù)據(jù)直接傳輸;結點內(nèi)在原有CPU-GPU異構通信方式的基礎上,優(yōu)化了基于總線方式的異構通信方法,通過全局數(shù)組映射數(shù)據(jù)存儲的方式,減少數(shù)據(jù)傳輸次數(shù),節(jié)約計算時間。本文針對體系中并行執(zhí)行效率和通信傳輸性能,通過自建數(shù)據(jù)特征匹配庫對該異構并行計算體系進行了測試。通過實驗數(shù)據(jù)的對比,相比傳統(tǒng)CPU-GPU異構并行計算結構,本文所做的優(yōu)化設計明顯提高了計算性能;異構并行計算體系的性能也優(yōu)于傳統(tǒng)以CPU主導的單GPU和單CPU并行計算體系。
【關鍵詞】:并行計算 高性能計算 CPU-GPU異構 負載平衡算法
【學位授予單位】:江蘇科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41;TP338.6
【目錄】:
  • 摘要6-7
  • Abstract7-13
  • 第1章 緒論13-21
  • 1.1 課題研究背景和意義13-14
  • 1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢14-19
  • 1.2.1 CPU并行計算發(fā)展及研究現(xiàn)狀15-16
  • 1.2.2 GPU并行計算發(fā)展及研究現(xiàn)狀16-17
  • 1.2.3 異構并行計算的研究現(xiàn)狀及不足17-19
  • 1.3 本文的主要工作19
  • 1.4 論文的組織結構19-21
  • 第2章 并行計算關鍵技術的研究21-37
  • 2.1 多核CPU并行計算的關鍵技術21-23
  • 2.2 多核GPU并行計算的關鍵技術23-26
  • 2.3 現(xiàn)有并行計算體系結構26-28
  • 2.3.1 現(xiàn)有高性能計算體系結構26-27
  • 2.3.2 分布式并行計算體系結構27-28
  • 2.4 并行計算訪存模型28-31
  • 2.5 并行計算通信研究31-36
  • 2.5.1 并行計算體系數(shù)據(jù)傳輸研究31-33
  • 2.5.2 消息傳輸編程原理33-36
  • 2.6 本章小結36-37
  • 第3章 異構并行計算設計與實現(xiàn)37-45
  • 3.1 CPU-GPU異構方法的優(yōu)化37
  • 3.2 CPU-GPU異構并行架構37-39
  • 3.3 負載平衡設計39-40
  • 3.3.1 CPU-GPU任務劃分39
  • 3.3.2 CPU-GPU通信傳輸設計39-40
  • 3.4 CPU-GPU存儲模型40
  • 3.5 整體流程40-41
  • 3.6 數(shù)據(jù)測試與分析41-44
  • 3.6.1 實驗測試環(huán)境41-42
  • 3.6.2 實驗測試結果42-43
  • 3.6.3 結果分析43-44
  • 3.7 本章小結44-45
  • 第4章 體系的整體設計與實現(xiàn)45-63
  • 4.1 設計思路45-47
  • 4.1.1 體系設計目標45-46
  • 4.1.2 設計細節(jié)分析46-47
  • 4.2 體系架構設計與分析47-49
  • 4.3 異構并行計算體系網(wǎng)絡架構49-50
  • 4.3.1 以太網(wǎng)下計算結點I/O架構49
  • 4.3.2 Infiniband計算結點I/O架構49-50
  • 4.4 負載平衡50-56
  • 4.4.1 任務分析和劃分52-53
  • 4.4.2 數(shù)據(jù)傳輸控制53-56
  • 4.5 詳細設計56-61
  • 4.5.1 整體設計56-58
  • 4.5.2 負載平衡算法設計58-61
  • 4.6 整體流程61
  • 4.7 本章小結61-63
  • 第5章 體系平臺測試和總結63-67
  • 5.1 測試環(huán)境準備63-64
  • 5.2 體系性能測試64-65
  • 5.3 測試數(shù)據(jù)分析65-66
  • 5.4 本章小結66-67
  • 總結與展望67-69
  • 參考文獻69-72
  • 攻讀碩士學位期間發(fā)表的論文72-74
  • 致謝74

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 陳華平 ;黃劉生 ;安虹 ;陳國良;;并行分布計算中的任務調(diào)度及其分類[J];計算機科學;2001年01期

2 柴亞輝;沈文楓;張倬;唐振;;Cell BE高性能計算實驗平臺設計與實現(xiàn)[J];實驗室研究與探索;2011年05期


  本文關鍵詞:CPU-GPU異構并行計算體系的設計與實現(xiàn),由筆耕文化傳播整理發(fā)布。

,

本文編號:310539

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/310539.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶56b90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产成人精品视频一二区| 日韩精品一区二区毛片| 中文字幕精品人妻一区| 在线观看那种视频你懂的| 国产在线不卡中文字幕| 超薄肉色丝袜脚一区二区| 久久99青青精品免费观看| 久久re6热在线视频| 在线观看免费视频你懂的| 日本一区二区三区久久娇喘| 字幕日本欧美一区二区| 亚洲国产丝袜一区二区三区四| 国产日韩精品欧美综合区| 欧美一区二区不卡专区| 黑鬼糟蹋少妇资源在线观看| 91亚洲国产—区=区a| 日韩欧美国产精品自拍| 亚洲综合伊人五月天中文 | 精品一区二区三区免费看| 欧美区一区二在线播放| 欧美日韩久久精品一区二区| 国产自拍欧美日韩在线观看| 免费观看成人免费视频| 国产美女精品人人做人人爽| 亚洲成人黄色一级大片| 亚洲综合精品天堂夜夜| 在线观看国产成人av天堂野外| 激情五月天免费在线观看| 高潮少妇高潮久久精品99| 久热这里只有精品九九| 五月综合婷婷在线伊人| 人人妻人人澡人人夜夜| 福利视频一区二区三区| 午夜精品在线观看视频午夜| 加勒比东京热拍拍一区二区| 国产亚洲精品久久久优势| 欧美三级精品在线观看| 欧洲日韩精品一区二区三区| 欧美精品一区二区水蜜桃| 免费黄片视频美女一区| 乱女午夜精品一区二区三区|