基于OpenCL的多GPU并行計(jì)算的研究與應(yīng)用
發(fā)布時(shí)間:2017-09-29 09:04
本文關(guān)鍵詞:基于OpenCL的多GPU并行計(jì)算的研究與應(yīng)用
更多相關(guān)文章: 異構(gòu)計(jì)算 開(kāi)放運(yùn)算語(yǔ)言 GPU通用計(jì)算 并行計(jì)算
【摘要】:異構(gòu)計(jì)算被視為計(jì)算機(jī)處理器的發(fā)展繼單核、多核之后的第三個(gè)時(shí)代,它實(shí)現(xiàn)了多種體系架構(gòu)的處理器間協(xié)同運(yùn)算,有效緩解在提升CPU時(shí)鐘頻率和內(nèi)核數(shù)量的過(guò)程中遇到的散熱和能耗問(wèn)題,同時(shí)增強(qiáng)了計(jì)算平臺(tái)的可擴(kuò)展性。 異構(gòu)計(jì)算系統(tǒng)通常包含除CPU以外的一個(gè)或多個(gè)協(xié)處理器,協(xié)處理器一般是包含眾多處理核心的專用功能計(jì)算設(shè)備,只有通過(guò)合適的并行程序才能充分利用其并行計(jì)算能力。OpenCL是一個(gè)為異構(gòu)設(shè)備編寫程序的標(biāo)準(zhǔn)框架,,雖然它的出現(xiàn)增加了程序在各平臺(tái)之間的可移植性,但是在多個(gè)計(jì)算設(shè)備協(xié)同計(jì)算時(shí),多種計(jì)算設(shè)備的調(diào)用、設(shè)備間的負(fù)載均衡等問(wèn)題嚴(yán)重制約了它的普及。因此,對(duì)異構(gòu)系統(tǒng)下多設(shè)備并行計(jì)算的研究具有重要的意義。 本文依據(jù)OpenCL規(guī)范,利用多線程技術(shù)實(shí)現(xiàn)了多平臺(tái)下多GPU的調(diào)用,分析了不同的任務(wù)劃分模型對(duì)計(jì)算性能的影響,優(yōu)化了存儲(chǔ)器間的數(shù)據(jù)傳輸。隨后,設(shè)計(jì)了可利用多個(gè)GPU輔助加速的兩個(gè)算法來(lái)驗(yàn)證多GPU并行計(jì)算研究的可行性,第一個(gè)算法為適合較大規(guī)模數(shù)據(jù)的內(nèi)部排序算法,算法中設(shè)計(jì)了適合設(shè)備端的GPU內(nèi)部排序算法和主機(jī)端的基于敗者樹數(shù)據(jù)結(jié)構(gòu)的歸并排序算法,與CPU串行排序算法相比,該算法在多GPU的輔助下對(duì)較大規(guī)模數(shù)據(jù)的排序運(yùn)算時(shí),性能提升了十倍左右。另一個(gè)算法利用多GPU加速柔性作業(yè)車間調(diào)度問(wèn)題的求解,該算法設(shè)計(jì)了適合GPU架構(gòu)的數(shù)據(jù)結(jié)構(gòu)以及基于島嶼模型的遺傳算法,利用GPU提高了種群內(nèi)個(gè)體的進(jìn)化以及個(gè)體的評(píng)估效率。該算法在多GPU的加速下,與基于CPU的遺傳算法求解柔性作業(yè)車間調(diào)度問(wèn)題相比,在處理更大種群規(guī)模的前提下,在更短的時(shí)間內(nèi)取得了較優(yōu)的解。
【關(guān)鍵詞】:異構(gòu)計(jì)算 開(kāi)放運(yùn)算語(yǔ)言 GPU通用計(jì)算 并行計(jì)算
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP338.6
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-18
- 1.1 課題研究的背景和意義10-11
- 1.2 異構(gòu)計(jì)算的介紹及研究現(xiàn)狀11-16
- 1.2.1 CPU-GPU 異構(gòu)計(jì)算11-13
- 1.2.2 CPU-GPU 協(xié)同計(jì)算模式13-14
- 1.2.3 國(guó)內(nèi)外研究現(xiàn)狀與應(yīng)用14-16
- 1.3 課題的來(lái)源及研究?jī)?nèi)容16-18
- 1.3.1 課題來(lái)源16-17
- 1.3.2 課題的主要研究?jī)?nèi)容17-18
- 第2章 OpenCL 概述18-28
- 2.1 異構(gòu)計(jì)算18-19
- 2.2 并行編程模型19-22
- 2.2.1 OpenMP 編程模型20-22
- 2.2.2 流編程模型22
- 2.3 OpenCL 簡(jiǎn)介22-27
- 2.3.1 OpenCL 與 CUDA 架構(gòu)的關(guān)系23
- 2.3.2 OpenCL 模型介紹23-27
- 2.4 OpenCL 編程步驟27
- 2.5 本章小結(jié)27-28
- 第3章 多 GPU 的調(diào)用以及性能優(yōu)化研究28-38
- 3.1 多 GPU 的調(diào)用28-33
- 3.1.1 單平臺(tái)下多 GPU 的調(diào)用28-30
- 3.1.2 多平臺(tái)下多 GPU 的調(diào)用30-33
- 3.2 負(fù)載均衡分析與設(shè)計(jì)33-35
- 3.3 存儲(chǔ)器間數(shù)據(jù)傳輸分析與優(yōu)化35-37
- 3.3.1 數(shù)據(jù)傳輸分析35-36
- 3.3.2 全局存儲(chǔ)器訪存優(yōu)化36-37
- 3.4 本章小結(jié)37-38
- 第4章 基于多 GPU 輔助的內(nèi)部排序算法38-44
- 4.1 算法分析與設(shè)計(jì)38-41
- 4.1.1 基于 GPU 的排序算法39-40
- 4.1.2 基于 CPU 的歸并排序算法40-41
- 4.2 算法性能分析41-43
- 4.2.1 空間復(fù)雜度41-42
- 4.2.2 時(shí)間復(fù)雜度42
- 4.2.3 實(shí)驗(yàn)結(jié)果與分析42-43
- 4.3 本章小結(jié)43-44
- 第5章 基于多 GPU 的柔性作業(yè)車間調(diào)度問(wèn)題研究44-56
- 5.1 柔性作業(yè)車間調(diào)度問(wèn)題描述及研究現(xiàn)狀44-46
- 5.1.1 FJSP 問(wèn)題描述44-45
- 5.1.2 FJSP 評(píng)價(jià)指標(biāo)45
- 5.1.3 基于遺傳算法的 FJSP 問(wèn)題研究現(xiàn)狀45-46
- 5.2 算法設(shè)計(jì)46-54
- 5.2.1 存儲(chǔ)模型46-47
- 5.2.2 執(zhí)行模型47-49
- 5.2.3 染色體模型49-51
- 5.2.4 遺傳算法51-54
- 5.3 實(shí)驗(yàn)結(jié)果與分析54-55
- 5.4 本章小結(jié)55-56
- 結(jié)論56-57
- 參考文獻(xiàn)57-61
- 攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文61-62
- 致謝62
【引證文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 吳蘭;基于HSA的Kaveri測(cè)試與優(yōu)化[D];蘇州大學(xué);2014年
本文編號(hào):941122
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/941122.html
最近更新
教材專著