基于GPU的多波前稀疏Cholesky分解優(yōu)化方法的研究
本文關(guān)鍵詞:基于GPU的多波前稀疏Cholesky分解優(yōu)化方法的研究
更多相關(guān)文章: 喬里斯基分解 多波前方法 多任務(wù)隊列方案 任務(wù)分配 圖形處理器
【摘要】:在大量的科學計算和工程應(yīng)用中,稀疏線性方程組的求解是一個特別重要的部分,Cholesky分解因具有很高的性能且計算結(jié)果精確常用來分解大的稀疏線性方程組。過去,為了減少總的計算時間,有很多科研人員利用CPU集群分解稀疏矩陣。如今,隨著圖形處理器(Graphics Processing Unit,GPU)計算能力的快速提升,已有采用GPU加速稀疏線性方程組求解的方案。為了提升性能,這些方案把計算量大的操作分配給GPU處理,但因GPU編程模式的原因,這些方案往往無法充分利用GPU的計算資源。針對目前GPU處理稀疏線性方程組存在的問題,提出并實現(xiàn)了基于GPU的多波前稀疏Cholesky分解方法。多波前方法將一個大的稀疏矩陣分解為一系列小的稠密矩陣,然后再對這些稠密矩陣進行處理,在每個稠密矩陣的分解過程中,矩陣與矩陣的乘法(General Matrix-matrix Multiplication,GEMM)運算占據(jù)了絕大部分的計算時間,而且多個GEMM運算很難在GPU上并行執(zhí)行,為了提升程序的性能,從三個角度對程序進行了優(yōu)化。多任務(wù)隊列方案用于在GPU的內(nèi)核函數(shù)中同時執(zhí)行多個GEMM操作,多個GEMM操作的計算時間以及數(shù)據(jù)傳輸?shù)拈_銷都能得到隱藏,減少了總的計算時間;為了使每個GEMM操作的處理時間都是最少的,設(shè)定一個閾值來決定GEMM操作的處理平臺:如果某個GEMM操作涉及的計算量比該閾值大,就將其分配給GPU處理,否則分配給CPU處理;在GPU上利用多個線程塊處理一個GEMM運算,同時,優(yōu)化算法的執(zhí)行流程來提升GEMM操作的性能;贚inux操作系統(tǒng)和CUDA編程環(huán)境,采用4種測試方案在6組測試數(shù)據(jù)上進行了性能對比。實驗結(jié)果表明:基于GPU的多波前稀疏Cholesky分解方法,與CPU實現(xiàn)的多線程Cholesky分解相比,加速比達到了3.15倍;同時,與現(xiàn)有的GPU加速方案相比,加速比達到了1.98倍。3種優(yōu)化措施被應(yīng)用于電力系統(tǒng)潮流計算中后,程序的性能也得到了明顯的提升。
【關(guān)鍵詞】:喬里斯基分解 多波前方法 多任務(wù)隊列方案 任務(wù)分配 圖形處理器
【學位授予單位】:華中科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:O241.6
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-16
- 1.1 問題的提出9-10
- 1.2 課題背景與研究意義10-11
- 1.3 國內(nèi)外研究現(xiàn)狀11-14
- 1.4 研究內(nèi)容14-15
- 1.5 本文結(jié)構(gòu)框架15-16
- 2 多波前稀疏Cholesky分解方法的分析與設(shè)計16-26
- 2.1 多波前稀疏Cholesky分解的原理16-17
- 2.2 性能瓶頸分析17-20
- 2.3 多波前稀疏Cholesky分解的設(shè)計思路20-25
- 2.4 本章小結(jié)25-26
- 3 多波前稀疏Cholesky分解方法的優(yōu)化26-40
- 3.1 多任務(wù)隊列方案的設(shè)計26-33
- 3.2 CPU-GPU間的任務(wù)分配33-35
- 3.3 GPU上GEMM運算的優(yōu)化35-38
- 3.4 本章小結(jié)38-40
- 4 系統(tǒng)測試與分析40-50
- 4.1 測試環(huán)境與方法40-41
- 4.2 整體性能測試41-45
- 4.3 CPU-GPU間矩陣分配的性能測試45-47
- 4.4 在電力系統(tǒng)潮流計算中的應(yīng)用與測試47-48
- 4.5 本章小結(jié)48-50
- 5 總結(jié)與展望50-52
- 致謝52-54
- 參考文獻54-58
- 附錄1 攻讀碩士期間發(fā)表的論文58-59
- 附錄2 攻讀碩士期間申請的國家發(fā)明專利59-60
- 附錄3 攻讀碩士期間參與的項目60
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李玉梅;矩陣分塊的幾個重要應(yīng)用[J];懷化師專學報;2000年02期
2 侯秋果;;矩陣分塊的應(yīng)用[J];科技信息(科學教研);2008年13期
3 紀坤;陳建平;石振國;劉維富;;矩陣三角分解分塊算法的研究與實現(xiàn)[J];計算機應(yīng)用與軟件;2010年09期
4 長日;矩陣分塊法的應(yīng)用[J];福清師專學報;1981年00期
5 陸余楚,朱文興;矩陣的分塊、零化與攝動[J];工科數(shù)學;1986年03期
6 黃廷祝,游兆永;矩陣的G-分塊對角占優(yōu)性[J];工程數(shù)學學報;1993年03期
7 徐道義;;區(qū)間矩陣的穩(wěn)定性[J];自然雜志;1988年05期
8 金基平;電場問題優(yōu)化的矩陣分塊解法[J];高壓電器;1991年05期
9 李源;黃輝;郝小枝;;計算矩陣高次方冪的幾種方法[J];云南大學學報(自然科學版);2008年S2期
10 J.E.克雷爾伯特;;地球物理資料處理基礎(chǔ)[J];石油地球物理勘探;1978年05期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 支希哲;孟光;顧致平;;穩(wěn)定性判定陣的分塊確定法[A];1995中國控制與決策學術(shù)年會論文集[C];1995年
2 吳柏生;李正光;;結(jié)構(gòu)布局修改的重分析方法[A];第九屆全國結(jié)構(gòu)工程學術(shù)會議論文集第Ⅱ卷[C];2000年
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 黃澤軍;關(guān)于矩陣組合分析性質(zhì)的若干結(jié)果[D];華東師范大學;2011年
2 沈長鵬;訂單結(jié)構(gòu)與揀選系統(tǒng)的適配問題研究[D];山東大學;2011年
3 申淑謙;特殊矩陣數(shù)值分析和鞍點問題迭代求解預(yù)處理技術(shù)[D];電子科技大學;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 陳磊;面向多核DSP的高性能并行BLAS3的設(shè)計與實現(xiàn)[D];國防科學技術(shù)大學;2013年
2 曾侃圢;基于電阻矩陣定位原理的潰壩模型試驗測量技術(shù)研究[D];重慶交通大學;2015年
3 趙祥宇;基于Spark平臺的大矩陣LU分解及求逆算法的研究與實現(xiàn)[D];北京交通大學;2016年
4 王偉;基于GPU的多波前稀疏Cholesky分解優(yōu)化方法的研究[D];華中科技大學;2015年
5 劉真;基于用戶評分矩陣分塊的魯棒推薦模型研究[D];燕山大學;2013年
6 黃榮;幾類分塊組合選取因子法的非奇H-矩陣判定[D];湘潭大學;2005年
7 符和滿;符號空間一類稠密混沌系統(tǒng)的矩陣刻畫[D];華南師范大學;2005年
8 樓Z蟍;M-矩陣等特殊矩陣及其特殊積[D];陜西師范大學;2004年
9 杜翠真;五階完全正矩陣[D];安徽大學;2005年
10 陳一昭;并行計算在矩陣運算中的應(yīng)用[D];昆明理工大學;2011年
,本文編號:985146
本文鏈接:http://sikaile.net/kejilunwen/yysx/985146.html