基于GPU平臺的KLU并行算法的研究與實現(xiàn):預(yù)處理及回代求解
發(fā)布時間:2021-01-29 03:58
在大型電路模擬中,Ax=b形式的線性方程組的求解是影響電路模擬效率的關(guān)鍵問題。為了解決這一問題,目前已經(jīng)存在許多針對大型電路模擬矩陣的求解器,例如sparce 1.3、superLU、KLU等。實驗表明,與其他算法相比,KLU算法效率更高、更適合于處理大型電路模擬矩陣。KLU(Clark Kent LU),是由Clark Kent專門針對大型電路模擬矩陣設(shè)計的一種新型的稀疏矩陣求解算法。KLU算法共分為四個階段:預(yù)處理階段、分解階段、再分解階段、求解階段。本文重點在GPU平臺上,對KLU算法中的預(yù)處理階段(btfstrongcomp算法、)和求解階段(klusolve算法)進(jìn)行并行性研究與實現(xiàn)。在預(yù)處理階段,利用btf算法將矩陣轉(zhuǎn)化為上三角塊的形式。btf算法包括兩個部分:btfmaxtrans算法和btfstrongcomp算法。對btfstrongcomp算法在GPU平臺上的可并行性作了詳細(xì)的研究與探討,提出了幾種可并行的方案:深度優(yōu)先搜索算法、可達(dá)矩陣算法、zdec算法的...
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
GT200體系架構(gòu)felFigure2:1ArchitectureofaGT200}}
k二el的執(zhí)行結(jié)果從顯卡的內(nèi)存中取回。在GPU上執(zhí)行的線程被組織成三層結(jié)構(gòu): (bloek),第三層是線程(thread),如圖2.3所示。host端和deviee端。host端是指在CPU上執(zhí)行device端的程序又被稱為kernel。通常host端程由GPU執(zhí)行kernel,完成后再由host端程序?qū)⒆罡邔邮蔷程網(wǎng)格(幼d),第二層是線程塊黝黝蘸 蘸黔黔藻翼黔彝黔摹撇蒸毅髓髓瓤瓤蘸鬢 鬢黝黝 黝圖2.3線程組織結(jié)構(gòu)[sl Flgure2.3struetureofthread[8]在內(nèi)核中最基本的單位是線程(thread),多個線程組合成線程塊(bfock),多個線程塊又組成網(wǎng)格(grid),目前,每個kernel中只能包含一個grid。在內(nèi)核中,我們通過threadldx.x,thre叱Idx.y
圖2.4CUDA設(shè)備存儲器模型[l”]Figure2.4C切Ad州eememo巧model[10]發(fā)展,2009年由計算機(jī)行業(yè)的幾家大公司,如蘋果司,共同開發(fā)了一套基于GPU平臺的標(biāo)準(zhǔn)編程模
本文編號:3006231
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
GT200體系架構(gòu)felFigure2:1ArchitectureofaGT200}}
k二el的執(zhí)行結(jié)果從顯卡的內(nèi)存中取回。在GPU上執(zhí)行的線程被組織成三層結(jié)構(gòu): (bloek),第三層是線程(thread),如圖2.3所示。host端和deviee端。host端是指在CPU上執(zhí)行device端的程序又被稱為kernel。通常host端程由GPU執(zhí)行kernel,完成后再由host端程序?qū)⒆罡邔邮蔷程網(wǎng)格(幼d),第二層是線程塊黝黝蘸 蘸黔黔藻翼黔彝黔摹撇蒸毅髓髓瓤瓤蘸鬢 鬢黝黝 黝圖2.3線程組織結(jié)構(gòu)[sl Flgure2.3struetureofthread[8]在內(nèi)核中最基本的單位是線程(thread),多個線程組合成線程塊(bfock),多個線程塊又組成網(wǎng)格(grid),目前,每個kernel中只能包含一個grid。在內(nèi)核中,我們通過threadldx.x,thre叱Idx.y
圖2.4CUDA設(shè)備存儲器模型[l”]Figure2.4C切Ad州eememo巧model[10]發(fā)展,2009年由計算機(jī)行業(yè)的幾家大公司,如蘋果司,共同開發(fā)了一套基于GPU平臺的標(biāo)準(zhǔn)編程模
本文編號:3006231
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3006231.html
最近更新
教材專著