基于GPU平臺的KLU并行算法的研究與實現(xiàn)：預(yù)處理及回代求解

發(fā)布時間：2021-01-29 03:58

　　在大型電路模擬中,Ax=b形式的線性方程組的求解是影響電路模擬效率的關(guān)鍵問題。為了解決這一問題,目前已經(jīng)存在許多針對大型電路模擬矩陣的求解器,例如sparce 1.3、superLU、KLU等。實驗表明,與其他算法相比,KLU算法效率更高、更適合于處理大型電路模擬矩陣。KLU（Clark Kent LU）,是由Clark Kent專門針對大型電路模擬矩陣設(shè)計的一種新型的稀疏矩陣求解算法。KLU算法共分為四個階段：預(yù)處理階段、分解階段、再分解階段、求解階段。本文重點在GPU平臺上,對KLU算法中的預(yù)處理階段（btf_strongcomp算法、）和求解階段（klu_solve算法）進(jìn)行并行性研究與實現(xiàn)。在預(yù)處理階段,利用btf算法將矩陣轉(zhuǎn)化為上三角塊的形式。btf算法包括兩個部分：btf_maxtrans算法和btf_strongcomp算法。對btf_strongcomp算法在GPU平臺上的可并行性作了詳細(xì)的研究與探討,提出了幾種可并行的方案：深度優(yōu)先搜索算法、可達(dá)矩陣算法、zdec算法的...

【文章來源】：內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】：52 頁

【學(xué)位級別】：碩士

【部分圖文】：

GT200體系架構(gòu)felFigure2:1ArchitectureofaGT200}}

線程組,線程

k二el的執(zhí)行結(jié)果從顯卡的內(nèi)存中取回。在GPU上執(zhí)行的線程被組織成三層結(jié)構(gòu): (bloek)，第三層是線程(thread)，如圖2.3所示。host端和deviee端。host端是指在CPU上執(zhí)行device端的程序又被稱為kernel。通常host端程由GPU執(zhí)行kernel，完成后再由host端程序?qū)⒆罡邔邮蔷€程網(wǎng)格(幼d)，第二層是線程塊黝黝蘸蘸黔黔藻翼黔彝黔摹撇蒸毅髓髓瓤瓤蘸鬢鬢黝黝黝圖2.3線程組織結(jié)構(gòu)[sl Flgure2.3struetureofthread[8]在內(nèi)核中最基本的單位是線程(thread)，多個線程組合成線程塊(bfock)，多個線程塊又組成網(wǎng)格(grid)，目前，每個kernel中只能包含一個grid。在內(nèi)核中，我們通過threadldx.x，thre叱Idx.y

存儲器模型,設(shè)備,計算機(jī)行業(yè),蘋果

圖2.4CUDA設(shè)備存儲器模型[l”]Figure2.4C切Ad州eememo巧model[10]發(fā)展，2009年由計算機(jī)行業(yè)的幾家大公司，如蘋果司，共同開發(fā)了一套基于GPU平臺的標(biāo)準(zhǔn)編程模

本文編號：3006231

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3006231.html

上一篇：博物館溫濕度檢測系統(tǒng)的研究與改進(jìn)
下一篇：基于單片機(jī)的激光二極管溫度控制研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于GPU平臺的KLU并行算法的研究與實現(xiàn)：預(yù)處理及回代求解