天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

基于GPU平臺的KLU并行算法的研究與實現(xiàn):預(yù)處理及回代求解

發(fā)布時間:2021-01-29 03:58
  在大型電路模擬中,Ax=b形式的線性方程組的求解是影響電路模擬效率的關(guān)鍵問題。為了解決這一問題,目前已經(jīng)存在許多針對大型電路模擬矩陣的求解器,例如sparce 1.3、superLU、KLU等。實驗表明,與其他算法相比,KLU算法效率更高、更適合于處理大型電路模擬矩陣。KLU(Clark Kent LU),是由Clark Kent專門針對大型電路模擬矩陣設(shè)計的一種新型的稀疏矩陣求解算法。KLU算法共分為四個階段:預(yù)處理階段、分解階段、再分解階段、求解階段。本文重點在GPU平臺上,對KLU算法中的預(yù)處理階段(btfstrongcomp算法、)和求解階段(klusolve算法)進(jìn)行并行性研究與實現(xiàn)。在預(yù)處理階段,利用btf算法將矩陣轉(zhuǎn)化為上三角塊的形式。btf算法包括兩個部分:btfmaxtrans算法和btfstrongcomp算法。對btfstrongcomp算法在GPU平臺上的可并行性作了詳細(xì)的研究與探討,提出了幾種可并行的方案:深度優(yōu)先搜索算法、可達(dá)矩陣算法、zdec算法的... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:52 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于GPU平臺的KLU并行算法的研究與實現(xiàn):預(yù)處理及回代求解


GT200體系架構(gòu)felFigure2:1ArchitectureofaGT200}}

線程組,線程


k二el的執(zhí)行結(jié)果從顯卡的內(nèi)存中取回。在GPU上執(zhí)行的線程被組織成三層結(jié)構(gòu): (bloek),第三層是線程(thread),如圖2.3所示。host端和deviee端。host端是指在CPU上執(zhí)行device端的程序又被稱為kernel。通常host端程由GPU執(zhí)行kernel,完成后再由host端程序?qū)⒆罡邔邮蔷程網(wǎng)格(幼d),第二層是線程塊黝黝蘸 蘸黔黔藻翼黔彝黔摹撇蒸毅髓髓瓤瓤蘸鬢 鬢黝黝 黝圖2.3線程組織結(jié)構(gòu)[sl Flgure2.3struetureofthread[8]在內(nèi)核中最基本的單位是線程(thread),多個線程組合成線程塊(bfock),多個線程塊又組成網(wǎng)格(grid),目前,每個kernel中只能包含一個grid。在內(nèi)核中,我們通過threadldx.x,thre叱Idx.y

存儲器模型,設(shè)備,計算機(jī)行業(yè),蘋果


圖2.4CUDA設(shè)備存儲器模型[l”]Figure2.4C切Ad州eememo巧model[10]發(fā)展,2009年由計算機(jī)行業(yè)的幾家大公司,如蘋果司,共同開發(fā)了一套基于GPU平臺的標(biāo)準(zhǔn)編程模


本文編號:3006231

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3006231.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶28a91***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com