天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 電氣論文 >

基于CUDA平臺(tái)的有限元單元級(jí)別并行算法研究

發(fā)布時(shí)間:2020-09-25 17:21
   對(duì)于大型工程電磁場的分析,存在著諸如電力設(shè)備整體尺寸過大而鐵磁材料電磁場透入深度很小的多尺度問題、電磁特性的非線性且各向異性問題使得電磁場數(shù)值計(jì)算規(guī)模過大。采用常規(guī)串行有限元法會(huì)出現(xiàn)計(jì)算時(shí)間過長,計(jì)算結(jié)果誤差大的問題,有時(shí)甚至無法進(jìn)行計(jì)算。因此,有限元并行算法將成為研究的熱點(diǎn)。GPU是專為密集型、高度并行化的計(jì)算而設(shè)計(jì)的可編程流處理器,其眾核性質(zhì)能夠?yàn)閱卧?jí)別并行計(jì)算提供保障。本文研究了一種單元級(jí)別的有限元并行算法(EBE-PFEM)并將其在CUDA平臺(tái)上并行實(shí)現(xiàn)。本文推導(dǎo)了EBE(element-by-element)有限元法的數(shù)學(xué)模型,并給出了第一類邊界條件的EBE處理,研究了基于EBE策略的共軛梯度(EBE-CG)法。為了改善共軛梯度法的收斂性,本文使用的是雅克比(Jacobi)預(yù)處理技術(shù),并對(duì)基于EBE策略的Jacobi預(yù)處理共軛梯度(EBE-J-PCG)法進(jìn)行了推導(dǎo),并給出具體迭代過程。為發(fā)揮EBE有限元法并行度高的優(yōu)勢,研究基于CUDA平臺(tái)的GPU硬件結(jié)構(gòu)及指令執(zhí)行特點(diǎn),將結(jié)合Jacobi預(yù)處理技術(shù)的EBE-J-PCG方法在CUDA平臺(tái)上并行實(shí)現(xiàn),給出了基于CUDA平臺(tái)的EBE-J-PCG方法的CPU-GPU協(xié)同計(jì)算模型,并用C++語言編制了相應(yīng)的程序。通過與長直載流導(dǎo)體空間磁場解析解的比較,驗(yàn)證了算法與程序的正確性。最后,分別在CPU平臺(tái)和CUDA平臺(tái)上使用EBE-CG方法和結(jié)合Jacobi預(yù)處理的EBE-J-PCG方法求解一臺(tái)單相電力變壓器和三相感應(yīng)電機(jī)的主磁場分布。在計(jì)算精度相同的情況下,采用Jacobi預(yù)處理技術(shù)能夠提高算法的收斂性;相比于只在CPU平臺(tái)上運(yùn)行的EBE有限元分析,基于CUDA平臺(tái)的EBE有限元并行計(jì)算獲得了更高的計(jì)算效率,并且計(jì)算規(guī)模越大,加速比越高。該方法可用于大型電力設(shè)備的大規(guī)模數(shù)值計(jì)算。
【學(xué)位單位】:沈陽工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TM15
【部分圖文】:

網(wǎng)格剖分,聯(lián)系矩陣


沈陽工業(yè)大學(xué)碩士學(xué)位論文14圖2.1 網(wǎng)格剖分圖Fig. 2.1 Mesh subdivision以單元(1)為例,該單元的單元系數(shù)矩陣為:(1) (1) (1)11 12 14(1) (1) (1) (1)21 22 24(1) (1) (1)41 42 44= A A AA A A AA A A(2.25)單元(1)的系數(shù)矩陣對(duì)總體系數(shù)矩陣的貢獻(xiàn)為:(1) (1) (1)11 12 14(1) (1) (1)21 22 24(1)(1) (1) (1)41 42 430 0 00 0 00 0 0 0 0 0 =0 0 00 0 0 0 0 00 0 0 0 0 0 A A AA A AAA A A(2.26)由節(jié)點(diǎn)聯(lián)系矩陣的特點(diǎn)能夠得到單元(1)的節(jié)點(diǎn)聯(lián)系矩陣,具體形式如下:(1)1 0 0 0 0 0= 0 1 0 0 0 00 0 0 1 0 0 Q (2.27)同理可得,其余三個(gè)單元的節(jié)點(diǎn)聯(lián)系矩陣(2)Q ,(3)Q ,(4)Q 的具體形式,根據(jù)公式(2.17)得到總體聯(lián)系矩陣 Q。以單元(1)為例,節(jié)點(diǎn)變量?

架構(gòu)圖,架構(gòu)


通過 PCI-E 總線將其與 CPU 相連才能夠進(jìn)行工作。它在顯卡中發(fā)揮著是顯卡中必不可少的一部分。不同的 GPU 架構(gòu)的設(shè)計(jì)理念、工藝水平的結(jié)構(gòu)和性能也不一樣。不同的架構(gòu)擁有不同的計(jì)算能力。接下來分U 的具體硬件特性。orce GTX-960M 采用的是基于 Maxwell 架構(gòu)的 GM206 核心(如圖 架構(gòu)對(duì)流多處理器(Streaming Multiprocessor,SM)進(jìn)行了升級(jí),變?yōu)樘幚砥鳎ㄈ鐖D 3.2)中包含了 128 個(gè) CUDA 核心、32 個(gè)特殊功能單元 Unit,SFU)、32 個(gè)存取單元(load/store unites,LD/ST)、4 個(gè)指令分調(diào)度器和 4 個(gè)線程束調(diào)度器。即本文在此硬件架構(gòu)下使用算法程序進(jìn)行SM 上能夠同時(shí)發(fā)送和執(zhí)行 4 個(gè)線程束,能夠在每個(gè)時(shí)鐘內(nèi)啟動(dòng) 8 架構(gòu)由內(nèi)存控制器、圖形處理器簇(Graph Processing Cluster,GPC)、CI-E 接口構(gòu)成。其中,每個(gè) GPC 由一個(gè)光柵單元和 4 個(gè) SMM 構(gòu)成,PC。即本文進(jìn)行并行計(jì)算時(shí),能夠同時(shí)執(zhí)行 16 個(gè)流多處理器。

架構(gòu)圖,架構(gòu),代碼


圖3.2 SMM 架構(gòu)Fig. 3.2 Architecture of SMM體系開發(fā)的基本軟件環(huán)境由 CUDA 庫函數(shù)(CUDA Library)、及行業(yè)標(biāo)準(zhǔn)程序語言的擴(kuò)展(包括 C、C++、Fortran 等)構(gòu)體系。CUDA C++是標(biāo)準(zhǔn) ANSI C 語言的一個(gè)擴(kuò)展,帶有少程成為可能,同時(shí)也能通過 API 來管理設(shè)備、內(nèi)存和其他任進(jìn)行編譯時(shí),會(huì)將在 GPU 上運(yùn)行的代碼與 CPU 上運(yùn)行的將在 GPU 上運(yùn)行的代碼編譯為 PTX 代碼,而在 CPU 上運(yùn)行編譯,并通過 C 文件的方式給出。CUDA 提供了 CUDAAPI 兩層 API 來管理 GPU 設(shè)備和組織線程。在一個(gè)程序中只 CUDA driver API 的其中一種,本文使用的是 CUDA runtim

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳國良;孫廣中;徐云;呂敏;;并行算法研究方法學(xué)[J];計(jì)算機(jī)學(xué)報(bào);2008年09期

2 陳國良;昔日王榭堂前燕,飛入尋常百姓家淺談并行算法[J];新電腦;2002年12期

3 方同祝;并行算法在系統(tǒng)仿真中的應(yīng)用[J];微機(jī)發(fā)展;1999年04期

4 壽標(biāo),李曉峰;更實(shí)際的并行算法的設(shè)計(jì)[J];計(jì)算機(jī)研究與發(fā)展;1996年06期

5 韓曉言,韓禎祥;預(yù)處理并軛梯度法在電力系統(tǒng)暫態(tài)穩(wěn)定分析并行算法中的應(yīng)用研究[J];電力系統(tǒng)及其自動(dòng)化學(xué)報(bào);1996年02期

6 李慶華,陸楓;使用《并行算法的設(shè)計(jì)與分析》一書作教材的體會(huì)[J];教育與現(xiàn)代化;1996年03期

7 張朝陽,王海期,孫炳楠,唐錦春;多跨輸電線平面振動(dòng)特性的并行算法[J];華中理工大學(xué)學(xué)報(bào);1997年04期

8 許丹柯;;并行計(jì)算機(jī)選型及并行算法評(píng)估[J];石油工業(yè)計(jì)算機(jī)應(yīng)用;1994年02期

9 王川龍,郭耀鵬;H-分裂與并行算法[J];工程數(shù)學(xué)學(xué)報(bào);1995年03期

10 朱方生;線性二次型最優(yōu)控制的并行算法和軟件[J];武漢大學(xué)學(xué)報(bào)(自然科學(xué)版);1995年03期

相關(guān)會(huì)議論文 前10條

1 焦龍;郭亞紅;紀(jì)守領(lǐng);李金寶;;基于多核計(jì)算機(jī)的分子動(dòng)力學(xué)并行算法的實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年

2 姚向東;;并行算法到并行結(jié)構(gòu)的映射[A];中國工程物理研究院科技年報(bào)(2001)[C];2001年

3 王軼;席裕庚;;自適應(yīng)極點(diǎn)配置器設(shè)計(jì)中的并行算法[A];1994中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1994年

4 高華;苗世光;;城市小區(qū)尺度模式并行算法研究[A];中國氣象學(xué)會(huì)2006年年會(huì)“中尺度天氣動(dòng)力學(xué)、數(shù)值模擬和預(yù)測”分會(huì)場論文集[C];2006年

5 張衡;張武;;三維拋物型初邊值問題的塊三對(duì)角可擴(kuò)展并行算法[A];2007年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊)[C];2007年

6 樊洪明;李先庭;趙彬;任鴻澤;;有限元分布式并行算法研究[A];全國暖通空調(diào)制冷2002年學(xué)術(shù)年會(huì)論文集[C];2002年

7 王雷章;張愛武;劉曉萌;;三維建模中平面分割并行算法的設(shè)計(jì)與實(shí)現(xiàn)[A];中國系統(tǒng)仿真學(xué)會(huì)第五次全國會(huì)員代表大會(huì)暨2006年全國學(xué)術(shù)年會(huì)論文集[C];2006年

8 陳平;喬秀全;劉臻;田小萍;;數(shù)據(jù)挖掘網(wǎng)格中決策樹并行算法設(shè)計(jì)及性能分析[A];中國通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年

9 林偉軍;王秀明;張海瀾;;彈性波在非均勻各向異性介質(zhì)中的傳播模擬及其并行算法[A];2004年全國物理聲學(xué)會(huì)議論文集[C];2004年

10 鄧力;張文勇;劉杰;許海燕;王瑞宏;李樹;;非定常粒子輸運(yùn)蒙特卡羅并行算法研究[A];中國工程物理研究院科技年報(bào)(2003)[C];2003年

相關(guān)重要報(bào)紙文章 前10條

1 ;并行算法研究進(jìn)展[N];中國計(jì)算機(jī)報(bào);2004年

2 新華社記者 奚啟新 本報(bào)通訊員 李汛 記者 喻國英;精彩人生[N];光明日報(bào);2005年

3 新華社記者 奚啟新 本報(bào)記者 廖文根;三次選擇 無怨無悔[N];人民日報(bào);2005年

4 記者 溫婷;中國超算再度登頂全球500強(qiáng)[N];上海證券報(bào);2016年

5 ;名師上講臺(tái):每堂課都是精心編排的演出[N];科技日報(bào);2006年

6 宋宇;高性能計(jì)算面臨三大難題[N];中國計(jì)算機(jī)報(bào);2000年

7 本報(bào)記者 趙波 本報(bào)特約記者 劉程 本報(bào)通訊員 章立丁;一位巾幗學(xué)者的無悔征程[N];解放軍報(bào);2005年

8 宋家雨;混合型高性能計(jì)算落戶深圳[N];網(wǎng)絡(luò)世界;2007年

9 清華大學(xué)計(jì)算機(jī)系 薛巍;電網(wǎng)仿真考驗(yàn)高性能計(jì)算[N];計(jì)算機(jī)世界;2006年

10 陳文光 鄭緯民;高性能計(jì)算的三大研究領(lǐng)域[N];計(jì)算機(jī)世界;2006年

相關(guān)博士學(xué)位論文 前10條

1 潘斌;幾何定理機(jī)器證明并行算法研究[D];中國科學(xué)院研究生院(成都計(jì)算機(jī)應(yīng)用研究所);2006年

2 曾清紅;無網(wǎng)格數(shù)值模擬的并行算法及并行實(shí)現(xiàn)研究[D];中國科學(xué)技術(shù)大學(xué);2006年

3 杜云飛;容錯(cuò)并行算法的研究與分析[D];國防科學(xué)技術(shù)大學(xué);2008年

4 雷國慶;基于FPGA的圖計(jì)算并行算法和體系結(jié)構(gòu)研究[D];國防科學(xué)技術(shù)大學(xué);2015年

5 李雪寶;太陽望遠(yuǎn)鏡海量數(shù)據(jù)并行處理技術(shù)研究[D];中國科學(xué)院研究生院(云南天文臺(tái));2015年

6 鄔貴明;FPGA矩陣計(jì)算并行算法與結(jié)構(gòu)[D];國防科學(xué)技術(shù)大學(xué);2011年

7 廖臣;三維電磁粒子模擬并行算法及其應(yīng)用研究[D];電子科技大學(xué);2010年

8 李鴻健;并行算法在激光化學(xué)反應(yīng)模擬中的應(yīng)用研究[D];電子科技大學(xué);2012年

9 吳超;信息檢索中top-k問題的并行算法及優(yōu)化研究[D];中國科學(xué)技術(shù)大學(xué);2011年

10 杜劉革;基于多GPU的FDTD并行算法及其在電磁仿真中的應(yīng)用[D];山東大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 王晟;基于CUDA平臺(tái)的有限元單元級(jí)別并行算法研究[D];沈陽工業(yè)大學(xué);2019年

2 鄧大博;基于Spark計(jì)算框架下的帶容量約束的車輛路徑問題并行算法研究[D];廈門大學(xué);2017年

3 段素霞;二維中子輸運(yùn)問題的特征線并行算法研究[D];國防科學(xué)技術(shù)大學(xué);2017年

4 任沂斌;高性能集群下LiDAR數(shù)據(jù)生成DEM并行算法研究[D];南京大學(xué);2015年

5 洪文杰;基于申威處理器的PETSc異構(gòu)并行算法設(shè)計(jì)和研究[D];湖南大學(xué);2018年

6 趙濤;一種三維非定常線彈性問題的自適應(yīng)并行算法[D];湘潭大學(xué);2018年

7 唐光平;基于三對(duì)角線性方程組的混合并行算法研究[D];湖南大學(xué);2015年

8 聶雙;綜合孔徑微波輻射計(jì)圖像反演并行算法研究[D];華中科技大學(xué);2017年

9 陳長吉;適用于深度學(xué)習(xí)的數(shù)據(jù)預(yù)處理并行算法實(shí)現(xiàn)及性能優(yōu)化[D];上海海洋大學(xué);2018年

10 許丹丹;CPU-GPU協(xié)同異構(gòu)環(huán)境下卡爾曼濾波的并行算法研究[D];湖南大學(xué);2017年



本文編號(hào):2826848

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianlidianqilunwen/2826848.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eb1cc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com