天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 電氣論文 >

基于CUDA平臺的有限元單元級別并行算法研究

發(fā)布時間:2020-09-25 17:21
   對于大型工程電磁場的分析,存在著諸如電力設備整體尺寸過大而鐵磁材料電磁場透入深度很小的多尺度問題、電磁特性的非線性且各向異性問題使得電磁場數(shù)值計算規(guī)模過大。采用常規(guī)串行有限元法會出現(xiàn)計算時間過長,計算結果誤差大的問題,有時甚至無法進行計算。因此,有限元并行算法將成為研究的熱點。GPU是專為密集型、高度并行化的計算而設計的可編程流處理器,其眾核性質(zhì)能夠為單元級別并行計算提供保障。本文研究了一種單元級別的有限元并行算法(EBE-PFEM)并將其在CUDA平臺上并行實現(xiàn)。本文推導了EBE(element-by-element)有限元法的數(shù)學模型,并給出了第一類邊界條件的EBE處理,研究了基于EBE策略的共軛梯度(EBE-CG)法。為了改善共軛梯度法的收斂性,本文使用的是雅克比(Jacobi)預處理技術,并對基于EBE策略的Jacobi預處理共軛梯度(EBE-J-PCG)法進行了推導,并給出具體迭代過程。為發(fā)揮EBE有限元法并行度高的優(yōu)勢,研究基于CUDA平臺的GPU硬件結構及指令執(zhí)行特點,將結合Jacobi預處理技術的EBE-J-PCG方法在CUDA平臺上并行實現(xiàn),給出了基于CUDA平臺的EBE-J-PCG方法的CPU-GPU協(xié)同計算模型,并用C++語言編制了相應的程序。通過與長直載流導體空間磁場解析解的比較,驗證了算法與程序的正確性。最后,分別在CPU平臺和CUDA平臺上使用EBE-CG方法和結合Jacobi預處理的EBE-J-PCG方法求解一臺單相電力變壓器和三相感應電機的主磁場分布。在計算精度相同的情況下,采用Jacobi預處理技術能夠提高算法的收斂性;相比于只在CPU平臺上運行的EBE有限元分析,基于CUDA平臺的EBE有限元并行計算獲得了更高的計算效率,并且計算規(guī)模越大,加速比越高。該方法可用于大型電力設備的大規(guī)模數(shù)值計算。
【學位單位】:沈陽工業(yè)大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TM15
【部分圖文】:

網(wǎng)格剖分,聯(lián)系矩陣


沈陽工業(yè)大學碩士學位論文14圖2.1 網(wǎng)格剖分圖Fig. 2.1 Mesh subdivision以單元(1)為例,該單元的單元系數(shù)矩陣為:(1) (1) (1)11 12 14(1) (1) (1) (1)21 22 24(1) (1) (1)41 42 44= A A AA A A AA A A(2.25)單元(1)的系數(shù)矩陣對總體系數(shù)矩陣的貢獻為:(1) (1) (1)11 12 14(1) (1) (1)21 22 24(1)(1) (1) (1)41 42 430 0 00 0 00 0 0 0 0 0 =0 0 00 0 0 0 0 00 0 0 0 0 0 A A AA A AAA A A(2.26)由節(jié)點聯(lián)系矩陣的特點能夠得到單元(1)的節(jié)點聯(lián)系矩陣,具體形式如下:(1)1 0 0 0 0 0= 0 1 0 0 0 00 0 0 1 0 0 Q (2.27)同理可得,其余三個單元的節(jié)點聯(lián)系矩陣(2)Q ,(3)Q ,(4)Q 的具體形式,根據(jù)公式(2.17)得到總體聯(lián)系矩陣 Q。以單元(1)為例,節(jié)點變量?

架構圖,架構


通過 PCI-E 總線將其與 CPU 相連才能夠進行工作。它在顯卡中發(fā)揮著是顯卡中必不可少的一部分。不同的 GPU 架構的設計理念、工藝水平的結構和性能也不一樣。不同的架構擁有不同的計算能力。接下來分U 的具體硬件特性。orce GTX-960M 采用的是基于 Maxwell 架構的 GM206 核心(如圖 架構對流多處理器(Streaming Multiprocessor,SM)進行了升級,變?yōu)樘幚砥鳎ㄈ鐖D 3.2)中包含了 128 個 CUDA 核心、32 個特殊功能單元 Unit,SFU)、32 個存取單元(load/store unites,LD/ST)、4 個指令分調(diào)度器和 4 個線程束調(diào)度器。即本文在此硬件架構下使用算法程序進行SM 上能夠同時發(fā)送和執(zhí)行 4 個線程束,能夠在每個時鐘內(nèi)啟動 8 架構由內(nèi)存控制器、圖形處理器簇(Graph Processing Cluster,GPC)、CI-E 接口構成。其中,每個 GPC 由一個光柵單元和 4 個 SMM 構成,PC。即本文進行并行計算時,能夠同時執(zhí)行 16 個流多處理器。

架構圖,架構,代碼


圖3.2 SMM 架構Fig. 3.2 Architecture of SMM體系開發(fā)的基本軟件環(huán)境由 CUDA 庫函數(shù)(CUDA Library)、及行業(yè)標準程序語言的擴展(包括 C、C++、Fortran 等)構體系。CUDA C++是標準 ANSI C 語言的一個擴展,帶有少程成為可能,同時也能通過 API 來管理設備、內(nèi)存和其他任進行編譯時,會將在 GPU 上運行的代碼與 CPU 上運行的將在 GPU 上運行的代碼編譯為 PTX 代碼,而在 CPU 上運行編譯,并通過 C 文件的方式給出。CUDA 提供了 CUDAAPI 兩層 API 來管理 GPU 設備和組織線程。在一個程序中只 CUDA driver API 的其中一種,本文使用的是 CUDA runtim

【相似文獻】

相關期刊論文 前10條

1 陳國良;孫廣中;徐云;呂敏;;并行算法研究方法學[J];計算機學報;2008年09期

2 陳國良;昔日王榭堂前燕,飛入尋常百姓家淺談并行算法[J];新電腦;2002年12期

3 方同祝;并行算法在系統(tǒng)仿真中的應用[J];微機發(fā)展;1999年04期

4 壽標,李曉峰;更實際的并行算法的設計[J];計算機研究與發(fā)展;1996年06期

5 韓曉言,韓禎祥;預處理并軛梯度法在電力系統(tǒng)暫態(tài)穩(wěn)定分析并行算法中的應用研究[J];電力系統(tǒng)及其自動化學報;1996年02期

6 李慶華,陸楓;使用《并行算法的設計與分析》一書作教材的體會[J];教育與現(xiàn)代化;1996年03期

7 張朝陽,王海期,孫炳楠,唐錦春;多跨輸電線平面振動特性的并行算法[J];華中理工大學學報;1997年04期

8 許丹柯;;并行計算機選型及并行算法評估[J];石油工業(yè)計算機應用;1994年02期

9 王川龍,郭耀鵬;H-分裂與并行算法[J];工程數(shù)學學報;1995年03期

10 朱方生;線性二次型最優(yōu)控制的并行算法和軟件[J];武漢大學學報(自然科學版);1995年03期

相關會議論文 前10條

1 焦龍;郭亞紅;紀守領;李金寶;;基于多核計算機的分子動力學并行算法的實現(xiàn)[A];黑龍江省計算機學會2009年學術交流年會論文集[C];2010年

2 姚向東;;并行算法到并行結構的映射[A];中國工程物理研究院科技年報(2001)[C];2001年

3 王軼;席裕庚;;自適應極點配置器設計中的并行算法[A];1994中國控制與決策學術年會論文集[C];1994年

4 高華;苗世光;;城市小區(qū)尺度模式并行算法研究[A];中國氣象學會2006年年會“中尺度天氣動力學、數(shù)值模擬和預測”分會場論文集[C];2006年

5 張衡;張武;;三維拋物型初邊值問題的塊三對角可擴展并行算法[A];2007年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2007年

6 樊洪明;李先庭;趙彬;任鴻澤;;有限元分布式并行算法研究[A];全國暖通空調(diào)制冷2002年學術年會論文集[C];2002年

7 王雷章;張愛武;劉曉萌;;三維建模中平面分割并行算法的設計與實現(xiàn)[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年

8 陳平;喬秀全;劉臻;田小萍;;數(shù)據(jù)挖掘網(wǎng)格中決策樹并行算法設計及性能分析[A];中國通信學會通信軟件技術委員會2009年學術會議論文集[C];2009年

9 林偉軍;王秀明;張海瀾;;彈性波在非均勻各向異性介質(zhì)中的傳播模擬及其并行算法[A];2004年全國物理聲學會議論文集[C];2004年

10 鄧力;張文勇;劉杰;許海燕;王瑞宏;李樹;;非定常粒子輸運蒙特卡羅并行算法研究[A];中國工程物理研究院科技年報(2003)[C];2003年

相關重要報紙文章 前10條

1 ;并行算法研究進展[N];中國計算機報;2004年

2 新華社記者 奚啟新 本報通訊員 李汛 記者 喻國英;精彩人生[N];光明日報;2005年

3 新華社記者 奚啟新 本報記者 廖文根;三次選擇 無怨無悔[N];人民日報;2005年

4 記者 溫婷;中國超算再度登頂全球500強[N];上海證券報;2016年

5 ;名師上講臺:每堂課都是精心編排的演出[N];科技日報;2006年

6 宋宇;高性能計算面臨三大難題[N];中國計算機報;2000年

7 本報記者 趙波 本報特約記者 劉程 本報通訊員 章立丁;一位巾幗學者的無悔征程[N];解放軍報;2005年

8 宋家雨;混合型高性能計算落戶深圳[N];網(wǎng)絡世界;2007年

9 清華大學計算機系 薛巍;電網(wǎng)仿真考驗高性能計算[N];計算機世界;2006年

10 陳文光 鄭緯民;高性能計算的三大研究領域[N];計算機世界;2006年

相關博士學位論文 前10條

1 潘斌;幾何定理機器證明并行算法研究[D];中國科學院研究生院(成都計算機應用研究所);2006年

2 曾清紅;無網(wǎng)格數(shù)值模擬的并行算法及并行實現(xiàn)研究[D];中國科學技術大學;2006年

3 杜云飛;容錯并行算法的研究與分析[D];國防科學技術大學;2008年

4 雷國慶;基于FPGA的圖計算并行算法和體系結構研究[D];國防科學技術大學;2015年

5 李雪寶;太陽望遠鏡海量數(shù)據(jù)并行處理技術研究[D];中國科學院研究生院(云南天文臺);2015年

6 鄔貴明;FPGA矩陣計算并行算法與結構[D];國防科學技術大學;2011年

7 廖臣;三維電磁粒子模擬并行算法及其應用研究[D];電子科技大學;2010年

8 李鴻健;并行算法在激光化學反應模擬中的應用研究[D];電子科技大學;2012年

9 吳超;信息檢索中top-k問題的并行算法及優(yōu)化研究[D];中國科學技術大學;2011年

10 杜劉革;基于多GPU的FDTD并行算法及其在電磁仿真中的應用[D];山東大學;2011年

相關碩士學位論文 前10條

1 王晟;基于CUDA平臺的有限元單元級別并行算法研究[D];沈陽工業(yè)大學;2019年

2 鄧大博;基于Spark計算框架下的帶容量約束的車輛路徑問題并行算法研究[D];廈門大學;2017年

3 段素霞;二維中子輸運問題的特征線并行算法研究[D];國防科學技術大學;2017年

4 任沂斌;高性能集群下LiDAR數(shù)據(jù)生成DEM并行算法研究[D];南京大學;2015年

5 洪文杰;基于申威處理器的PETSc異構并行算法設計和研究[D];湖南大學;2018年

6 趙濤;一種三維非定常線彈性問題的自適應并行算法[D];湘潭大學;2018年

7 唐光平;基于三對角線性方程組的混合并行算法研究[D];湖南大學;2015年

8 聶雙;綜合孔徑微波輻射計圖像反演并行算法研究[D];華中科技大學;2017年

9 陳長吉;適用于深度學習的數(shù)據(jù)預處理并行算法實現(xiàn)及性能優(yōu)化[D];上海海洋大學;2018年

10 許丹丹;CPU-GPU協(xié)同異構環(huán)境下卡爾曼濾波的并行算法研究[D];湖南大學;2017年



本文編號:2826848

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianlidianqilunwen/2826848.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶eb1cc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com