基于CUDA平臺的有限元單元級別并行算法研究
【學位單位】:沈陽工業(yè)大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TM15
【部分圖文】:
沈陽工業(yè)大學碩士學位論文14圖2.1 網(wǎng)格剖分圖Fig. 2.1 Mesh subdivision以單元(1)為例,該單元的單元系數(shù)矩陣為:(1) (1) (1)11 12 14(1) (1) (1) (1)21 22 24(1) (1) (1)41 42 44= A A AA A A AA A A(2.25)單元(1)的系數(shù)矩陣對總體系數(shù)矩陣的貢獻為:(1) (1) (1)11 12 14(1) (1) (1)21 22 24(1)(1) (1) (1)41 42 430 0 00 0 00 0 0 0 0 0 =0 0 00 0 0 0 0 00 0 0 0 0 0 A A AA A AAA A A(2.26)由節(jié)點聯(lián)系矩陣的特點能夠得到單元(1)的節(jié)點聯(lián)系矩陣,具體形式如下:(1)1 0 0 0 0 0= 0 1 0 0 0 00 0 0 1 0 0 Q (2.27)同理可得,其余三個單元的節(jié)點聯(lián)系矩陣(2)Q ,(3)Q ,(4)Q 的具體形式,根據(jù)公式(2.17)得到總體聯(lián)系矩陣 Q。以單元(1)為例,節(jié)點變量?
通過 PCI-E 總線將其與 CPU 相連才能夠進行工作。它在顯卡中發(fā)揮著是顯卡中必不可少的一部分。不同的 GPU 架構的設計理念、工藝水平的結構和性能也不一樣。不同的架構擁有不同的計算能力。接下來分U 的具體硬件特性。orce GTX-960M 采用的是基于 Maxwell 架構的 GM206 核心(如圖 架構對流多處理器(Streaming Multiprocessor,SM)進行了升級,變?yōu)樘幚砥鳎ㄈ鐖D 3.2)中包含了 128 個 CUDA 核心、32 個特殊功能單元 Unit,SFU)、32 個存取單元(load/store unites,LD/ST)、4 個指令分調(diào)度器和 4 個線程束調(diào)度器。即本文在此硬件架構下使用算法程序進行SM 上能夠同時發(fā)送和執(zhí)行 4 個線程束,能夠在每個時鐘內(nèi)啟動 8 架構由內(nèi)存控制器、圖形處理器簇(Graph Processing Cluster,GPC)、CI-E 接口構成。其中,每個 GPC 由一個光柵單元和 4 個 SMM 構成,PC。即本文進行并行計算時,能夠同時執(zhí)行 16 個流多處理器。
圖3.2 SMM 架構Fig. 3.2 Architecture of SMM體系開發(fā)的基本軟件環(huán)境由 CUDA 庫函數(shù)(CUDA Library)、及行業(yè)標準程序語言的擴展(包括 C、C++、Fortran 等)構體系。CUDA C++是標準 ANSI C 語言的一個擴展,帶有少程成為可能,同時也能通過 API 來管理設備、內(nèi)存和其他任進行編譯時,會將在 GPU 上運行的代碼與 CPU 上運行的將在 GPU 上運行的代碼編譯為 PTX 代碼,而在 CPU 上運行編譯,并通過 C 文件的方式給出。CUDA 提供了 CUDAAPI 兩層 API 來管理 GPU 設備和組織線程。在一個程序中只 CUDA driver API 的其中一種,本文使用的是 CUDA runtim
【相似文獻】
相關期刊論文 前10條
1 陳國良;孫廣中;徐云;呂敏;;并行算法研究方法學[J];計算機學報;2008年09期
2 陳國良;昔日王榭堂前燕,飛入尋常百姓家淺談并行算法[J];新電腦;2002年12期
3 方同祝;并行算法在系統(tǒng)仿真中的應用[J];微機發(fā)展;1999年04期
4 壽標,李曉峰;更實際的并行算法的設計[J];計算機研究與發(fā)展;1996年06期
5 韓曉言,韓禎祥;預處理并軛梯度法在電力系統(tǒng)暫態(tài)穩(wěn)定分析并行算法中的應用研究[J];電力系統(tǒng)及其自動化學報;1996年02期
6 李慶華,陸楓;使用《并行算法的設計與分析》一書作教材的體會[J];教育與現(xiàn)代化;1996年03期
7 張朝陽,王海期,孫炳楠,唐錦春;多跨輸電線平面振動特性的并行算法[J];華中理工大學學報;1997年04期
8 許丹柯;;并行計算機選型及并行算法評估[J];石油工業(yè)計算機應用;1994年02期
9 王川龍,郭耀鵬;H-分裂與并行算法[J];工程數(shù)學學報;1995年03期
10 朱方生;線性二次型最優(yōu)控制的并行算法和軟件[J];武漢大學學報(自然科學版);1995年03期
相關會議論文 前10條
1 焦龍;郭亞紅;紀守領;李金寶;;基于多核計算機的分子動力學并行算法的實現(xiàn)[A];黑龍江省計算機學會2009年學術交流年會論文集[C];2010年
2 姚向東;;并行算法到并行結構的映射[A];中國工程物理研究院科技年報(2001)[C];2001年
3 王軼;席裕庚;;自適應極點配置器設計中的并行算法[A];1994中國控制與決策學術年會論文集[C];1994年
4 高華;苗世光;;城市小區(qū)尺度模式并行算法研究[A];中國氣象學會2006年年會“中尺度天氣動力學、數(shù)值模擬和預測”分會場論文集[C];2006年
5 張衡;張武;;三維拋物型初邊值問題的塊三對角可擴展并行算法[A];2007年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2007年
6 樊洪明;李先庭;趙彬;任鴻澤;;有限元分布式并行算法研究[A];全國暖通空調(diào)制冷2002年學術年會論文集[C];2002年
7 王雷章;張愛武;劉曉萌;;三維建模中平面分割并行算法的設計與實現(xiàn)[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年
8 陳平;喬秀全;劉臻;田小萍;;數(shù)據(jù)挖掘網(wǎng)格中決策樹并行算法設計及性能分析[A];中國通信學會通信軟件技術委員會2009年學術會議論文集[C];2009年
9 林偉軍;王秀明;張海瀾;;彈性波在非均勻各向異性介質(zhì)中的傳播模擬及其并行算法[A];2004年全國物理聲學會議論文集[C];2004年
10 鄧力;張文勇;劉杰;許海燕;王瑞宏;李樹;;非定常粒子輸運蒙特卡羅并行算法研究[A];中國工程物理研究院科技年報(2003)[C];2003年
相關重要報紙文章 前10條
1 ;并行算法研究進展[N];中國計算機報;2004年
2 新華社記者 奚啟新 本報通訊員 李汛 記者 喻國英;精彩人生[N];光明日報;2005年
3 新華社記者 奚啟新 本報記者 廖文根;三次選擇 無怨無悔[N];人民日報;2005年
4 記者 溫婷;中國超算再度登頂全球500強[N];上海證券報;2016年
5 ;名師上講臺:每堂課都是精心編排的演出[N];科技日報;2006年
6 宋宇;高性能計算面臨三大難題[N];中國計算機報;2000年
7 本報記者 趙波 本報特約記者 劉程 本報通訊員 章立丁;一位巾幗學者的無悔征程[N];解放軍報;2005年
8 宋家雨;混合型高性能計算落戶深圳[N];網(wǎng)絡世界;2007年
9 清華大學計算機系 薛巍;電網(wǎng)仿真考驗高性能計算[N];計算機世界;2006年
10 陳文光 鄭緯民;高性能計算的三大研究領域[N];計算機世界;2006年
相關博士學位論文 前10條
1 潘斌;幾何定理機器證明并行算法研究[D];中國科學院研究生院(成都計算機應用研究所);2006年
2 曾清紅;無網(wǎng)格數(shù)值模擬的并行算法及并行實現(xiàn)研究[D];中國科學技術大學;2006年
3 杜云飛;容錯并行算法的研究與分析[D];國防科學技術大學;2008年
4 雷國慶;基于FPGA的圖計算并行算法和體系結構研究[D];國防科學技術大學;2015年
5 李雪寶;太陽望遠鏡海量數(shù)據(jù)并行處理技術研究[D];中國科學院研究生院(云南天文臺);2015年
6 鄔貴明;FPGA矩陣計算并行算法與結構[D];國防科學技術大學;2011年
7 廖臣;三維電磁粒子模擬并行算法及其應用研究[D];電子科技大學;2010年
8 李鴻健;并行算法在激光化學反應模擬中的應用研究[D];電子科技大學;2012年
9 吳超;信息檢索中top-k問題的并行算法及優(yōu)化研究[D];中國科學技術大學;2011年
10 杜劉革;基于多GPU的FDTD并行算法及其在電磁仿真中的應用[D];山東大學;2011年
相關碩士學位論文 前10條
1 王晟;基于CUDA平臺的有限元單元級別并行算法研究[D];沈陽工業(yè)大學;2019年
2 鄧大博;基于Spark計算框架下的帶容量約束的車輛路徑問題并行算法研究[D];廈門大學;2017年
3 段素霞;二維中子輸運問題的特征線并行算法研究[D];國防科學技術大學;2017年
4 任沂斌;高性能集群下LiDAR數(shù)據(jù)生成DEM并行算法研究[D];南京大學;2015年
5 洪文杰;基于申威處理器的PETSc異構并行算法設計和研究[D];湖南大學;2018年
6 趙濤;一種三維非定常線彈性問題的自適應并行算法[D];湘潭大學;2018年
7 唐光平;基于三對角線性方程組的混合并行算法研究[D];湖南大學;2015年
8 聶雙;綜合孔徑微波輻射計圖像反演并行算法研究[D];華中科技大學;2017年
9 陳長吉;適用于深度學習的數(shù)據(jù)預處理并行算法實現(xiàn)及性能優(yōu)化[D];上海海洋大學;2018年
10 許丹丹;CPU-GPU協(xié)同異構環(huán)境下卡爾曼濾波的并行算法研究[D];湖南大學;2017年
本文編號:2826848
本文鏈接:http://sikaile.net/kejilunwen/dianlidianqilunwen/2826848.html