天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

基于眾核架構(gòu)的并行SPH算法的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-05-05 13:47

  本文選題:光滑粒子動(dòng)力學(xué) + 流體運(yùn)動(dòng)。 參考:《上海交通大學(xué)》2013年碩士論文


【摘要】:流體運(yùn)動(dòng)現(xiàn)象是周圍環(huán)境的一個(gè)重要組成部分,對該現(xiàn)象在計(jì)算機(jī)上快速的模擬仿真,是航空航天、海洋船舶等許多行業(yè)領(lǐng)域所迫切需要的。目前對混合介質(zhì)的流體運(yùn)動(dòng)模擬較為理想的方法是光滑粒子動(dòng)力學(xué)(SPH)方法,它是一種無網(wǎng)格的純Lagrange方法,以粒子理論為基礎(chǔ),通過計(jì)算整合各個(gè)粒子的狀態(tài)來得到整個(gè)流場運(yùn)動(dòng)的規(guī)律。但是該方法在實(shí)際應(yīng)用時(shí)需要用到大量的計(jì)算,以至于模擬速度緩慢。至今為止,已有一些在SPH并行方法上的研究成果,但大部分實(shí)現(xiàn)模型過于簡化或者僅將部分算法移植到GPU上實(shí)現(xiàn),未能充分利用GPU的計(jì)算能力。 本文首先對SPH方法的串行程序代碼做了詳細(xì)分析,了解該算法的具體流程。同時(shí)對算法中的兩個(gè)關(guān)鍵步驟(相鄰粒子對構(gòu)建以及粒子屬性值計(jì)算)做了深入研究,歸納整合出了具體的執(zhí)行過程。然后通過對串行代碼的熱點(diǎn)分析,找到程序性能瓶頸所在,尋找方法加以改善。為充分利用GPU眾核架構(gòu)強(qiáng)大的計(jì)算能力,作者對SPH的并行算法的實(shí)現(xiàn)主要做了如下幾點(diǎn)貢獻(xiàn): 將SPH算法的整體過程,包括相鄰粒子對構(gòu)建以及粒子物理屬性值計(jì)算,移植到GPU眾核架構(gòu)上實(shí)現(xiàn) 在相鄰粒子對存儲過程中,利用對存儲空間下標(biāo)的原子操作,代替使用臨界區(qū)鎖定整個(gè)存儲空間,實(shí)現(xiàn)存儲器的寫并行,加快模擬速度。 在粒子屬性值計(jì)算過程中,利用共享存儲器作為中間變量減少對全局存儲器的訪問次數(shù),,加速計(jì)算過程。 利用不同線程維度,以及對GPU資源使用的分析找到最合適的并行粒度,取得最佳性能。 在本文實(shí)驗(yàn)中,我們使用CUDA作為GPU的編程語言。在性能測試對比實(shí)驗(yàn)中,分別使用NVIDIA Tesla C2050以及NVIDIA Tesla K20分別作為GPU硬件設(shè)備,進(jìn)行并行算法性能測試,使用Intel至強(qiáng)CPU W3520進(jìn)行串行算法的性能測試。將并行程序的性能與串行程序作對比得到加,使用C2050GPU單卡加速可以取得相對于串行程序8倍的加速比,而使用K20GPU顯卡可以取得20倍的加速比。
[Abstract]:The phenomenon of fluid motion is an important part of the surrounding environment. The rapid simulation of the phenomenon on the computer is urgently needed in many fields, such as aerospace, ocean and ship. At present, the ideal method for fluid motion simulation in mixed media is smooth particle dynamics (SPH) method, which is a meshless pure Lagrange method based on particle theory. The motion of the whole flow field is obtained by calculating the state of the integrated particles. However, this method needs a lot of calculation in practical application, so the simulation speed is slow. Up to now, there have been some research results on SPH parallel methods, but most of the implementation models are too simplified or only some algorithms are transplanted to GPU, so they can not make full use of the computing power of GPU. In this paper, the serial program code of SPH method is analyzed in detail, and the flow of the algorithm is understood. At the same time, the two key steps in the algorithm (the construction of adjacent particle pairs and the calculation of particle attribute values) are deeply studied, and the concrete execution process is summarized and integrated. Then, by analyzing the hot spot of serial code, we find the bottleneck of program performance and find ways to improve it. In order to make full use of the powerful computing power of the GPU multi-core architecture, the author has made the following contributions to the implementation of the parallel algorithm of SPH: The whole process of SPH algorithm, including the construction of adjacent particle pairs and the calculation of particle physical attribute values, is transplanted to the GPU multi-kernel architecture. In the storage procedure of adjacent particle pairs, the atomic operation of subscript to storage space is used instead of locking the entire storage space in the critical region to realize the memory write parallelism and speed up the simulation. In the process of calculating the particle attribute value, the shared memory is used as the intermediate variable to reduce the number of visits to the global memory, and the calculation process is accelerated. Using different thread dimensions and analyzing the usage of GPU resources, the most suitable parallel granularity is found and the best performance is obtained. In our experiment, we use CUDA as the programming language of GPU. In the performance test contrast experiment, NVIDIA Tesla C2050 and NVIDIA Tesla K20 are used as GPU hardware devices to test the performance of parallel algorithm, and Intel to strong CPU W3520 are used to test the performance of serial algorithm. By comparing the performance of parallel program with serial program, the speedup ratio of 8 times that of serial program can be obtained by using C2050GPU single card acceleration, and 20 times speed ratio can be obtained by using K20GPU graphics card.
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP338.6

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 占煒;;用VB 6.0實(shí)現(xiàn)簡單數(shù)字組合算法程序[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年07期

2 胡啟敏;薛錦云;;若干算法程序的形式化推導(dǎo)與生成技術(shù)研究[J];計(jì)算機(jī)研究與發(fā)展;2008年S1期

3 ;ATI聯(lián)手華碩推顯卡芯片[J];每周電腦報(bào);2003年39期

4 付軍;;IDT要做網(wǎng)絡(luò)通信領(lǐng)域的領(lǐng)導(dǎo)者[J];集成電路應(yīng)用;2004年11期

5 ;Silicon Image公布低成本儲存架構(gòu),面向小業(yè)務(wù)用戶[J];集成電路應(yīng)用;2004年12期

6 劉東;周明天;;一種文本數(shù)字水印系統(tǒng)解決方案[J];計(jì)算機(jī)應(yīng)用;2006年01期

7 ;英特爾芯片將采用新一代微架構(gòu)[J];每周電腦報(bào);2006年08期

8 李中友;;中小型民營電路板企業(yè)管理四步曲[J];印制電路信息;2006年02期

9 曹平;鄭朔f ;;基于Web Service的航空基礎(chǔ)數(shù)據(jù)庫應(yīng)用體系架構(gòu)探索[J];航空標(biāo)準(zhǔn)化與質(zhì)量;2006年02期

10 翁惠明;;財(cái)政核心業(yè)務(wù)應(yīng)用系統(tǒng)架構(gòu)研究[J];機(jī)電技術(shù);2006年02期

相關(guān)會議論文 前10條

1 張大華;丁輝;吳向陽;趙毅強(qiáng);孫毓忠;;面向智能電網(wǎng)的電力云計(jì)算架構(gòu)[A];2011電力通信管理暨智能電網(wǎng)通信技術(shù)論壇論文集[C];2011年

2 肖晴;;移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)“云+端”架構(gòu)的探索與實(shí)踐[A];中國通信學(xué)會信息通信網(wǎng)絡(luò)技術(shù)委員會2011年年會論文集(上冊)[C];2011年

3 顧建國;朱光榮;;基于全臺網(wǎng)架構(gòu)的“大媒資”系統(tǒng)設(shè)計(jì)及實(shí)踐[A];2011中國電影電視技術(shù)學(xué)會影視技術(shù)文集[C];2011年

4 潘建;;核物理裝置計(jì)算機(jī)控制系統(tǒng)的架構(gòu)選擇與比較[A];第十五屆全國核電子學(xué)與核探測技術(shù)學(xué)術(shù)年會論文集[C];2010年

5 石海鶴;薛錦云;;一種基于PAR的高可靠算法程序設(shè)計(jì)技術(shù)[A];第六屆中國測試學(xué)術(shù)會議論文集[C];2010年

6 趙樹璋;;SaaS架構(gòu)現(xiàn)狀及發(fā)展趨勢[A];湖北省通信學(xué)會、武漢通信學(xué)會2009年學(xué)術(shù)年會論文集[C];2009年

7 段志其;譚登清;楊亞明;;B/S架構(gòu)編程在煤礦企業(yè)信息化中的應(yīng)用[A];煤礦自動(dòng)化與信息化——第21屆全國煤礦自動(dòng)化與信息化學(xué)術(shù)會議暨第3屆中國煤礦信息化與自動(dòng)化高層論壇論文集(下冊)[C];2011年

8 楊亞明;宗昆昆;;B/S架構(gòu)編程在煤礦企業(yè)信息化中的應(yīng)用[A];煤炭機(jī)電與自動(dòng)化實(shí)用技術(shù)[C];2012年

9 許威;朱順痣;繆克華;王穎;李茂青;;同步/異步ETL架構(gòu)的比較[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2006年

10 邱奎寧;楊曉波;;一種開放的項(xiàng)目信息管理系統(tǒng)架構(gòu)[A];工程三維模型與虛擬現(xiàn)實(shí)表現(xiàn)——第二屆工程建設(shè)計(jì)算機(jī)應(yīng)用創(chuàng)新論壇論文集[C];2009年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 周源;共享IT架構(gòu)選購之道[N];網(wǎng)絡(luò)世界;2010年

2 本報(bào)記者 鄒大斌;QNX:微內(nèi)核架構(gòu)奠定安全基礎(chǔ)[N];計(jì)算機(jī)世界;2011年

3 《網(wǎng)絡(luò)世界》記者 于翔;混合交付:云只是途徑之一[N];網(wǎng)絡(luò)世界;2011年

4 本報(bào)記者 趙謹(jǐn)娜;IBM X架構(gòu):技術(shù)為本 用戶為先[N];中國計(jì)算機(jī)報(bào);2001年

5 記者 于新春;業(yè)內(nèi)人士呼吁建立新型市場架構(gòu)[N];國際商報(bào);2001年

6 劉杰;思杰陶欣:綠色I(xiàn)T架構(gòu)要“瞻前顧后”[N];中國企業(yè)報(bào);2010年

7 拉毛東治 李婷;青海公司SG—ERP架構(gòu)管控項(xiàng)目開建[N];國家電網(wǎng)報(bào);2011年

8 記者 韓曉民;深圳架構(gòu)城區(qū)統(tǒng)一信息平臺[N];人民郵電;2001年

9 趙海軍;X-架構(gòu)搶先機(jī)[N];中國計(jì)算機(jī)報(bào);2002年

10 馬克·馬多克期 劍橋大學(xué)社全球首席信息官;傳統(tǒng)出版社迫切需要構(gòu)建技術(shù)企業(yè)架構(gòu)[N];中國圖書商報(bào);2010年

相關(guān)博士學(xué)位論文 前10條

1 楊鵬;居民電子健康檔案文檔架構(gòu)與數(shù)據(jù)元組的研究與實(shí)踐[D];第四軍醫(yī)大學(xué);2012年

2 陳海舟;不可壓自由表面流的SPH法數(shù)值模擬研究[D];天津大學(xué);2009年

3 龔凱;基于光滑質(zhì)點(diǎn)水動(dòng)力學(xué)(SPH)方法的自由表面流動(dòng)數(shù)值模擬研究[D];上海交通大學(xué);2009年

4 崔巍;虛擬企業(yè)伙伴選擇與業(yè)務(wù)過程建模方法研究[D];山東大學(xué);2009年

5 曲世軍;中國房地產(chǎn)金融風(fēng)險(xiǎn)判斷及防范體系架構(gòu)研究[D];東北師范大學(xué);2008年

6 朱強(qiáng);基于對等網(wǎng)絡(luò)架構(gòu)的新型控制系統(tǒng)研究與實(shí)現(xiàn)[D];上海大學(xué);2011年

7 張學(xué)全;基于FPGA的星載圖像壓縮系統(tǒng)實(shí)現(xiàn)方法研究[D];中國科學(xué)院研究生院(空間科學(xué)與應(yīng)用研究中心);2009年

8 鄭俊;SPH基本問題研究及其在高速水下物體流場模擬中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年

9 張蓉;結(jié)構(gòu)化對等計(jì)算機(jī)系統(tǒng)中的查詢處理[D];復(fù)旦大學(xué);2007年

10 王超;異構(gòu)多核可重構(gòu)片上系統(tǒng)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 徐鋒;基于眾核架構(gòu)的并行SPH算法的研究與實(shí)現(xiàn)[D];上海交通大學(xué);2013年

2 楊國英;基于B/S模式的高校儀器設(shè)備管理信息系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京化工大學(xué);2005年

3 張愛紅;基于Web服務(wù)的共建共享型數(shù)字圖書館研究[D];四川大學(xué);2005年

4 闕宇峻;面向系統(tǒng)芯片的軟硬件協(xié)同設(shè)計(jì)平臺VXP(Virtual Executable Platform)的設(shè)計(jì)[D];華東師范大學(xué);2006年

5 李明;J2EE核心模式及其在低壓配電信息系統(tǒng)中的應(yīng)用研究[D];華中科技大學(xué);2005年

6 張濤;軟件開發(fā)過程的工作流管理系統(tǒng)[D];天津大學(xué);2005年

7 李尚華;中外足球市場體系架構(gòu)對比研究[D];武漢體育學(xué)院;2008年

8 王治國;行政訴訟調(diào)解制度研究[D];蘇州大學(xué);2007年

9 池?zé)?數(shù)字家庭網(wǎng)關(guān)上的QoS架構(gòu)與算法研究[D];上海交通大學(xué);2010年

10 陳陽;基于SPH算法的程序設(shè)計(jì)及其在成型裝藥戰(zhàn)斗部中的應(yīng)用[D];中北大學(xué);2012年



本文編號:1847928

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1847928.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4bda0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com