基于異構(gòu)計算的MOND數(shù)值模擬加速技術研究
發(fā)布時間:2018-09-14 17:22
【摘要】:現(xiàn)代宇宙學中,科學家們提出了許多新理論來解釋種種天文現(xiàn)象。他們需要基于觀測現(xiàn)象進行精確的數(shù)值模擬,依據(jù)模擬結(jié)果驗證新理論的正確性。而天文觀測結(jié)果表明,基于牛頓力學所建立的宇宙學模型無法解釋觀測獲得的星系旋轉(zhuǎn)曲線等現(xiàn)象。為了解決這些問題,理論物理學家指出牛頓力學在星系大尺度空間下可能不準確,發(fā)展出不同于暗物質(zhì)理論的修正牛頓動力學理論(Modified Newtonian Dynamics,MOND)。但是由于MOND理論的數(shù)值模擬包含具有高計算復雜度的N體模擬,受計算能力的制約,MOND數(shù)值模擬的規(guī)模一直不大。N體模擬是天體動力學模擬中重要的基礎運算之一。它不僅在天體物理學中被用來模擬星系的演變、驗證新的宇宙學理論,還在等離子體物理、分子動力學、流體動力學等科學、工程領域都有著重要的地位。隨著近年來計算機技術的發(fā)展帶來的計算能力驟增,N體模擬的規(guī)模越來越大,在各個領域也發(fā)揮著越來越重要的作用。目前對于N體模擬的計算能力需求依舊在不斷增大。為了簡化計算,研究人員做出了許多假設,提出了多種近似算法,比如粒子網(wǎng)格算法(Particle Mesh,PM),樹形算法(Tree),樹-粒子網(wǎng)格混合(TreePM)算法以及粒子-粒子網(wǎng)格混合算法(P3M)。其中,TreePM算法,由于可以較好地平衡計算精度和速度的需求,在天文學數(shù)值模擬領域獲得了廣泛的應用。為了進一步提高計算速度,多種計算加速技術也被應用到N體模擬中。利用新的計算加速技術來加速N體模擬也一直是學術界和工業(yè)界的研究熱點?删幊踢壿嬮T陣列(FPGA)和通用圖形處理單元(GPGPU)由于各自的特點,經(jīng)常被用到N體模擬加速中。本學位論文主要圍繞加速MOND數(shù)值模擬展開,基于應用的需求選擇了合適的TreePMN體模擬算法,剖析了算法的計算瓶頸,依據(jù)運算特點將計算任務分配給GPU、FPGA;接著利用包含CPU、GPU、FPGA的異構(gòu)加速平臺實現(xiàn)了對MOND數(shù)值模擬的加速。借助FPGA動態(tài)可重構(gòu)的功能,當PM模塊空閑時,將其邏輯資源配置成Tree模塊,從而提高了資源利用率。實驗結(jié)果表明,動態(tài)可重構(gòu)功能的加入使得系統(tǒng)性能提升了 24%。本文的異構(gòu)平臺較傳統(tǒng)的高性能CPU服務器有更好的計算性能和更低的功耗。當粒子數(shù)為3x106、網(wǎng)格大小為1283、Tree算法中計算的張角為0.5時,異構(gòu)平臺相比于CPU服務器的加速比為9.37,能耗比為24.42。本文最后探討將異構(gòu)加速平臺擴展至多個計算節(jié)點的方式,分析了設計的可擴展性。本論文主要研究工作包括:(1)基于MOND數(shù)值模擬的特點,對比研究了各種N體模擬算法,針對MOND數(shù)值模擬中數(shù)據(jù)模擬規(guī)模大、計算復雜度高、模擬時間長、具有強成團性的特點,選用了經(jīng)典的TreePM算法,并且對其進行更為深入的研究。首先,以CPU串行實現(xiàn)為基礎,分析算法各部分的占用時間,剖析算法的性能瓶頸。針對Tree部分中耗時最多的建立樹型數(shù)據(jù)結(jié)構(gòu)、粒子相互作用勢能計算以及多維快速傅里葉變換計算部分在不同平臺上的加速,分析加速效果,比較優(yōu)劣。同時,分析TreePM算法的訪存模式,對Tree部分粒子進行預先排序,加速了粒子的勢能計算。(2)實現(xiàn)了基于TreePM算法的MOND數(shù)值模擬異構(gòu)加速。主要采用FPGA進行核心計算,利用FPGA動態(tài)可重構(gòu)的特點,為多維快速傅里葉變換計算和粒子間相互作用勢能計算合理分配邏輯資源。同時,由GPU完成樹型數(shù)據(jù)結(jié)構(gòu)建立這種具有較高并行度的遞歸算法。余下的任務調(diào)配、粒子位置和速度的更新、以及數(shù)據(jù)的輸入輸出等工作則交由CPU完成。該設計充分利用了各平臺的特點,提高了 TreePM算法實現(xiàn)的性能及功耗比,首次完成了 TreePM算法在FPGA、CPU和GPU異構(gòu)平臺上的加速,為N體模擬加速提供新的實現(xiàn)方案。(3)進一步地探討設計的合理性,提出上述算法實現(xiàn)的擴展方案。采用皮亞諾-希爾伯特曲線來劃分各節(jié)點Tree計算的區(qū)域范圍,并結(jié)合FPGA的動態(tài)可重構(gòu)的特性,更細粒度地分配資源,減小負載不均衡帶來的影響,實現(xiàn)良好的可擴展性。
[Abstract]:......
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:P159
本文編號:2243374
[Abstract]:......
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:P159
【參考文獻】
相關期刊論文 前1條
1 馮瓏瓏;朱維善;;現(xiàn)代宇宙學中的數(shù)值模擬技術和應用[J];中國科學:物理學 力學 天文學;2013年06期
相關博士學位論文 前1條
1 彭波;天文數(shù)據(jù)處理中硬件加速機制的關鍵技術研究[D];中國科學技術大學;2016年
,本文編號:2243374
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2243374.html
最近更新
教材專著