GPU加速高速粒子碰撞模擬

發(fā)布時間：2020-07-12 17:28

【摘要】： 分子動力學(Molecular dynamics,簡稱MD)模擬作為一種重要的計算機模擬方法廣泛應用于生物,化學,材料科學等眾多學科中。然而計算性能一直都是限制MD使用的主要障礙。近年來,GPU作為一種新型的計算資源成為研究的熱點。與傳統(tǒng)CPU相比,GPU擁有更高的性能,更低的功耗和更高的性價比。因此,使用GPU加速分子動力學模擬,可以節(jié)約模擬的時間,提高模擬的規(guī)模,從而使分子動力學模擬能更廣泛的應用到實際的工程中去。本文主要以高速碰撞的粒子模型為研究對象,基于NVIDIA CUDA編程模型和Brook+語言實現(xiàn)了GPU加速的分子動力學程序,并針對GPU的存儲結(jié)構和多GPU對算法進行了優(yōu)化,主要取得了如下成果: 1、提出了一種優(yōu)化的區(qū)域分解算法。本文改進了傳統(tǒng)的區(qū)域分解算法,在通用處理器和GPU上分兩次對分子動力學模擬中的計算任務進行分解,首次劃分保證負載平衡,第二次劃分解決通信開銷和數(shù)據(jù)復用問題。 2、提出了一種改進的粒子索引方法。通過在通用處理節(jié)點上對粒子進行排序,使相鄰粒子的存儲地址盡量靠近。當加速節(jié)點上的線程從全局內(nèi)存上讀取粒子信息時,能夠呈現(xiàn)出數(shù)據(jù)局部性的特點,可以減少了線程從全局內(nèi)存中讀取數(shù)據(jù)的次數(shù),從而節(jié)省時間。 3、針對GPU的存儲結(jié)構對程序進行優(yōu)化。針對片上共享內(nèi)存分體設計特點,實現(xiàn)了單精度算法下線程間無沖突的共享內(nèi)存訪問,減少了流處理器的閑置時間。 4、使用多GPU對程序進行加速。采用常用的消息傳遞接口(MPI)協(xié)議實現(xiàn)通用處理器之間的并行劃分,從而實現(xiàn)了各節(jié)點間GPU的并行計算,滿足了更快速的分子動力學模擬的要求。本文對GPU加速的分子動力學模擬正確性和性能進行了測試。結(jié)果表明,GPU對MD算法的加速有明顯效果。當粒子規(guī)模為43.2萬時,經(jīng)AMD HD4870加速后的MD程序的性能提高了4.8倍,而經(jīng)Tesla C1060加速后,MD程序性能提高6.5倍。在使用多GPU對程序進行加速后,MD程序的性能提高了11.2倍。同時,經(jīng)GPU加速的MD程序保證了結(jié)果的正確性。
【學位授予單位】：國防科學技術大學
【學位級別】：碩士
【學位授予年份】：2009
【分類號】：TP332
【圖文】：

對比圖,處理單元,存儲單元,對比圖

國防科學技術大學研究生院碩士學位論文應用。MD 中粒子的信息往往非常簡單且容易向量化。MD先，MD 模擬的空間尺度小而粒子數(shù)量大，例如，邊長為9個原子[21]；其次，MD 模擬需要精確跟蹤粒子的運動以保步長都很小，典型的時間步長為飛秒級，納秒級別的現(xiàn)實模MD 正是適合 GPU 加速的典型應用。

系統(tǒng)結(jié)構圖,系統(tǒng)結(jié)構圖,多處理器,處理單元

圖 2.2 Tesla 的系統(tǒng)結(jié)構圖多處理器 N...多處理器 2多處理器 1共享內(nèi)存寄存器寄存器寄存器處理單元1 處理單元2處理單元N指令部件常量內(nèi)存紋理內(nèi)存設備內(nèi)存圖 2.3 CUDA GPU 存儲結(jié)構圖[7]

執(zhí)行模型

國防科學技術大學研究生院碩士學位論文算術計算集中，鼓勵編程者指定數(shù)據(jù)上的操作,以達到全局的通信最小而局部一個新的數(shù)據(jù)類型的擴展，代表了一系列能夠被并行處理的數(shù)據(jù)。流是用列進行描述的，同 C 語言中的數(shù)組類似。但它與 C 語言中的數(shù)組有以下的區(qū)別數(shù)外不允許通過下標來獲得流元素；不允許對流進行靜態(tài)的初始化；流必須棧)；流只能在核心(kernel)函數(shù)中被讀寫或者是通過特殊的運算符從普通的據(jù)。

【參考文獻】

相關期刊論文前1條

1 吳恩華;圖形處理器用于通用計算的技術、現(xiàn)狀及其挑戰(zhàn)[J];軟件學報;2004年10期

本文編號：2752279

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2752279.html

上一篇：用于CCD圖像傳感的嵌入式系統(tǒng)設計
下一篇：NS方程在GPU上的并行實現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

GPU加速高速粒子碰撞模擬