LAPW基組第一性原理計(jì)算的GPU加速方法及其應(yīng)用
發(fā)布時(shí)間:2021-06-18 14:33
第一性原理計(jì)算在凝聚態(tài)物理學(xué)研究及新材料研發(fā)中具有重要作用,其中基于線性綴加平面波(LAPW)基組的第一性原理計(jì)算具有計(jì)算精度高、適用于對(duì)磁性材料、磁光材料模擬仿真的特點(diǎn),已獲得較為廣泛的應(yīng)用。然而由于以LAPW為波函數(shù)基組求解Kohn-Sham方程的自洽迭代過(guò)程較為復(fù)雜,其計(jì)算耗時(shí)長(zhǎng)、計(jì)算體系規(guī)模小、需要用到價(jià)格昂貴的高性能計(jì)算機(jī)或計(jì)算集群,已成為制約相關(guān)研究與工程應(yīng)用的瓶頸。圖形處理器(Graphics Processing Unit,GPU)通用計(jì)算技術(shù)的出現(xiàn)為加速LAPW基組第一性原理計(jì)算提供了新的方向。GPU的浮點(diǎn)運(yùn)算性能、并行能力和存儲(chǔ)帶寬都超過(guò)了同期的主流CPU,而NVIDIA公司的CUDA框架大大降低了研發(fā)人員利用GPU開(kāi)發(fā)高性能計(jì)算程序的難度。本文提出了采用GPU來(lái)加速LAPW基組第一性原理計(jì)算的方法,并在該方法的基礎(chǔ)上實(shí)現(xiàn)GPU加速計(jì)算程序。主要的研究工作如下:1.系統(tǒng)研究了 LAPW基函數(shù)計(jì)算及采用LAPW基組的第一性原理計(jì)算方法,并且對(duì)GPU通用計(jì)算的硬件架構(gòu)和技術(shù)框架進(jìn)行了研究。2.對(duì)LAPW方法的自洽迭代計(jì)算過(guò)程中涉及LAPW計(jì)算且計(jì)算量較大的三個(gè)關(guān)鍵模塊進(jìn)...
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:98 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.2多西貝小波???
?02468??x??圖1.2多西貝小波???綴加平面波類(lèi)基組。與上述基組相比,綴加平面波(augmentedplanewave,APW)基??組,以及在其基礎(chǔ)上發(fā)展而來(lái)的線性綴加平面波(linearised?augmented-planewave,?LAPW)??基組pun在電子結(jié)構(gòu)計(jì)算上更為精確。APW基組的雛形是原胞法,即認(rèn)為原胞中的電子??只收到此原胞中原子核勢(shì)場(chǎng)的影響,而其它原胞對(duì)其影響可以忽略不計(jì),因此可以把原胞??內(nèi)的勢(shì)場(chǎng)看成是中心對(duì)稱的,類(lèi)似于自由原子的勢(shì)場(chǎng)。原胞法的模型過(guò)于粗糙,完全忽略??了實(shí)際晶體結(jié)構(gòu),只能用于計(jì)算筒單金屬的電子結(jié)構(gòu)。J.C.Slaterf28]結(jié)合了原胞法和平面波??基組的特點(diǎn),提出了綴加平面波(APW)基組,將原胞內(nèi)的空間分為兩個(gè)區(qū)域,波函數(shù)分別??以平面波基組和原子軌道組合基組進(jìn)行展開(kāi)。隨后
MKBS^Ma^/UCacte??圖2.1?Fermi架構(gòu)流式多處理器示意圖??圖2.2所示為Fermi架構(gòu)框圖。Fermi架構(gòu)擁有16個(gè)SM,總共512個(gè)CUDA核心,因??此在硬件上最多并行執(zhí)行512個(gè)線程;但是得益于高效的調(diào)度器和調(diào)度策略,在邏輯上通??常能夠同時(shí)啟動(dòng)更多的線程。6個(gè)384位的GDDR5?DRAM存儲(chǔ)器接口支持最高6GB的設(shè)??備內(nèi)存(顯存)。GigaThread引擎負(fù)責(zé)對(duì)SM進(jìn)行任務(wù)流分配和控制。??Fermi架構(gòu)包含的768?KB的二級(jí)緩存,被16個(gè)SM所共享。主機(jī)接口(Host?Interface)??模塊負(fù)責(zé)GPU設(shè)備通過(guò)PCIe總線與CPU連接,目前主流的PCIe-3.0標(biāo)難提供雙向8Gb/s??的理論傳輸速率。數(shù)據(jù)可以通過(guò)直接內(nèi)存訪問(wèn)控制器(DirectMemory?Access
【參考文獻(xiàn)】:
期刊論文
[1]異構(gòu)計(jì)算量子化學(xué)軟件的研發(fā)恰逢其時(shí)[J]. 田英齊,馬英晉,索兵兵,金鐘. 中國(guó)科學(xué)基金. 2018(01)
[2]GPU異構(gòu)平臺(tái)上的第一性原理計(jì)算[J]. 賈偉樂(lè),曹宗雁,付繼蕓,王龍. 科研信息化技術(shù)與應(yīng)用. 2012(05)
博士論文
[1]基于GPU計(jì)算平臺(tái)的電磁散射計(jì)算并行加速技術(shù)[D]. 高鵬程.浙江大學(xué) 2013
本文編號(hào):3236834
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:98 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.2多西貝小波???
?02468??x??圖1.2多西貝小波???綴加平面波類(lèi)基組。與上述基組相比,綴加平面波(augmentedplanewave,APW)基??組,以及在其基礎(chǔ)上發(fā)展而來(lái)的線性綴加平面波(linearised?augmented-planewave,?LAPW)??基組pun在電子結(jié)構(gòu)計(jì)算上更為精確。APW基組的雛形是原胞法,即認(rèn)為原胞中的電子??只收到此原胞中原子核勢(shì)場(chǎng)的影響,而其它原胞對(duì)其影響可以忽略不計(jì),因此可以把原胞??內(nèi)的勢(shì)場(chǎng)看成是中心對(duì)稱的,類(lèi)似于自由原子的勢(shì)場(chǎng)。原胞法的模型過(guò)于粗糙,完全忽略??了實(shí)際晶體結(jié)構(gòu),只能用于計(jì)算筒單金屬的電子結(jié)構(gòu)。J.C.Slaterf28]結(jié)合了原胞法和平面波??基組的特點(diǎn),提出了綴加平面波(APW)基組,將原胞內(nèi)的空間分為兩個(gè)區(qū)域,波函數(shù)分別??以平面波基組和原子軌道組合基組進(jìn)行展開(kāi)。隨后
MKBS^Ma^/UCacte??圖2.1?Fermi架構(gòu)流式多處理器示意圖??圖2.2所示為Fermi架構(gòu)框圖。Fermi架構(gòu)擁有16個(gè)SM,總共512個(gè)CUDA核心,因??此在硬件上最多并行執(zhí)行512個(gè)線程;但是得益于高效的調(diào)度器和調(diào)度策略,在邏輯上通??常能夠同時(shí)啟動(dòng)更多的線程。6個(gè)384位的GDDR5?DRAM存儲(chǔ)器接口支持最高6GB的設(shè)??備內(nèi)存(顯存)。GigaThread引擎負(fù)責(zé)對(duì)SM進(jìn)行任務(wù)流分配和控制。??Fermi架構(gòu)包含的768?KB的二級(jí)緩存,被16個(gè)SM所共享。主機(jī)接口(Host?Interface)??模塊負(fù)責(zé)GPU設(shè)備通過(guò)PCIe總線與CPU連接,目前主流的PCIe-3.0標(biāo)難提供雙向8Gb/s??的理論傳輸速率。數(shù)據(jù)可以通過(guò)直接內(nèi)存訪問(wèn)控制器(DirectMemory?Access
【參考文獻(xiàn)】:
期刊論文
[1]異構(gòu)計(jì)算量子化學(xué)軟件的研發(fā)恰逢其時(shí)[J]. 田英齊,馬英晉,索兵兵,金鐘. 中國(guó)科學(xué)基金. 2018(01)
[2]GPU異構(gòu)平臺(tái)上的第一性原理計(jì)算[J]. 賈偉樂(lè),曹宗雁,付繼蕓,王龍. 科研信息化技術(shù)與應(yīng)用. 2012(05)
博士論文
[1]基于GPU計(jì)算平臺(tái)的電磁散射計(jì)算并行加速技術(shù)[D]. 高鵬程.浙江大學(xué) 2013
本文編號(hào):3236834
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3236834.html
最近更新
教材專著