天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 物理論文 >

基于神威平臺的格點QCD數(shù)值模擬計算的實現(xiàn)與優(yōu)化

發(fā)布時間:2021-10-06 15:54
  格點QCD(Lattice quantum chromodynamics)是用格點量子場論研究量子色動力學(quantum chromodynamics)的一種主流非微擾理論計算方法。它通過將場變量定義在四維網格中并進行數(shù)值模擬計算,測量由夸克與膠子構成的物理量。格點QCD數(shù)值模擬計算對網格中每個點進行迭代計算,來求解關鍵量:四維網格中夸克的傳播振幅。格點QCD數(shù)值模擬計算屬于高性能計算,其性能熱點為dslash計算。四維空間中的點在dslash計算中要進行頻繁的通信與計算,因此格點QCD數(shù)值模擬計算需要大量計算資源,通常在大規(guī)模超級計算機上進行。國產超算平臺“神威·太湖之光”是世界上首臺峰值性能超過100PFlops的超級計算機,已有許多高性能應用在神威平臺上進行了移植優(yōu)化并取得了很好的效果,并連續(xù)兩年奪得高性能應用領域杰出獎項——戈登貝爾獎。由于神威平臺片上異構設備異于常用的x86同構處理器或GPU異構加速卡,現(xiàn)有的格點QCD數(shù)值模擬計算程序無法直接在神威平臺的從核陣列中使用。本文首次在神威平臺中實現(xiàn)并優(yōu)化了格點QCD數(shù)值模擬計算。本文重點從格點QCD數(shù)值模擬計算在“神威·太湖之光... 

【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:88 頁

【學位級別】:碩士

【部分圖文】:

基于神威平臺的格點QCD數(shù)值模擬計算的實現(xiàn)與優(yōu)化


圖2.1?2018年6月超算榜單??

相關技術,精簡指令集,全功能,字長


?第2章相關技術??圖如圖2.2所示:??M?iB?Memory?.Main?SUmory??.?I?,?.?????.J?二?^??i1?j?ummm??:1?1?—?1??m,,Lm?1?;?…丄…I?:?P'????J?;Tr ̄-';;^?::':|_p;.q??MFE?…二二?MPE?/?(R7,C〇)M?(R7,CI>?^?(R7,C2)?i-???-?(R7,C7)?>-???CPE?ciusier?CPE?caster?/??(…、[:觀湘?<?(.i?叫1湘?/?:?:?:? ̄T"?????r——f?f—?f?????1?V??'J:::;1'?::?????/?(R2,C0)?(R2,C。?(R2,C2)m?-?????(R2,C7)?r??SI?—?-?No<????__________?'?■?一.??¥??■?/?F^\'?r^s??*????/?(RMTO)?1?(R1,CU???(R1,C2>、.????(R1,C7)??—L__?__?l—1?L—J??CPE?cl?i*ter?CPE?closler??MFE?H-flfffti?MPC?HtttH?十?1??L^rtttn?^rtrt…t;?(R〇

示意圖,主從,四種模式,核心段


主核負責計算、通信或I/O等操作;主從動態(tài)并行模式是針對任務并行程序,??由主核對任務進行調度,從核負責任務計算并回寫計算結果。四種主從計算模式??如圖2.3所示:?? ̄ ̄main(t?main() ̄??核心段A?亡閑?核心段A?空閑??(計算/通?IS/IO)?(計?K/iift/ro)??加速核心Kb到從核??2閑?=;)?核心段“協(xié)麵??執(zhí)行完畢返回??核心段C?空閑?核心段C?空閑??(計算/通倍/|〇>?I?(計算/通館/丨〇>?I??主從加速并行?主從協(xié)同并彳??主核?從核?主核?從檳?? ̄main()?main(} ̄??…??I??(計算/▲館/|〇〉?空閑?)??加■心段B到從棧??計一?S?s??。??核心段c?空閑??撕薄/通倍/?〇>:,??主核’主從異步并行從核?挪?主從動態(tài)并g核???圖2.3主從計算四種模式示意圖??14??

【參考文獻】:
期刊論文
[1]神威太湖之光上OpenFOAM的移植與優(yōu)化[J]. 孟德龍,文敏華,韋建文,林新華.  計算機科學. 2017(10)
[2]基于申威眾核處理器的混合并行遺傳算法[J]. 趙瑞祥,鄭凱,劉垚,王肅,劉艷,沈煥學,周謙豪.  計算機應用. 2017(09)
[3]基于神威太湖之光的NAMD軟件的移植與優(yōu)化[J]. 姚文軍,陳俊仕,蘇志超,余洋,廖陳志,安虹.  計算機工程與科學. 2017(06)
[4]面向神威·太湖之光的PETSc可擴展異構并行算法及其性能優(yōu)化[J]. 洪文杰,李肯立,全哲,陽王東,李克勤,郝子宇,謝向輝.  計算機學報. 2017(09)
[5]面向SIMD向量化的循環(huán)優(yōu)化技術研究[J]. 高偉,徐金龍,孫回回,李敏.  信息工程大學學報. 2016(04)
[6]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG.  Science China(Information Sciences). 2016(07)
[7]一種面向高性能計算的自主眾核處理器結構[J]. 鄭方,許勇,李宏亮,謝向輝,陳左寧.  中國科學:信息科學. 2015(04)
[8]面向高性能計算的眾核處理器結構級高能效技術[J]. 鄭方,張昆,鄔貴明,高紅光,唐勇,呂暉,過鋒,李宏亮,謝向輝,陳左寧.  計算機學報. 2014(10)
[9]面向異構眾核從核的數(shù)學函數(shù)庫訪存優(yōu)化方法[J]. 許瑾晨,郭紹忠,黃永忠,王磊.  計算機科學. 2014(06)
[10]生物大分子的分子動力學模擬過程在百萬億次集群上的部署優(yōu)化[J]. 潘龍強,耿存亮,慕宇光,劉鑫,胡毅,潘景山,周亞濱,龔斌,王祿山.  山東大學學報(理學版). 2012(07)

碩士論文
[1]HPCG在多核/眾核平臺上的實現(xiàn)與優(yōu)化[D]. 廖陳志.中國科學技術大學 2018
[2]神威·太湖之光上數(shù)據(jù)流編程模型的設計與實現(xiàn)[D]. 蘇志超.中國科學技術大學 2018
[3]面向申威眾核架構的GROMACS并行實現(xiàn)與性能優(yōu)化[D]. 余洋.中國科學技術大學 2018



本文編號:3420319

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wulilw/3420319.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶52f38***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com