基于國(guó)產(chǎn)高性能計(jì)算機(jī)的GRAPES性能優(yōu)化研究
本文關(guān)鍵詞:基于國(guó)產(chǎn)高性能計(jì)算機(jī)的GRAPES性能優(yōu)化研究,由筆耕文化傳播整理發(fā)布。
【摘要】:數(shù)值天氣預(yù)報(bào)系統(tǒng)是一個(gè)高性能計(jì)算技術(shù)與數(shù)值天氣預(yù)報(bào)技術(shù)結(jié)合的綜合性學(xué)科。數(shù)值天氣預(yù)報(bào)技術(shù)的發(fā)展是推動(dòng)高性能計(jì)算機(jī)發(fā)展的重要?jiǎng)恿?而高性能計(jì)算的發(fā)展為數(shù)值天氣預(yù)報(bào)系統(tǒng)采用更加復(fù)雜準(zhǔn)確的預(yù)報(bào)模型提供了軟硬件基礎(chǔ)。近年來,高性能計(jì)算機(jī)的性能不斷攀升,出現(xiàn)了以異構(gòu)眾核處理器為組建部件的異構(gòu)高性能計(jì)算機(jī)。與傳統(tǒng)的單核或多核處理器相比,異構(gòu)處理器的存儲(chǔ)體系和訪存方式發(fā)生了巨大的變化,需要研究新的并行計(jì)算方法發(fā)揮異構(gòu)高性能計(jì)算機(jī)的體系結(jié)構(gòu)優(yōu)勢(shì)。GRAPES是我國(guó)自主研發(fā)的新一代研究/業(yè)務(wù)數(shù)值天氣預(yù)報(bào)系統(tǒng),其通信模式和計(jì)算過程復(fù)雜,代碼量高達(dá)十萬余行。如何利用新一代國(guó)產(chǎn)異構(gòu)高性能計(jì)算機(jī)的體系結(jié)構(gòu)優(yōu)勢(shì),提高GRAPES模式在國(guó)產(chǎn)高性能計(jì)算機(jī)上的運(yùn)算效率和計(jì)算速度,達(dá)到實(shí)際數(shù)值預(yù)報(bào)業(yè)務(wù)的時(shí)限要求,改善GRAPES模式在大規(guī)模并行時(shí)的可擴(kuò)展性,是亟待研究的問題。本文研究了GRAPES的計(jì)算原理,對(duì)GRAPES程序結(jié)構(gòu)進(jìn)行了分析并找到影響GRAPES并行效率和可擴(kuò)展性的熱點(diǎn)子程序。通過對(duì)國(guó)產(chǎn)高性能計(jì)算系統(tǒng)的深入了解,構(gòu)建了實(shí)驗(yàn)所需的MPI并行環(huán)境。針對(duì)模式I/O及初始化部分“通信熱點(diǎn)”集中,系統(tǒng)消息緩存過大等問題,為各個(gè)子程序分別設(shè)計(jì)了高效的通信策略,有效提升了程序的可擴(kuò)展性和運(yùn)行速度,其中部分子程序的性能提升達(dá)到5倍以上。對(duì)于模式迭代積分過程,設(shè)計(jì)了“粗粒度MPI并行+細(xì)粒度眾核并行”多級(jí)異構(gòu)并行方案,充分利用異構(gòu)高性能計(jì)算機(jī)的體系結(jié)構(gòu)優(yōu)勢(shì),使用數(shù)量眾多的協(xié)處理器為GRAPES模式的迭代積分過程提供加速效果,并提出了幾種多級(jí)異構(gòu)并行方案的優(yōu)化策略,有效提升了該方案的并行效率,在使用4096至256顆處理器核進(jìn)行10天預(yù)報(bào)迭代積分過程時(shí),可分別減少1至6個(gè)小時(shí)不等的運(yùn)行時(shí)間。通過使用兩種不同分辨率的輸入數(shù)據(jù),在多個(gè)并行規(guī)模下對(duì)優(yōu)化方案進(jìn)行測(cè)試,得到了程序各部分消耗的墻鐘時(shí)間,并計(jì)算了程序的加速比和并行效率。實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的各種優(yōu)化方案有效地提高了GRAPES模式的運(yùn)行效率,改善了GRAPES模式的可擴(kuò)展性,充分發(fā)揮了異構(gòu)眾核處理器的優(yōu)勢(shì),使GRAPES模式能夠達(dá)到實(shí)際數(shù)值預(yù)報(bào)業(yè)務(wù)的時(shí)限要求。此外,本文提出的多級(jí)異構(gòu)并行計(jì)算方案和優(yōu)化策略不僅適用于數(shù)值天氣預(yù)報(bào)系統(tǒng)GRAPES,也適用于其他具有多重循環(huán)的高性能計(jì)算課題,具有一定的推廣意義。
【關(guān)鍵詞】:GRAPES模式 數(shù)值天氣預(yù)報(bào) 并行計(jì)算 異構(gòu)計(jì)算機(jī) 多級(jí)并行 優(yōu)化策略
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP38
【目錄】:
- 摘要3-5
- ABSTRACT5-10
- 第一章 緒論10-15
- 1.1 研究背景10-13
- 1.1.1 數(shù)值天氣預(yù)報(bào)發(fā)展概況10-11
- 1.1.2 國(guó)內(nèi)外高性能計(jì)算系統(tǒng)發(fā)展概況11-13
- 1.2 課題來源及目的13-14
- 1.3 本文主要研究?jī)?nèi)容14-15
- 第二章 消息傳遞接口及實(shí)驗(yàn)平臺(tái)綜述15-21
- 2.1 消息傳遞編程規(guī)范15-17
- 2.1.1 消息傳遞編程模型15-16
- 2.1.2 MPI的產(chǎn)生16
- 2.1.3 MPI的實(shí)現(xiàn)16-17
- 2.2 MPI并行環(huán)境構(gòu)建17-19
- 2.2.1 本課題采用的MPI實(shí)現(xiàn)17-18
- 2.2.2 配置MPICH實(shí)驗(yàn)環(huán)境18-19
- 2.3 硬件環(huán)境介紹19-20
- 2.4 本章小結(jié)20-21
- 第三章 程序結(jié)構(gòu)及性能分析21-26
- 3.1 GRAPES程序結(jié)構(gòu)21-23
- 3.2 GRAPES并行區(qū)域分解方案23-24
- 3.3 程序性能數(shù)據(jù)獲取及分析24-25
- 3.3.1 獲取程序性能數(shù)據(jù)24
- 3.3.2 性能數(shù)據(jù)分析24-25
- 3.4 本章小結(jié)25-26
- 第四章 GRAPES模式I/O及初始化優(yōu)化26-35
- 4.1 GRAPES_INPUT子程序優(yōu)化方案設(shè)計(jì)與實(shí)現(xiàn)26-30
- 4.1.1 grapes_input子程序結(jié)構(gòu)分析26-28
- 4.1.2 grapes_input子程序優(yōu)化方案設(shè)計(jì)28-30
- 4.2 COLM_INIT子程序優(yōu)化方案設(shè)計(jì)與實(shí)現(xiàn)30-32
- 4.2.1 colm_init子程序結(jié)構(gòu)分析30-31
- 4.2.2 colm_init子程序優(yōu)化方案設(shè)計(jì)31-32
- 4.3 模式輸出子程序優(yōu)化方案設(shè)計(jì)與實(shí)現(xiàn)32-34
- 4.3.1 模式輸出子程序結(jié)構(gòu)分析32-33
- 4.3.2 模式輸出子程序優(yōu)化方案設(shè)計(jì)33-34
- 4.4 本章小結(jié)34-35
- 第五章 GRAPES異構(gòu)并行算法研究35-46
- 5.1 眾核并行編程模型介紹35-36
- 5.2 GRAPES多級(jí)混合并行編程方案設(shè)計(jì)36-38
- 5.3 眾核并行編程優(yōu)化策略38-39
- 5.3.1 數(shù)據(jù)布局優(yōu)化38
- 5.3.2 計(jì)算與DMA通信相互隱藏38-39
- 5.3.3 離散數(shù)組內(nèi)存調(diào)整39
- 5.4 眾核并行編程的實(shí)現(xiàn)39-44
- 5.4.1 眾核并行編程方法39-43
- 5.4.2 使用Open Acc進(jìn)行眾核編程43-44
- 5.5 本章小結(jié)44-46
- 第六章 實(shí)驗(yàn)結(jié)果與性能分析46-57
- 6.1 模式I/O及初始化優(yōu)化結(jié)果及分析46-49
- 6.1.1 grapes_input子程序優(yōu)化結(jié)果46-47
- 6.1.2 colm_init子程序優(yōu)化結(jié)果47-48
- 6.1.3 模式輸出子程序優(yōu)化結(jié)果48-49
- 6.2 模式積分迭代過程優(yōu)化結(jié)果及分析49-52
- 6.3 預(yù)報(bào)結(jié)果驗(yàn)證52-56
- 6.4 本章小結(jié)56-57
- 第七章 總結(jié)與展望57-59
- 7.1 全文工作總結(jié)57
- 7.2 進(jìn)一步研究的展望57-59
- 參考文獻(xiàn)59-62
- 致謝62-63
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文63-65
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 樊建平;;高性能計(jì)算機(jī)的發(fā)展現(xiàn)狀與趨勢(shì)[J];計(jì)算機(jī)教育;2004年05期
2 笑春風(fēng);;權(quán)威看臺(tái)向您詮釋——中國(guó)高性能計(jì)算機(jī)的今天、明天[J];計(jì)算機(jī)教育;2004年06期
3 李國(guó)杰;;高性能計(jì)算機(jī)是先進(jìn)生產(chǎn)力[J];計(jì)算機(jī)教育;2004年06期
4 樊建平,陳明宇;追蹤下一代高性能計(jì)算機(jī)前沿?zé)狳c(diǎn)[J];科技潮;2004年05期
5 ;高性能計(jì)算機(jī)標(biāo)準(zhǔn):在希望與光明中前行[J];信息技術(shù)與標(biāo)準(zhǔn)化;2007年06期
6 ;國(guó)內(nèi)首次高性能計(jì)算機(jī)相關(guān)標(biāo)準(zhǔn)立項(xiàng)批準(zhǔn)[J];現(xiàn)代電子技術(shù);2007年11期
7 ;我國(guó)研制成功首臺(tái)采用龍芯2號(hào)的國(guó)產(chǎn)萬億次高性能計(jì)算機(jī)[J];中國(guó)集成電路;2008年01期
8 ;我國(guó)首臺(tái)萬億次高性能計(jì)算機(jī)誕生[J];大眾科技;2008年02期
9 朱瑩;;淺談高性能計(jì)算機(jī)的發(fā)展現(xiàn)狀和瓶頸[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2008年18期
10 ;我國(guó)將制定高性能計(jì)算機(jī)石油行業(yè)應(yīng)用標(biāo)準(zhǔn)[J];計(jì)量與測(cè)試技術(shù);2009年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 ;《計(jì)算機(jī)研究與發(fā)展》高性能計(jì)算機(jī)及應(yīng)用專刊(2005年)征稿啟事[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
2 孫凝輝;;高性能計(jì)算機(jī)的應(yīng)用和發(fā)展[A];第六屆全國(guó)計(jì)算機(jī)應(yīng)用聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
3 曹燕;;國(guó)家氣象信息中心高性能計(jì)算機(jī)的現(xiàn)狀及展望[A];信息技術(shù)在氣象領(lǐng)域的開發(fā)應(yīng)用論文集(一)[C];2005年
4 陳國(guó)良;;高性能計(jì)算及其應(yīng)用(節(jié)選)[A];“廣東科協(xié)論壇第27期:高性能計(jì)算與技術(shù)創(chuàng)新”薈萃[C];2009年
5 黃金禮;劉光明;胡維;;基于網(wǎng)絡(luò)服務(wù)的高性能計(jì)算機(jī)能耗管理研究[A];第十六屆計(jì)算機(jī)工程與工藝年會(huì)暨第二屆微處理器技術(shù)論壇論文集[C];2012年
6 黃清南;梁曉光;張利發(fā);;高性能計(jì)算機(jī)上光子輸運(yùn)的并行計(jì)算[A];中國(guó)工程物理研究院科技年報(bào)(1998)[C];1998年
7 魏帆;張寶花;劉倩;金鐘;;面向新一代高性能計(jì)算機(jī)的量子化學(xué)程序并行化框架[A];中國(guó)化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第13分會(huì)場(chǎng)摘要集[C];2012年
8 彭德純;;分布式并行處理研究的若干問題[A];IEEE北京分會(huì)第一屆學(xué)術(shù)年會(huì)論文集[C];1987年
9 許榕生;周玉林;吳春珍;;高性能計(jì)算機(jī)在物理學(xué)中的應(yīng)用[A];第8屆全國(guó)核電子學(xué)與核探測(cè)技術(shù)學(xué)術(shù)年會(huì)論文集(二)[C];1996年
10 劉菁;馮丹;;高性能計(jì)算機(jī)在河南省氣象局的應(yīng)用探討[A];2011年中國(guó)氣象學(xué)會(huì)氣象通信與信息技術(shù)委員會(huì)暨國(guó)家氣象信息中心科技年會(huì)論文摘要[C];2011年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 本報(bào)記者 劉路沙;我國(guó)高性能計(jì)算機(jī)如何再攀高峰[N];光明日?qǐng)?bào);2003年
2 徐建華;高性能計(jì)算機(jī)標(biāo)準(zhǔn)助力信息產(chǎn)業(yè)[N];中國(guó)質(zhì)量報(bào);2007年
3 寧雷;高性能計(jì)算機(jī)標(biāo)準(zhǔn)有望出臺(tái)[N];中國(guó)電腦教育報(bào);2007年
4 本報(bào)記者 寧雷;曙光牽頭成立中國(guó)高性能計(jì)算機(jī)標(biāo)準(zhǔn)工作委員會(huì)[N];中國(guó)電腦教育報(bào);2007年
5 韓丹;高性能計(jì)算機(jī)標(biāo)準(zhǔn)制定將遇阻力[N];經(jīng)濟(jì)參考報(bào);2007年
6 曹增光;中國(guó)沖頂高性能計(jì)算機(jī)標(biāo)準(zhǔn)[N];中國(guó)經(jīng)濟(jì)時(shí)報(bào);2007年
7 原國(guó)鋒;高性能計(jì)算機(jī)亟需國(guó)家標(biāo)準(zhǔn)[N];人民日?qǐng)?bào);2007年
8 本報(bào)記者 朱毅 胡志敏;期待國(guó)產(chǎn)高性能計(jì)算機(jī)“破冰”[N];政府采購(gòu)信息報(bào);2006年
9 馮曉芳 趙曉輝;我國(guó)高性能計(jì)算機(jī)標(biāo)準(zhǔn)制定蓄勢(shì)待發(fā)[N];中國(guó)信息報(bào);2007年
10 尹訓(xùn)寧;我國(guó)將研究制定高性能計(jì)算機(jī)標(biāo)準(zhǔn)[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 李暉;高性能計(jì)算機(jī)若干關(guān)鍵問題研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 喻杰;面向高性能計(jì)算機(jī)體系結(jié)構(gòu)的MapReduce編程框架優(yōu)化研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
2 劉釗;基于國(guó)產(chǎn)高性能計(jì)算機(jī)的GRAPES性能優(yōu)化研究[D];上海交通大學(xué);2014年
3 陳良;大型高性能計(jì)算機(jī)集群故障快速診斷與自動(dòng)恢復(fù)系統(tǒng)開發(fā)[D];電子科技大學(xué);2012年
4 雷強(qiáng);高性能計(jì)算機(jī)功耗管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
5 黃,
本文編號(hào):390524
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/390524.html