高性能計算多層次不連續(xù)非線性可擴(kuò)展現(xiàn)象研究
發(fā)布時間:2022-01-02 22:26
高性能計算是計算科學(xué)的具體實踐,極大地促進(jìn)了各領(lǐng)域的科學(xué)進(jìn)展,也對國家的經(jīng)濟(jì)建設(shè)起到了無法替代的基礎(chǔ)性作用.從幾十年發(fā)展的時間尺度和十萬至百萬核量級并行規(guī)模尺度研究大規(guī)模并行軟件的研制發(fā)展歷史來看,發(fā)現(xiàn)大規(guī)模并行應(yīng)用軟件的開發(fā)中物理模型、并行算法、并行軟件實現(xiàn)以及底層硬件多個層次中存在的可擴(kuò)展性的兩種有趣現(xiàn)象,即不連續(xù)性和非線性現(xiàn)象.本文總結(jié)分析這一普遍存在現(xiàn)象,系統(tǒng)梳理計算機(jī)軟硬件發(fā)展,特別是高性能計算發(fā)展中的可擴(kuò)展問題,為未來并行計算領(lǐng)域發(fā)展提供方法論層面的借鑒和指導(dǎo).
【文章來源】:計算機(jī)學(xué)報. 2020,43(06)北大核心EICSCD
【文章頁數(shù)】:17 頁
【部分圖文】:
多層次不連續(xù)非線性可擴(kuò)展現(xiàn)象
但依賴單CPU主頻提升性能的時代已經(jīng)結(jié)束[29],這是硬件上的不連續(xù)現(xiàn)象之一.從90nm開始,由于漏電流的問題,登納德擴(kuò)展定律已逐漸失效,即若想隨著晶體管尺寸縮小繼續(xù)提升主頻,每個晶體管的電壓不能相應(yīng)降低,則總功耗會隨著晶體管數(shù)目指數(shù)增長,這在當(dāng)前功耗預(yù)算和散熱能力的要求下都是不可接受的.因此,借用在文獻(xiàn)中經(jīng)常出現(xiàn)的圖2所示,處理器主頻已經(jīng)有十多年沒有明顯提升了.若想利用芯片上越來越多的晶體管提升程序性能,只能另辟蹊徑———采用并行的架構(gòu),這給硬軟件設(shè)計都帶來了劃時代的變革,從此進(jìn)入并行時代.另一方面,存儲墻及功耗墻等問題也成為制約單核處理器性能提升的瓶頸.這些因素導(dǎo)致芯片生產(chǎn)商轉(zhuǎn)而通過增加處理器核數(shù)使得處理器晶體管數(shù)量繼續(xù)沿摩爾定律增加,多核/眾核架構(gòu)成為計算機(jī)體系結(jié)構(gòu)發(fā)展的重要趨勢.其中,以GPU[30-33]為代表的眾核架構(gòu)以其更強(qiáng)的計算能力和更高的訪存帶寬受到了越來越多應(yīng)用開發(fā)人員的青睞.自2007年NVIDIA首次提出GPGPU概念以來,GPU在通用計算領(lǐng)域得到了日益廣泛地應(yīng)用.主流GPU廠商也根據(jù)實際計算需求,對GPU架構(gòu)進(jìn)行了不斷改進(jìn)和完善[34].
當(dāng)前大氣環(huán)流模式的發(fā)展主要集中在兩個方向,一方面是物理過程越來越精細(xì),一方面是分辨率越來越高,因為更高分辨率的氣候系統(tǒng)模式能直接分辨更精細(xì)時空尺度的物理過程,從而有更高的模式性能.如圖3所示,精度和分辨率的提高可以對全球氣候進(jìn)行更為精細(xì)地模擬和分析,而精度和分辨率的提高導(dǎo)致了問題規(guī)模的擴(kuò)大.依據(jù)計算內(nèi)容和計算特點的不同,大氣環(huán)流模式可以分為動力框架和物理過程兩大部分.動力框架主要是用來求解關(guān)于時間的偏微分方程組,離散方案的設(shè)計是關(guān)鍵,要同時保證計算的穩(wěn)定性、守恒性、精確性和高效性.動力框架的計算在空間上是三維的,每一點的計算都可能與周圍的很多點有關(guān)系.物理過程主要用來計算控制方程中的源匯項,以及一些診斷量(如降水、云量、輻射通量等).物理過程的計算是在單柱(single column)上進(jìn)行的,也就是說是一維的,僅有垂直方向的數(shù)據(jù)交換.
【參考文獻(xiàn)】:
期刊論文
[1]并行計算系統(tǒng)度量指標(biāo)綜述[J]. 王之元,楊學(xué)軍. 計算機(jī)工程與科學(xué). 2010(10)
[2]基于前驗負(fù)載差異的負(fù)載平衡性能模型[J]. 張理論,吳建平,宋君強(qiáng). 計算機(jī)應(yīng)用. 2009(10)
[3]數(shù)值并行計算可擴(kuò)展性評價與測試[J]. 遲利華,劉杰,胡慶豐. 計算機(jī)研究與發(fā)展. 2005(06)
[4]近優(yōu)可擴(kuò)展性:一種實用的可擴(kuò)展性度量[J]. 陳軍,李曉梅. 計算機(jī)學(xué)報. 2001(02)
[5]一種更有效的并行系統(tǒng)可擴(kuò)展性模型[J]. 王與力,楊曉東. 計算機(jī)學(xué)報. 2001(01)
本文編號:3564995
【文章來源】:計算機(jī)學(xué)報. 2020,43(06)北大核心EICSCD
【文章頁數(shù)】:17 頁
【部分圖文】:
多層次不連續(xù)非線性可擴(kuò)展現(xiàn)象
但依賴單CPU主頻提升性能的時代已經(jīng)結(jié)束[29],這是硬件上的不連續(xù)現(xiàn)象之一.從90nm開始,由于漏電流的問題,登納德擴(kuò)展定律已逐漸失效,即若想隨著晶體管尺寸縮小繼續(xù)提升主頻,每個晶體管的電壓不能相應(yīng)降低,則總功耗會隨著晶體管數(shù)目指數(shù)增長,這在當(dāng)前功耗預(yù)算和散熱能力的要求下都是不可接受的.因此,借用在文獻(xiàn)中經(jīng)常出現(xiàn)的圖2所示,處理器主頻已經(jīng)有十多年沒有明顯提升了.若想利用芯片上越來越多的晶體管提升程序性能,只能另辟蹊徑———采用并行的架構(gòu),這給硬軟件設(shè)計都帶來了劃時代的變革,從此進(jìn)入并行時代.另一方面,存儲墻及功耗墻等問題也成為制約單核處理器性能提升的瓶頸.這些因素導(dǎo)致芯片生產(chǎn)商轉(zhuǎn)而通過增加處理器核數(shù)使得處理器晶體管數(shù)量繼續(xù)沿摩爾定律增加,多核/眾核架構(gòu)成為計算機(jī)體系結(jié)構(gòu)發(fā)展的重要趨勢.其中,以GPU[30-33]為代表的眾核架構(gòu)以其更強(qiáng)的計算能力和更高的訪存帶寬受到了越來越多應(yīng)用開發(fā)人員的青睞.自2007年NVIDIA首次提出GPGPU概念以來,GPU在通用計算領(lǐng)域得到了日益廣泛地應(yīng)用.主流GPU廠商也根據(jù)實際計算需求,對GPU架構(gòu)進(jìn)行了不斷改進(jìn)和完善[34].
當(dāng)前大氣環(huán)流模式的發(fā)展主要集中在兩個方向,一方面是物理過程越來越精細(xì),一方面是分辨率越來越高,因為更高分辨率的氣候系統(tǒng)模式能直接分辨更精細(xì)時空尺度的物理過程,從而有更高的模式性能.如圖3所示,精度和分辨率的提高可以對全球氣候進(jìn)行更為精細(xì)地模擬和分析,而精度和分辨率的提高導(dǎo)致了問題規(guī)模的擴(kuò)大.依據(jù)計算內(nèi)容和計算特點的不同,大氣環(huán)流模式可以分為動力框架和物理過程兩大部分.動力框架主要是用來求解關(guān)于時間的偏微分方程組,離散方案的設(shè)計是關(guān)鍵,要同時保證計算的穩(wěn)定性、守恒性、精確性和高效性.動力框架的計算在空間上是三維的,每一點的計算都可能與周圍的很多點有關(guān)系.物理過程主要用來計算控制方程中的源匯項,以及一些診斷量(如降水、云量、輻射通量等).物理過程的計算是在單柱(single column)上進(jìn)行的,也就是說是一維的,僅有垂直方向的數(shù)據(jù)交換.
【參考文獻(xiàn)】:
期刊論文
[1]并行計算系統(tǒng)度量指標(biāo)綜述[J]. 王之元,楊學(xué)軍. 計算機(jī)工程與科學(xué). 2010(10)
[2]基于前驗負(fù)載差異的負(fù)載平衡性能模型[J]. 張理論,吳建平,宋君強(qiáng). 計算機(jī)應(yīng)用. 2009(10)
[3]數(shù)值并行計算可擴(kuò)展性評價與測試[J]. 遲利華,劉杰,胡慶豐. 計算機(jī)研究與發(fā)展. 2005(06)
[4]近優(yōu)可擴(kuò)展性:一種實用的可擴(kuò)展性度量[J]. 陳軍,李曉梅. 計算機(jī)學(xué)報. 2001(02)
[5]一種更有效的并行系統(tǒng)可擴(kuò)展性模型[J]. 王與力,楊曉東. 計算機(jī)學(xué)報. 2001(01)
本文編號:3564995
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3564995.html
最近更新
教材專著