面向共享存儲系統(tǒng)的計算模型及性能優(yōu)化
發(fā)布時間:2021-07-06 13:00
長期以來,大規(guī)模計算的應(yīng)用需求推動并行計算技術(shù)不斷發(fā)展,并行計算機的峰值計算能力穩(wěn)步提高。當(dāng)前,基于共享存儲的片上多核處理器搭建集群系統(tǒng),成為并行體系結(jié)構(gòu)的發(fā)展趨勢,并行計算已經(jīng)進入了千萬億次并行計算機的時代。但是,并行計算機的實際應(yīng)用水平不高,應(yīng)用程序?qū)崪y性能遠低于系統(tǒng)的峰值性能。因此,充分發(fā)揮并行計算機的計算能力,加速應(yīng)用程序的執(zhí)行速度,逐漸成為并行計算領(lǐng)域中亟需解決的一個關(guān)鍵問題。未來,共享存儲系統(tǒng)是搭建大規(guī)模并行處理系統(tǒng)的基本單元。圍繞提高并行計算機的實際應(yīng)用效率,縮小實際應(yīng)用性能與機器峰值性能之間的差異,本文以共享存儲系統(tǒng)為目標平臺,研究并行計算模型以及程序性能優(yōu)化關(guān)鍵技術(shù),主要研究工作分為兩部分:一是研究分層的并行計算模型,為并行算法設(shè)計和并行程序執(zhí)行提供理論基礎(chǔ)和分析方法,其中重點研究片上多核系統(tǒng)的程序執(zhí)行模型;二是研究共享存儲系統(tǒng)上的程序性能優(yōu)化技術(shù),以提高并行應(yīng)用程序的實際性能,同時為程序執(zhí)行模型提供思路和借鑒。本文針對計算模型和優(yōu)化技術(shù)的研究,可以有效地提高并行應(yīng)用的性能,充分發(fā)揮并行計算機的計算能力,具有重要的學(xué)術(shù)價值和廣泛的應(yīng)用前景。具體而言,本文的主要研究成果...
【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁數(shù)】:133 頁
【學(xué)位級別】:博士
【部分圖文】:
BSP模型中超級步的計算過程示意圖
共享內(nèi)存系統(tǒng)的ch一shmem。出于兼容性、通用如不同機器可以使用的共享內(nèi)存大小不同,M沒有針對共享存儲做深入優(yōu)化,導(dǎo)致MPI通信高。ch_shmem實現(xiàn)中,每個進程有一個獨立消息,隊列的大小為當(dāng)前通信域中進程的個數(shù)進程之間的消息傳遞通過讀寫該通信隊列來訪問該共享隊列的不同部分,即多個進程可列所有者發(fā)送消息),只有一個進程可以讀共發(fā)送者之間使用鎖來實現(xiàn)對共享隊列的互斥讀制數(shù)據(jù)到共享隊列的尾部,然后消息接收者從地址空間。通常需要鎖來保證對系統(tǒng)共享緩程同時向共享隊列追加數(shù)據(jù)或者接收進程在讀消息,保證對共享隊列寫的時候沒有其他銷比較大。
上一節(jié)討論的MPI消息傳遞實現(xiàn)中,兩次的數(shù)據(jù)復(fù)制是不必要的,如果消息發(fā)送者需要保存發(fā)送的數(shù)據(jù)僅一次的數(shù)據(jù)復(fù)制就可以了,甚至某些情況下不需要數(shù)據(jù)復(fù)制,如圖3.2所示。當(dāng)進程間有數(shù)據(jù)要傳遞時,預(yù)先使用進程間同步機制申請一塊共享內(nèi)存,需要傳遞的數(shù)據(jù)直接存放在這塊內(nèi)存中,其他進程都可以訪問該共享內(nèi)存塊,可以讀取其中的數(shù)據(jù)或者復(fù)制到自己的地址空間中。當(dāng)所有的進程共享同一個數(shù)據(jù)結(jié)構(gòu),不同進程寫該數(shù)據(jù)結(jié)構(gòu)的不同部分,計算時會用到其他進程之前寫入的數(shù)據(jù),這時不需要進行數(shù)據(jù)復(fù)制,在一個進程寫43
【參考文獻】:
期刊論文
[1]并行計算的一體化研究現(xiàn)狀與發(fā)展趨勢[J]. 陳國良,孫廣中,徐云,龍柏. 科學(xué)通報. 2009(08)
[2]并行算法研究方法學(xué)[J]. 陳國良,孫廣中,徐云,呂敏. 計算機學(xué)報. 2008(09)
[3]并行計算系列課程教學(xué)團隊建設(shè)[J]. 孫廣中,徐云,鄭啟龍,吳俊敏,陳國良. 計算機教育. 2008(15)
[4]分層并行計算模型[J]. 陳國良,苗乾坤,孫廣中,徐云,鄭啟龍. 中國科學(xué)技術(shù)大學(xué)學(xué)報. 2008(07)
[5]基于龍芯2F的國產(chǎn)萬億次高性能計算機KD-50-I的研制[J]. 張俊霞,張煥杰,李會民. 中國科學(xué)技術(shù)大學(xué)學(xué)報. 2008(01)
[6]RNA二級結(jié)構(gòu)預(yù)測中動態(tài)規(guī)劃的優(yōu)化和有效并行[J]. 譚光明,馮圣中,孫凝暉. 軟件學(xué)報. 2006(07)
[7]萬億次機群系統(tǒng)高性能應(yīng)用軟件運行現(xiàn)狀分析[J]. 侯曉吻,張林波,張云泉. 計算機工程. 2005(22)
[8]面向高性能數(shù)值計算的并行計算模型DRAM(h)[J]. 張云泉. 計算機學(xué)報. 2003(12)
[9]并行計算性能的“雙流”分析[J]. 喬香珍. 計算機科學(xué). 2001(10)
[10]一種實用的并行計算模型[J]. 計永昶,丁衛(wèi)群,陳國良,安虹. 計算機學(xué)報. 2001(04)
博士論文
[1]基于SMP結(jié)點的機群通信系統(tǒng)關(guān)鍵技術(shù)的研究[D]. 馬捷.中國科學(xué)院研究生院(計算技術(shù)研究所) 2001
碩士論文
[1]NHBL并行計算模型的擴展及其性能驗證[D]. 許入文.北京交通大學(xué) 2008
[2]一種改進的NHBL并行計算模型及其性能評測[D]. 趙琛.北京交通大學(xué) 2007
本文編號:3268289
【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁數(shù)】:133 頁
【學(xué)位級別】:博士
【部分圖文】:
BSP模型中超級步的計算過程示意圖
共享內(nèi)存系統(tǒng)的ch一shmem。出于兼容性、通用如不同機器可以使用的共享內(nèi)存大小不同,M沒有針對共享存儲做深入優(yōu)化,導(dǎo)致MPI通信高。ch_shmem實現(xiàn)中,每個進程有一個獨立消息,隊列的大小為當(dāng)前通信域中進程的個數(shù)進程之間的消息傳遞通過讀寫該通信隊列來訪問該共享隊列的不同部分,即多個進程可列所有者發(fā)送消息),只有一個進程可以讀共發(fā)送者之間使用鎖來實現(xiàn)對共享隊列的互斥讀制數(shù)據(jù)到共享隊列的尾部,然后消息接收者從地址空間。通常需要鎖來保證對系統(tǒng)共享緩程同時向共享隊列追加數(shù)據(jù)或者接收進程在讀消息,保證對共享隊列寫的時候沒有其他銷比較大。
上一節(jié)討論的MPI消息傳遞實現(xiàn)中,兩次的數(shù)據(jù)復(fù)制是不必要的,如果消息發(fā)送者需要保存發(fā)送的數(shù)據(jù)僅一次的數(shù)據(jù)復(fù)制就可以了,甚至某些情況下不需要數(shù)據(jù)復(fù)制,如圖3.2所示。當(dāng)進程間有數(shù)據(jù)要傳遞時,預(yù)先使用進程間同步機制申請一塊共享內(nèi)存,需要傳遞的數(shù)據(jù)直接存放在這塊內(nèi)存中,其他進程都可以訪問該共享內(nèi)存塊,可以讀取其中的數(shù)據(jù)或者復(fù)制到自己的地址空間中。當(dāng)所有的進程共享同一個數(shù)據(jù)結(jié)構(gòu),不同進程寫該數(shù)據(jù)結(jié)構(gòu)的不同部分,計算時會用到其他進程之前寫入的數(shù)據(jù),這時不需要進行數(shù)據(jù)復(fù)制,在一個進程寫43
【參考文獻】:
期刊論文
[1]并行計算的一體化研究現(xiàn)狀與發(fā)展趨勢[J]. 陳國良,孫廣中,徐云,龍柏. 科學(xué)通報. 2009(08)
[2]并行算法研究方法學(xué)[J]. 陳國良,孫廣中,徐云,呂敏. 計算機學(xué)報. 2008(09)
[3]并行計算系列課程教學(xué)團隊建設(shè)[J]. 孫廣中,徐云,鄭啟龍,吳俊敏,陳國良. 計算機教育. 2008(15)
[4]分層并行計算模型[J]. 陳國良,苗乾坤,孫廣中,徐云,鄭啟龍. 中國科學(xué)技術(shù)大學(xué)學(xué)報. 2008(07)
[5]基于龍芯2F的國產(chǎn)萬億次高性能計算機KD-50-I的研制[J]. 張俊霞,張煥杰,李會民. 中國科學(xué)技術(shù)大學(xué)學(xué)報. 2008(01)
[6]RNA二級結(jié)構(gòu)預(yù)測中動態(tài)規(guī)劃的優(yōu)化和有效并行[J]. 譚光明,馮圣中,孫凝暉. 軟件學(xué)報. 2006(07)
[7]萬億次機群系統(tǒng)高性能應(yīng)用軟件運行現(xiàn)狀分析[J]. 侯曉吻,張林波,張云泉. 計算機工程. 2005(22)
[8]面向高性能數(shù)值計算的并行計算模型DRAM(h)[J]. 張云泉. 計算機學(xué)報. 2003(12)
[9]并行計算性能的“雙流”分析[J]. 喬香珍. 計算機科學(xué). 2001(10)
[10]一種實用的并行計算模型[J]. 計永昶,丁衛(wèi)群,陳國良,安虹. 計算機學(xué)報. 2001(04)
博士論文
[1]基于SMP結(jié)點的機群通信系統(tǒng)關(guān)鍵技術(shù)的研究[D]. 馬捷.中國科學(xué)院研究生院(計算技術(shù)研究所) 2001
碩士論文
[1]NHBL并行計算模型的擴展及其性能驗證[D]. 許入文.北京交通大學(xué) 2008
[2]一種改進的NHBL并行計算模型及其性能評測[D]. 趙琛.北京交通大學(xué) 2007
本文編號:3268289
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3268289.html
最近更新
教材專著