天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

多核處理器芯片計算平臺中并行程序性能優(yōu)化的研究

發(fā)布時間:2018-11-10 08:29
【摘要】:一直以來,處理器芯片廠商通過不斷提高主頻和指令級并行執(zhí)行能力來提升處理器的性能,F(xiàn)如今這種方法受到內(nèi)存帶寬、指令級并行度、單線程性能、功耗等諸多因素的限制,已無法延續(xù)下去。從應(yīng)用需求來看,日益復(fù)雜的科學(xué)計算、多媒體、虛擬化等多個應(yīng)用領(lǐng)域都在呼喚更為強(qiáng)大的計算能力。在技術(shù)困境和應(yīng)對計算能力需求的雙重驅(qū)動下,多核處理器芯片作為處理器芯片廠商的應(yīng)對策略,成為提升處理器性能的事實(shí)上的解決方案,這使得提升處理器性能的思路轉(zhuǎn)變成為不斷提高單個處理器芯片中處理核心的數(shù)目。 多核處理器提供大規(guī)模線程并行執(zhí)行能力,使應(yīng)用本身有巨大的性能提升潛力,但這給高效率地開發(fā)高性能并行應(yīng)用提出巨大挑戰(zhàn)。另一方面,并行程序性能優(yōu)化的過程一直都是以具體程序和具體計算平臺架構(gòu)為研究對象,收集性能數(shù)據(jù)、分析數(shù)據(jù)、尋找解決辦法、修改代碼實(shí)施改進(jìn)及評測性能,這使得優(yōu)化后的程序很難保證性能的可擴(kuò)展性。而從應(yīng)用角度出發(fā),分析、歸納各個種應(yīng)用中的核心計算過程,利用符合多核處理器芯片架構(gòu)的并行計算模型對這些核心計算過程進(jìn)行優(yōu)化,得出可以被重復(fù)利用的高性能可擴(kuò)展的軟件庫,即可以支持新應(yīng)用的高效開發(fā),也可以保證程序性能的可擴(kuò)展性。 在此背景下,本文以分層并行計算模型思想為指導(dǎo),從應(yīng)用驅(qū)動的并行程序性能優(yōu)化的角度出發(fā),首先提出了面向多核處理器芯片體系結(jié)構(gòu)的并行算法設(shè)計模型,在此基礎(chǔ)上對并行掃描算法進(jìn)行分析優(yōu)化,得出新的具有良好擴(kuò)展性、高性能g-scan算法,之后對13種核心計算實(shí)體之一的稀疏線性代數(shù)計算實(shí)體深入研究,應(yīng)用g-scan算法設(shè)計實(shí)現(xiàn)了新的稀疏矩陣-向量運(yùn)算算法,并應(yīng)用到結(jié)構(gòu)工程領(lǐng)域中廣泛使用的有限元分析軟件OpenSees,大大提升了其執(zhí)行效率。本文主要的工作和研究成果包括: (1)面向同構(gòu)多核處理器芯片體系結(jié)構(gòu)的UPMM并行計算模型 本文以當(dāng)前主流處理器芯片廠商推出的多核處理器芯片體系結(jié)構(gòu)為研究對象,通過分析各種多核處理器芯片緩存結(jié)構(gòu)及片上處理核心之間互連特征,設(shè)計出適用于多種同構(gòu)多核處理器體系結(jié)構(gòu)的并行算法設(shè)計模型UPMM,并詳細(xì)描述其模型參數(shù)及特征。根據(jù)數(shù)值計算及科學(xué)計算應(yīng)用中的基本算法邏輯單元,分析其數(shù)據(jù)訪問模式;以此為依據(jù)分析UPMM模型數(shù)據(jù)訪問開銷。最后基于UPMM模型及數(shù)據(jù)訪問開銷分析結(jié)論對矩陣乘運(yùn)算的并行算法進(jìn)行詳細(xì)的性能及緩存開銷的研究。實(shí)驗(yàn)證明,利用UPMM模型能較為準(zhǔn)確地分析并行算法的性能及緩存訪問開銷。 (2)可擴(kuò)展多核處理器模擬器 針對目前難以通過較少核心數(shù)目的多核處理器芯片來推斷較多處理核心數(shù)目芯片的應(yīng)用程序性能瓶頸和性能需求的問題,本文基于SimpleScalar用戶態(tài)模擬器工具,利用SystemC設(shè)計并實(shí)現(xiàn)了配置靈活、可擴(kuò)展的多核處理器芯片模擬器。通過功能性實(shí)驗(yàn)證明該模擬器能夠?qū)崿F(xiàn)多個模擬核并發(fā)執(zhí)行指令的設(shè)計目標(biāo);通過與實(shí)際采用多核處理器芯片架構(gòu)的計算機(jī)對比,證實(shí)本文設(shè)計實(shí)現(xiàn)的多核模擬器能夠較為準(zhǔn)確地模擬多核處理器多線程并發(fā)執(zhí)行的特點(diǎn);通過模擬器性能實(shí)驗(yàn)證明該模擬器比sim-outorder在指令執(zhí)行上更加高效;通過測試cachemisses實(shí)驗(yàn),證明了UPMM模型在對并行算法性能分析時的準(zhǔn)確性。 (3)研究基于UPMM模型基礎(chǔ)并行算法 本文對廣泛應(yīng)用于排序、最小生成樹、稀疏矩陣-向量運(yùn)算等問題的并行掃描算法開展深入研究,對其在PRAM模型和UPMM模型上的計算復(fù)雜度進(jìn)行分析比較,改進(jìn)原有算法的數(shù)據(jù)訪問順序,充分發(fā)掘數(shù)據(jù)的時間和空間局域性,并設(shè)計出基于UPMM模型新的掃描算法,即g-scan算法;通過對13種計算實(shí)體之一的稀疏矩陣-向量運(yùn)算算法的研究,應(yīng)用g-scan算法,設(shè)計實(shí)現(xiàn)了適用于多種體系結(jié)構(gòu)的稀疏矩陣-向量運(yùn)算算法。多核模擬器的仿真實(shí)驗(yàn)和實(shí)際多核處理器計算機(jī)的真實(shí)實(shí)驗(yàn),證明了新算法具有較高的性能和較好的可擴(kuò)展性。該研究成果為實(shí)際應(yīng)用如有限元分析、分子動力學(xué)分析等提供高性能的基礎(chǔ)運(yùn)算例程。 (4)并行有限元分析軟件OpenSeesSP的性能優(yōu)化 本文以廣泛應(yīng)用于結(jié)構(gòu)工程領(lǐng)域中的開源有限元軟件OpenSees的并行版本OpenSeesSP為研究對象,通過詳細(xì)分析其性能,發(fā)現(xiàn)該程序三個性能瓶頸分別是求解線性/非線性方程組時的分解矩陣算法、進(jìn)程間通信及求解線性/非線性方程組時的矩陣-向量運(yùn)算算法。設(shè)計基于行優(yōu)先的并行矩陣UTDU算法,在單節(jié)點(diǎn)使用多線程進(jìn)行矩陣分解,大大提高計算節(jié)點(diǎn)的計算效率;通過利用MPI2中對于多線程通信的支持,使用OpenMP多線程多進(jìn)程同時通信,,提高進(jìn)程間通信效率,有效緩解通信性能瓶頸。通過利用新設(shè)計的稀疏矩陣-向量計算算法,大大加快線性/非線性方程組求解過程。在實(shí)際高性能多核集群計算平臺中測試了上述性能優(yōu)化方案,實(shí)驗(yàn)結(jié)果表明對OpenSeesSP的性能優(yōu)化非常顯著。
[Abstract]:......
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2012
【分類號】:TP332

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 張錦雄;韋化;;基于OpenMP的對稱矩陣LDL~T分解并行算法實(shí)現(xiàn)[J];廣西科學(xué)院學(xué)報;2008年03期

2 計永昶,丁衛(wèi)群,陳國良,安虹;一種實(shí)用的并行計算模型[J];計算機(jī)學(xué)報;2001年04期

3 劉黎明,程建鋼;實(shí)對稱矩陣 LDL~T 分解的異步并行算法與實(shí)現(xiàn)[J];南京建筑工程學(xué)院學(xué)報;1997年04期

4 張健飛,姜弘道;對稱正定矩陣的并行LDL~T分解算法實(shí)現(xiàn)[J];計算機(jī)工程與設(shè)計;2003年10期

5 陳國良;苗乾坤;孫廣中;徐云;鄭啟龍;;分層并行計算模型[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2008年07期

相關(guān)碩士學(xué)位論文 前3條

1 凌炯;面向?qū)ο箝_放程序OpenSees在鋼筋混凝土結(jié)構(gòu)非線性分析中的應(yīng)用與初步開發(fā)[D];重慶大學(xué);2004年

2 商磊;大規(guī)模線性方程組求解的并行算法及應(yīng)用[D];西北工業(yè)大學(xué);2007年

3 許入文;NHBL并行計算模型的擴(kuò)展及其性能驗(yàn)證[D];北京交通大學(xué);2008年



本文編號:2321924

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2321924.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶272c5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com