分布式內(nèi)存多核處理器流程序虛擬機(jī)研究
發(fā)布時(shí)間:2020-07-12 21:52
【摘要】:隨著多核處理器成為主流產(chǎn)品和工業(yè)標(biāo)準(zhǔn),如何在屏蔽處理器底層細(xì)節(jié)簡(jiǎn)化編程方式的同時(shí)充分利用多核處理器的并行資源,是并行程序設(shè)計(jì)領(lǐng)域的研究熱點(diǎn)和難點(diǎn)。流編程作為一種高效的并行編程模型提供了顯式的并行性,廣泛用于多媒體處理和科學(xué)計(jì)算等數(shù)據(jù)和計(jì)算密集型領(lǐng)域。流編程模型受到了廣泛的關(guān)注,各大芯片廠商和科研機(jī)構(gòu)都研制出不同的多核體系結(jié)構(gòu)來支持流應(yīng)用,但它們都只開發(fā)針對(duì)自己平臺(tái)的軟件系統(tǒng),使得流應(yīng)用在各平臺(tái)間移植困難。針對(duì)以上問題,需要對(duì)流程序的跨平臺(tái)問題進(jìn)行系統(tǒng)研究。 通過向流編程模型Brook中加入數(shù)據(jù)流模型設(shè)計(jì)了新的流編程模型DFBrook,可以同時(shí)支持?jǐn)?shù)據(jù)級(jí)和任務(wù)級(jí)的并行,編程人員可以通過向C代碼中嵌入流代碼來表達(dá)特定程序模塊的數(shù)據(jù)流執(zhí)行。為了使DFBrook應(yīng)用程序在不同的多核處理器上易于移植并充分利用并行資源,設(shè)計(jì)并實(shí)現(xiàn)了流程序虛擬機(jī)(Stream program Virtual Machine, SVM)來優(yōu)化處理流應(yīng)用。SVM對(duì)不同多核體系結(jié)構(gòu)的關(guān)鍵部分進(jìn)行提煉,如內(nèi)存層次、處理器結(jié)構(gòu)和數(shù)據(jù)傳輸引擎等,形成抽象機(jī)模型,并定義了一組應(yīng)用程序接口,以編譯器輔助消息驅(qū)動(dòng)的動(dòng)態(tài)調(diào)度方式來完成流應(yīng)用到抽象機(jī)模型上的高效映射,不同的多核處理器對(duì)這些接口有著特定的實(shí)現(xiàn)。 實(shí)驗(yàn)以CELL處理器和龍芯眾核處理器Godson_T為平臺(tái),選取數(shù)字媒體領(lǐng)域常用的算法作為測(cè)試程序,從不同方面對(duì)SVM的性能進(jìn)行測(cè)試與評(píng)估。實(shí)驗(yàn)結(jié)果表明,SVM具有較好的擴(kuò)展性,在具有不同系統(tǒng)配置的多核處理器上達(dá)到了接近線性的加速比,并保持了較高的負(fù)載均衡率和較低的通信開銷。
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類號(hào)】:TP333.1
【圖文】:
大部分抽象機(jī)只描述了單個(gè)處理器外加一些寄存器,棧和內(nèi)存[38],k 編程需要支持真正的并發(fā)操作以實(shí)現(xiàn)計(jì)算和內(nèi)存操作的重疊。因此,S多個(gè)線程,這些線程之間還會(huì)進(jìn)行交互。3.2是SVM抽象機(jī)模型體系結(jié)構(gòu)圖。SVM抽象機(jī)由一個(gè)控制處理核(ConC)和若干個(gè)從處理核(Slave Core, SC),外加一個(gè)片外存儲(chǔ)器(Off-)組成。SC 由 DMA 引擎、本地流存儲(chǔ)器(片上存儲(chǔ)器)、本地寄存器(L, LR)和流執(zhí)行單元(Stream Excution Unit, SEU)組成。
CAMDDS)。由編譯器輔助產(chǎn)生附加代碼供運(yùn)行時(shí)系統(tǒng)生成計(jì)算任找任務(wù)間的依賴關(guān)系建立數(shù)據(jù)流圖(Data Flow Graph, DFG);任務(wù)調(diào)度器G,將可運(yùn)行的任務(wù)以消息的形式分發(fā)給各個(gè)處理核;各個(gè)處理核處理完任務(wù)狀態(tài)和流參數(shù)的位置等信息反饋給調(diào)度器;調(diào)度器依據(jù)這些反饋信息對(duì)解依賴,對(duì)后續(xù)節(jié)點(diǎn)任務(wù)進(jìn)行調(diào)度。CAMDDS 實(shí)現(xiàn)了任務(wù)的優(yōu)化執(zhí)行,使并行化調(diào)度,減緩了存儲(chǔ)器和網(wǎng)絡(luò)帶寬壓力。.1 CAMDDS 調(diào)度模型CAMDDS 調(diào)度模型不同于以往的純靜態(tài)或純動(dòng)態(tài)調(diào)度模型,它首先利用靜生的任務(wù)信息,在運(yùn)行時(shí)建立 DFG,然后啟動(dòng)任務(wù)調(diào)度器分析 DFG,動(dòng)態(tài)映射到處理核上。調(diào)度方式采用集中式調(diào)度:控制核 CC 負(fù)責(zé)任務(wù)調(diào)度,多SCs 負(fù)責(zé)數(shù)據(jù)處理,核間采用消息進(jìn)行通信。圖 3.3 給出了 CAMDDS 調(diào)度模過程示意圖。
4 流程序虛擬機(jī)在 CELL 處理器上的實(shí)現(xiàn)CELL 處理器是為實(shí)現(xiàn)高性能計(jì)算而設(shè)計(jì)的一款異構(gòu)多核處理器,其強(qiáng)大的計(jì)算能力和高片上存儲(chǔ)帶寬為流應(yīng)用的執(zhí)行提供了大量的并行資源。第三章設(shè)計(jì)了 SVMAPI,并給出了主核和從核上的運(yùn)行時(shí)算法,本章將針對(duì) CELL 處理器架構(gòu),對(duì) SVMAPI 在 PPE 端和 SPE 端的運(yùn)行時(shí)實(shí)現(xiàn)進(jìn)行詳細(xì)描述,并利用多媒體領(lǐng)域常用的算法作為測(cè)試程序?qū)Υ?SVM 實(shí)現(xiàn)進(jìn)行評(píng)估。4.1 CELL 體系結(jié)構(gòu)4.1.1 CELL BE 總體介紹
本文編號(hào):2752536
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類號(hào)】:TP333.1
【圖文】:
大部分抽象機(jī)只描述了單個(gè)處理器外加一些寄存器,棧和內(nèi)存[38],k 編程需要支持真正的并發(fā)操作以實(shí)現(xiàn)計(jì)算和內(nèi)存操作的重疊。因此,S多個(gè)線程,這些線程之間還會(huì)進(jìn)行交互。3.2是SVM抽象機(jī)模型體系結(jié)構(gòu)圖。SVM抽象機(jī)由一個(gè)控制處理核(ConC)和若干個(gè)從處理核(Slave Core, SC),外加一個(gè)片外存儲(chǔ)器(Off-)組成。SC 由 DMA 引擎、本地流存儲(chǔ)器(片上存儲(chǔ)器)、本地寄存器(L, LR)和流執(zhí)行單元(Stream Excution Unit, SEU)組成。
CAMDDS)。由編譯器輔助產(chǎn)生附加代碼供運(yùn)行時(shí)系統(tǒng)生成計(jì)算任找任務(wù)間的依賴關(guān)系建立數(shù)據(jù)流圖(Data Flow Graph, DFG);任務(wù)調(diào)度器G,將可運(yùn)行的任務(wù)以消息的形式分發(fā)給各個(gè)處理核;各個(gè)處理核處理完任務(wù)狀態(tài)和流參數(shù)的位置等信息反饋給調(diào)度器;調(diào)度器依據(jù)這些反饋信息對(duì)解依賴,對(duì)后續(xù)節(jié)點(diǎn)任務(wù)進(jìn)行調(diào)度。CAMDDS 實(shí)現(xiàn)了任務(wù)的優(yōu)化執(zhí)行,使并行化調(diào)度,減緩了存儲(chǔ)器和網(wǎng)絡(luò)帶寬壓力。.1 CAMDDS 調(diào)度模型CAMDDS 調(diào)度模型不同于以往的純靜態(tài)或純動(dòng)態(tài)調(diào)度模型,它首先利用靜生的任務(wù)信息,在運(yùn)行時(shí)建立 DFG,然后啟動(dòng)任務(wù)調(diào)度器分析 DFG,動(dòng)態(tài)映射到處理核上。調(diào)度方式采用集中式調(diào)度:控制核 CC 負(fù)責(zé)任務(wù)調(diào)度,多SCs 負(fù)責(zé)數(shù)據(jù)處理,核間采用消息進(jìn)行通信。圖 3.3 給出了 CAMDDS 調(diào)度模過程示意圖。
4 流程序虛擬機(jī)在 CELL 處理器上的實(shí)現(xiàn)CELL 處理器是為實(shí)現(xiàn)高性能計(jì)算而設(shè)計(jì)的一款異構(gòu)多核處理器,其強(qiáng)大的計(jì)算能力和高片上存儲(chǔ)帶寬為流應(yīng)用的執(zhí)行提供了大量的并行資源。第三章設(shè)計(jì)了 SVMAPI,并給出了主核和從核上的運(yùn)行時(shí)算法,本章將針對(duì) CELL 處理器架構(gòu),對(duì) SVMAPI 在 PPE 端和 SPE 端的運(yùn)行時(shí)實(shí)現(xiàn)進(jìn)行詳細(xì)描述,并利用多媒體領(lǐng)域常用的算法作為測(cè)試程序?qū)Υ?SVM 實(shí)現(xiàn)進(jìn)行評(píng)估。4.1 CELL 體系結(jié)構(gòu)4.1.1 CELL BE 總體介紹
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 文梅;李海燕;伍楠;張春元;李禮;;流體系結(jié)構(gòu)抽象模型研究[J];計(jì)算機(jī)工程與科學(xué);2006年07期
2 林偉;葉笑春;宋風(fēng)龍;張浩;;眾核處理器中使用寫掩碼實(shí)現(xiàn)混合寫回/寫穿透策略[J];計(jì)算機(jī)學(xué)報(bào);2008年11期
3 龍國(guó)平;張軍超;范東睿;;眾核體系結(jié)構(gòu)對(duì)Cilk語言的硬件支持及評(píng)測(cè)研究[J];計(jì)算機(jī)學(xué)報(bào);2008年11期
4 宋風(fēng)龍;劉志勇;范東睿;張軍超;余磊;;一種片上眾核結(jié)構(gòu)共享Cache動(dòng)態(tài)隱式隔離機(jī)制研究[J];計(jì)算機(jī)學(xué)報(bào);2009年10期
本文編號(hào):2752536
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2752536.html
最近更新
教材專著