行并行可重構(gòu)單元陣列流水映射性能評估
發(fā)布時間:2019-10-10 14:39
【摘要】:針對粗粒度單元陣列流水映射問題,設(shè)計了三種行流水結(jié)構(gòu)陣列,并分析了其執(zhí)行步驟,提出了一種基于行流水陣列通用的流水映射算法.該算法綜合考慮混合多層迭代啟動間距、塊間流水通信成本、塊配置成本等多個因素,一組測試基準(zhǔn)程序?qū)嶒灲Y(jié)果表明了文中算法的合理性,與多目標(biāo)優(yōu)化映射算法相比,該算法消耗總時延平均節(jié)省了4.0%(可重構(gòu)單元陣列RCA_(4×4))和4.3%(可重構(gòu)單元陣列RCA_(8×8));與滿射映射相比,該算法消耗總時延平均節(jié)省了52.1%(RCA_(4×4))和56.2%(RCA_(8×8)).
【圖文】:
考慮不足.本文研究的兩個條件:①面向行流水RCA,,提出將一條完整指令拆分6個流水段.乘法運(yùn)算設(shè)為2時鐘周期(cycle),其他算術(shù)邏輯運(yùn)算時延設(shè)為1cycle,另外5個流水段執(zhí)行時間均為1cycle.②一塊RCA塊內(nèi)和塊間數(shù)據(jù)傳輸和執(zhí)行按行流水進(jìn)行,配置成本包括RCA全局互連控制、重復(fù)單元(reconfi-gurablecell,RC)邏輯算術(shù)運(yùn)算和路由控制等.2映射流水架構(gòu)和RCA流水執(zhí)行分析2.1映射流水架構(gòu)圖1給出了行并行NCGRCA、RCGRCA、BCGRCA流水架構(gòu).傳統(tǒng)經(jīng)典的CGRA架構(gòu)主要有有Morphosys[8]、REMARC[9](reconfigurablemultimediaarraycoprocessor)、LEAP[10](loopengineonarrayprocessors).相比現(xiàn)有架構(gòu),NCGRCA、BCGRCA、RCGRCA三種結(jié)構(gòu)具有的特點是:①RCA塊內(nèi)和塊間映射成功節(jié)點可按行流水執(zhí)行和配置;②上下行的可重構(gòu)單元點點互連流水傳遞數(shù)據(jù)消除了RCA塊內(nèi)運(yùn)算節(jié)點跨層數(shù)據(jù)傳輸?shù)幕ミB時延;③三種流水架構(gòu)可以實現(xiàn)RCA塊間流水.圖1中,Router表示路由器.aNCGRCAbRCGRCAcBCGRCA圖1三種RCA流水線結(jié)構(gòu)Fig.1ThreeRCApipelinestructures2.2RCA流水執(zhí)行分析定義1RCA重復(fù)使用數(shù)M:一個循環(huán)DFG可以表示為G=(V,E,W,D
第8期陳乃金,等:行并行可重構(gòu)單元陣列流水映射性能評估其值由具體可重構(gòu)計算體系結(jié)構(gòu)決定,本文設(shè)定評估系數(shù)的值為α=β=γ=1.圖2一塊RCA流水執(zhí)行流程Fig.2ARCApipelineexecutionprocess定義6RCA混合多層迭代啟動間距(multi-leveliterationinitiationinterval,MIII):傳統(tǒng)的循環(huán)流水線啟動間距是指相鄰兩個循環(huán)體的啟動時間間隔,本文將其推廣到計算任務(wù)節(jié)點啟動時間間隔,有依賴的運(yùn)算任務(wù)節(jié)點DFG被劃分映射到RCA后,由于RCA的互連方式、面積等多個約束,會導(dǎo)致RCA塊間或塊內(nèi)有的運(yùn)算節(jié)點進(jìn)行有依賴流水運(yùn)行,有的運(yùn)算節(jié)點進(jìn)行無依賴流水運(yùn)行,RCA按段流水執(zhí)行,每個節(jié)點的啟動間距為一個固定值,將其稱為RCA混合多層迭代啟動間距MIII.MIII按映射到RCA塊內(nèi)后,運(yùn)算節(jié)點有無依賴可分為圖3a~3c三種情形.無依賴流水MIII=0;6段RCA流水相鄰行點之間存在依賴或混合依賴,下一行節(jié)點取數(shù)據(jù)段必須在上一行相關(guān)節(jié)點寫回段后執(zhí)行,故MIII=3,RCA按行流水執(zhí)行三種情況如圖3d~3f所示.由圖3可以得出流水段數(shù)為m(本文m=6),每段流水線時間Δt(本文Δt=1cycle),可以得出運(yùn)算節(jié)點執(zhí)行時間相等時,運(yùn)算節(jié)點無依賴Spipeline=(m-1)Δt,運(yùn)算節(jié)點有或混合依賴時Spipeline=2mΔt-2Δt.將其推廣,得到定理1:定理1一塊行可流水執(zhí)行RCAk×b,有m段,n個計算任務(wù)
【作者單位】: 天津大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;安徽工程大學(xué)計算機(jī)與信息學(xué)院;同濟(jì)大學(xué)軟件學(xué)院;上海電力學(xué)院計算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國家“八六三”高技術(shù)研究發(fā)展計劃(2013AA013204) 國家自然科學(xué)基金(61432017,61572036) 安徽省自然科學(xué)基金(1408085MF124) 安徽省高校自然科學(xué)研究基金重點項目(KJ2015A003,KJ2013A001) 安徽省高校優(yōu)秀中青年骨干人才國內(nèi)外訪學(xué)研修重點項目(gxfxZD2016102)
【分類號】:TP301.6
本文編號:2547218
【圖文】:
考慮不足.本文研究的兩個條件:①面向行流水RCA,,提出將一條完整指令拆分6個流水段.乘法運(yùn)算設(shè)為2時鐘周期(cycle),其他算術(shù)邏輯運(yùn)算時延設(shè)為1cycle,另外5個流水段執(zhí)行時間均為1cycle.②一塊RCA塊內(nèi)和塊間數(shù)據(jù)傳輸和執(zhí)行按行流水進(jìn)行,配置成本包括RCA全局互連控制、重復(fù)單元(reconfi-gurablecell,RC)邏輯算術(shù)運(yùn)算和路由控制等.2映射流水架構(gòu)和RCA流水執(zhí)行分析2.1映射流水架構(gòu)圖1給出了行并行NCGRCA、RCGRCA、BCGRCA流水架構(gòu).傳統(tǒng)經(jīng)典的CGRA架構(gòu)主要有有Morphosys[8]、REMARC[9](reconfigurablemultimediaarraycoprocessor)、LEAP[10](loopengineonarrayprocessors).相比現(xiàn)有架構(gòu),NCGRCA、BCGRCA、RCGRCA三種結(jié)構(gòu)具有的特點是:①RCA塊內(nèi)和塊間映射成功節(jié)點可按行流水執(zhí)行和配置;②上下行的可重構(gòu)單元點點互連流水傳遞數(shù)據(jù)消除了RCA塊內(nèi)運(yùn)算節(jié)點跨層數(shù)據(jù)傳輸?shù)幕ミB時延;③三種流水架構(gòu)可以實現(xiàn)RCA塊間流水.圖1中,Router表示路由器.aNCGRCAbRCGRCAcBCGRCA圖1三種RCA流水線結(jié)構(gòu)Fig.1ThreeRCApipelinestructures2.2RCA流水執(zhí)行分析定義1RCA重復(fù)使用數(shù)M:一個循環(huán)DFG可以表示為G=(V,E,W,D
第8期陳乃金,等:行并行可重構(gòu)單元陣列流水映射性能評估其值由具體可重構(gòu)計算體系結(jié)構(gòu)決定,本文設(shè)定評估系數(shù)的值為α=β=γ=1.圖2一塊RCA流水執(zhí)行流程Fig.2ARCApipelineexecutionprocess定義6RCA混合多層迭代啟動間距(multi-leveliterationinitiationinterval,MIII):傳統(tǒng)的循環(huán)流水線啟動間距是指相鄰兩個循環(huán)體的啟動時間間隔,本文將其推廣到計算任務(wù)節(jié)點啟動時間間隔,有依賴的運(yùn)算任務(wù)節(jié)點DFG被劃分映射到RCA后,由于RCA的互連方式、面積等多個約束,會導(dǎo)致RCA塊間或塊內(nèi)有的運(yùn)算節(jié)點進(jìn)行有依賴流水運(yùn)行,有的運(yùn)算節(jié)點進(jìn)行無依賴流水運(yùn)行,RCA按段流水執(zhí)行,每個節(jié)點的啟動間距為一個固定值,將其稱為RCA混合多層迭代啟動間距MIII.MIII按映射到RCA塊內(nèi)后,運(yùn)算節(jié)點有無依賴可分為圖3a~3c三種情形.無依賴流水MIII=0;6段RCA流水相鄰行點之間存在依賴或混合依賴,下一行節(jié)點取數(shù)據(jù)段必須在上一行相關(guān)節(jié)點寫回段后執(zhí)行,故MIII=3,RCA按行流水執(zhí)行三種情況如圖3d~3f所示.由圖3可以得出流水段數(shù)為m(本文m=6),每段流水線時間Δt(本文Δt=1cycle),可以得出運(yùn)算節(jié)點執(zhí)行時間相等時,運(yùn)算節(jié)點無依賴Spipeline=(m-1)Δt,運(yùn)算節(jié)點有或混合依賴時Spipeline=2mΔt-2Δt.將其推廣,得到定理1:定理1一塊行可流水執(zhí)行RCAk×b,有m段,n個計算任務(wù)
【作者單位】: 天津大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;安徽工程大學(xué)計算機(jī)與信息學(xué)院;同濟(jì)大學(xué)軟件學(xué)院;上海電力學(xué)院計算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國家“八六三”高技術(shù)研究發(fā)展計劃(2013AA013204) 國家自然科學(xué)基金(61432017,61572036) 安徽省自然科學(xué)基金(1408085MF124) 安徽省高校自然科學(xué)研究基金重點項目(KJ2015A003,KJ2013A001) 安徽省高校優(yōu)秀中青年骨干人才國內(nèi)外訪學(xué)研修重點項目(gxfxZD2016102)
【分類號】:TP301.6
本文編號:2547218
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2547218.html
最近更新
教材專著