面向粗粒度可重構(gòu)處理器REmusII的任務(wù)編譯器后端設(shè)計(jì)
發(fā)布時(shí)間:2021-03-09 20:10
REmusII系統(tǒng)是“十一五”863計(jì)劃重點(diǎn)項(xiàng)目“嵌入式可重構(gòu)移動(dòng)媒體處理核心技術(shù)”設(shè)計(jì)的粗顆粒度可重構(gòu)處理器。本文設(shè)計(jì)出REmusII系統(tǒng)的編譯器的后端,編譯器后端將數(shù)據(jù)流圖(DFG)映射到REmusII的可重構(gòu)陣列上,并生成REmusII可識(shí)別的配置字文件。整個(gè)過程涉及到包含數(shù)據(jù)傳輸方式、數(shù)據(jù)存儲(chǔ)方式、時(shí)域劃分、任務(wù)調(diào)度等策略的整個(gè)編譯器后端流程的設(shè)計(jì),流程的代碼實(shí)現(xiàn)和硬件可識(shí)別配置字生成的實(shí)現(xiàn)。同時(shí)根據(jù)硬件的數(shù)據(jù)2D存取方式,對(duì)可重構(gòu)陣列內(nèi)部和外部存儲(chǔ)器分別進(jìn)行了內(nèi)存分區(qū)調(diào)度管理,提高了數(shù)據(jù)存取的效率。本文給出了編譯器后端的執(zhí)行過程和結(jié)果,以DCT32為例介紹了編譯器后端處理單個(gè)DFG的過程,并通過對(duì)akiyoqcif,containerqcif,suzieqcif三個(gè)測(cè)試視頻(qcif,175x144)碼流的測(cè)試,證明了編譯器后端功能的正確性,符合項(xiàng)目的要求。為了進(jìn)一步提高性能,本文在DFG映射過程中的時(shí)域劃分部分引入了微粒群優(yōu)化算法(PSO),并同時(shí)考慮到劃分塊數(shù)、通信量和資源利用率三個(gè)主...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:99 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
可重構(gòu)系統(tǒng)通用編譯流程
11圖 2-3 REmusII 系統(tǒng)組成圖Fig. 2-3 Components of REmusII2.2 數(shù)據(jù)傳輸和存儲(chǔ)模式2.2.1 RCA External Data Transfer(REDT)REDT 將來自片外 SSRAM 的外部數(shù)據(jù)導(dǎo)入至 RPU 中的 4 個(gè) 8x8 RCA 的指定數(shù)據(jù)目標(biāo),或?qū)碜訰PU的4個(gè)8x8RCA的指令數(shù)據(jù)源的數(shù)據(jù)導(dǎo)出為片外SSRAM的外部數(shù)據(jù),該模塊由 REDA、REDL 和 REDS 三個(gè)部分構(gòu)成:REDL 通過訪問EMI 讀取片外 SSRAM 中的數(shù)據(jù)寫至 RPU 內(nèi)某個(gè) 8x8 RCA 中的 ELDF;REDS 通過訪問 EMI 讀取 RPU 內(nèi)某個(gè) 8x8 RCA 中的 ESDF 中的數(shù)據(jù)寫至片外 SSRAM;REDA 仲裁 REDL 和 REDS 的 EMI 訪問請(qǐng)求,優(yōu)先完成 REDS。
圖 2-4 8x8 RCA 結(jié)構(gòu)圖Fig.2-4 8x8 RCA Architecture構(gòu)圖如圖 2-4 所示,RCA 每行之間的節(jié)點(diǎn)只能和ut FIFO 和 Output FIFO 可以連接到 RCA 上的任,一次配置,多次循環(huán)計(jì)算。64 個(gè)計(jì)算陣列可以行流程配置字(Context)的可重構(gòu)硬件架構(gòu),它的分RPU 采用了三層的配置機(jī)制:CL0 層、CL1 層息構(gòu)成,具體的介紹如下:的配置信息,稱為 Core Context,用于配置 8x8點(diǎn)的輸入、輸出和操作符,是對(duì)整個(gè) RCA 陣列l(wèi)obal Context Group Memory)用于存儲(chǔ) CL2 層次為 256bit,深度為 512,總大小為 16KB 的單端口
【參考文獻(xiàn)】:
期刊論文
[1]嵌入式粗顆粒度可重構(gòu)處理器的軟硬件協(xié)同設(shè)計(jì)流程[J]. 于蘇東,劉雷波,尹首一,魏少軍. 電子學(xué)報(bào). 2009(05)
[2]基于模板的SoC結(jié)構(gòu)自動(dòng)劃分方法[J]. 韓睦華,劉雷波,魏少軍. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2009(05)
[3]可重構(gòu)系統(tǒng)中的實(shí)時(shí)任務(wù)在線調(diào)度與放置算法[J]. 周學(xué)功,梁樑,黃勛章,彭澄廉. 計(jì)算機(jī)學(xué)報(bào). 2007(11)
[4]動(dòng)態(tài)可重構(gòu)系統(tǒng)任務(wù)時(shí)域劃分算法[J]. 潘雪增,孫康,陸魁軍,王繼民,平玲娣. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2007(11)
[5]基于排序優(yōu)化的微粒群算法[J]. 祝成虎,彭宏. 計(jì)算機(jī)工程與設(shè)計(jì). 2006(21)
[6]基于簇的層次敏感的可重構(gòu)系統(tǒng)任務(wù)劃分算法[J]. 周博,邱衛(wèi)東,諶勇輝,彭澄廉. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2006(05)
本文編號(hào):3073405
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:99 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
可重構(gòu)系統(tǒng)通用編譯流程
11圖 2-3 REmusII 系統(tǒng)組成圖Fig. 2-3 Components of REmusII2.2 數(shù)據(jù)傳輸和存儲(chǔ)模式2.2.1 RCA External Data Transfer(REDT)REDT 將來自片外 SSRAM 的外部數(shù)據(jù)導(dǎo)入至 RPU 中的 4 個(gè) 8x8 RCA 的指定數(shù)據(jù)目標(biāo),或?qū)碜訰PU的4個(gè)8x8RCA的指令數(shù)據(jù)源的數(shù)據(jù)導(dǎo)出為片外SSRAM的外部數(shù)據(jù),該模塊由 REDA、REDL 和 REDS 三個(gè)部分構(gòu)成:REDL 通過訪問EMI 讀取片外 SSRAM 中的數(shù)據(jù)寫至 RPU 內(nèi)某個(gè) 8x8 RCA 中的 ELDF;REDS 通過訪問 EMI 讀取 RPU 內(nèi)某個(gè) 8x8 RCA 中的 ESDF 中的數(shù)據(jù)寫至片外 SSRAM;REDA 仲裁 REDL 和 REDS 的 EMI 訪問請(qǐng)求,優(yōu)先完成 REDS。
圖 2-4 8x8 RCA 結(jié)構(gòu)圖Fig.2-4 8x8 RCA Architecture構(gòu)圖如圖 2-4 所示,RCA 每行之間的節(jié)點(diǎn)只能和ut FIFO 和 Output FIFO 可以連接到 RCA 上的任,一次配置,多次循環(huán)計(jì)算。64 個(gè)計(jì)算陣列可以行流程配置字(Context)的可重構(gòu)硬件架構(gòu),它的分RPU 采用了三層的配置機(jī)制:CL0 層、CL1 層息構(gòu)成,具體的介紹如下:的配置信息,稱為 Core Context,用于配置 8x8點(diǎn)的輸入、輸出和操作符,是對(duì)整個(gè) RCA 陣列l(wèi)obal Context Group Memory)用于存儲(chǔ) CL2 層次為 256bit,深度為 512,總大小為 16KB 的單端口
【參考文獻(xiàn)】:
期刊論文
[1]嵌入式粗顆粒度可重構(gòu)處理器的軟硬件協(xié)同設(shè)計(jì)流程[J]. 于蘇東,劉雷波,尹首一,魏少軍. 電子學(xué)報(bào). 2009(05)
[2]基于模板的SoC結(jié)構(gòu)自動(dòng)劃分方法[J]. 韓睦華,劉雷波,魏少軍. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2009(05)
[3]可重構(gòu)系統(tǒng)中的實(shí)時(shí)任務(wù)在線調(diào)度與放置算法[J]. 周學(xué)功,梁樑,黃勛章,彭澄廉. 計(jì)算機(jī)學(xué)報(bào). 2007(11)
[4]動(dòng)態(tài)可重構(gòu)系統(tǒng)任務(wù)時(shí)域劃分算法[J]. 潘雪增,孫康,陸魁軍,王繼民,平玲娣. 浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2007(11)
[5]基于排序優(yōu)化的微粒群算法[J]. 祝成虎,彭宏. 計(jì)算機(jī)工程與設(shè)計(jì). 2006(21)
[6]基于簇的層次敏感的可重構(gòu)系統(tǒng)任務(wù)劃分算法[J]. 周博,邱衛(wèi)東,諶勇輝,彭澄廉. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2006(05)
本文編號(hào):3073405
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3073405.html
最近更新
教材專著