領(lǐng)域內(nèi)可重構(gòu)功能單元自動生成技術(shù)研究
發(fā)布時間:2020-04-29 19:37
【摘要】: 專用指令集處理器(Application Specific Instruction-set Processor, ASIP)能夠兼具目標(biāo)應(yīng)用領(lǐng)域內(nèi)的靈活性與高效性。如何快速高效的實現(xiàn)ASIP已經(jīng)成為數(shù)字信號處理器設(shè)計的熱點問題。通過耦合特殊功能單元能夠有效提高ASIP的效率,然而由于其專用性,能夠加速的應(yīng)用有限。將可重構(gòu)計算技術(shù)引入ASIP設(shè)計中能夠幫助克服特殊功能單元靈活性需求的問題,目前常用的方法是耦合細粒度可重構(gòu)功能單元,此方法能夠在容量允許的前提下實現(xiàn)任何功能,但其通用性帶來了較高的設(shè)計代價。 領(lǐng)域內(nèi)可重構(gòu)功能單元介于上述兩者之間,能夠較好的實現(xiàn)靈活性與效率的折衷。出于設(shè)計效率和可靠性方面的考慮,本課題提出領(lǐng)域內(nèi)可重構(gòu)功能單元(Domain-specific Reconfigurable Function Units, DSRFU)自動生成方法,該方法有如下特點:①可在不修改軟件代碼前提下提高程序執(zhí)行效率;②自動生成的基本功能單元(Basic Function Unit, BFU)性能良好,其自動生成程序可直接供其他程序調(diào)用;③基于靈活的傳輸觸發(fā)體系結(jié)構(gòu)(Transport Triggered Architecture, TTA)和DSRFU內(nèi)部BFU間的可重構(gòu)互連,可以保證足夠的靈活性和程序適應(yīng)能力。該方法在密碼領(lǐng)域內(nèi)三類算法(即公鑰算法、對稱密碼算法和安全Hash函數(shù))中的應(yīng)用表明,可正確有效生成領(lǐng)域內(nèi)可重構(gòu)功能單元,并可獲得56.3%~93.4%的性能提升。
【圖文】:
從而增加處理器的擴展性。圖 2.1 典型 VLIW 結(jié)構(gòu)的數(shù)據(jù)路徑以及連接模式圖2.1.2 降低 VLIW 結(jié)構(gòu)復(fù)雜度2.1.2.1 減少寄存器端口數(shù)目假設(shè) VLIW 共享寄存器文件(Register File, RF),每個功能單元有兩個輸入一個輸出,那么在擁有 K 個功能單元的 VLIW 結(jié)構(gòu)中,RF 需要 3K 個端口,其中 2K個讀端口、1K 個寫端口。在 VLIW 中這些端口是必須的,因為在最壞情況下 FU需要同時從 RF 中讀出兩個源操作數(shù)并輸出結(jié)果到 RF。而實際上這個數(shù)量是可以減少的,因為:1) 操作數(shù)較少:不是所有的運算都需要從 RF 中讀取兩個操作數(shù),如立即數(shù)操作,load/store,跳轉(zhuǎn),函數(shù)調(diào)用。2) 無結(jié)果輸出:不是所有的運算都需要將結(jié)果輸出到 RF 中
國防科技大學(xué)研究生院學(xué)位論文如果這個結(jié)果的值一直在旁路系統(tǒng)中,就沒有必要再從 RF 中讀這個值。6) 共享端口:多個讀操作同時讀 RF 的一個端口,這發(fā)生在多個運算在一個周期內(nèi)讀同一個寄存器的時候。減少寄存器端口前提是可以控制寄存器端口的使用,將 RF 看成是一個有一定數(shù)量讀寫端口的特殊功能單元,稱為寄存器單元(Register Unit, RU)。圖 2.2a 顯示了一個有 2 個 FU、1 個 RU 的 VLIW 數(shù)據(jù)路徑。與圖 2.1a 相比,,旁路寄存器 BP-1、BP-2 以及相應(yīng)的旁路總線消失了。如果寄存器讀寫需要一個整周期,那么寄存器內(nèi)部旁路仍然需要,但是相對容易的多,因為旁路是局部的。經(jīng)旁路的結(jié)果存入RU 完全由程序控制,但是旁路本身是運行時控制的。這種結(jié)構(gòu)(K 個 FU,RU 具有 R 個讀端口和 W 個寫端口)的連通模式圖如圖 2.2b 所示。立即數(shù)總線連接到每個 FU 的每個源操作數(shù)寄存器上。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2006
【分類號】:TP332.2
本文編號:2644923
【圖文】:
從而增加處理器的擴展性。圖 2.1 典型 VLIW 結(jié)構(gòu)的數(shù)據(jù)路徑以及連接模式圖2.1.2 降低 VLIW 結(jié)構(gòu)復(fù)雜度2.1.2.1 減少寄存器端口數(shù)目假設(shè) VLIW 共享寄存器文件(Register File, RF),每個功能單元有兩個輸入一個輸出,那么在擁有 K 個功能單元的 VLIW 結(jié)構(gòu)中,RF 需要 3K 個端口,其中 2K個讀端口、1K 個寫端口。在 VLIW 中這些端口是必須的,因為在最壞情況下 FU需要同時從 RF 中讀出兩個源操作數(shù)并輸出結(jié)果到 RF。而實際上這個數(shù)量是可以減少的,因為:1) 操作數(shù)較少:不是所有的運算都需要從 RF 中讀取兩個操作數(shù),如立即數(shù)操作,load/store,跳轉(zhuǎn),函數(shù)調(diào)用。2) 無結(jié)果輸出:不是所有的運算都需要將結(jié)果輸出到 RF 中
國防科技大學(xué)研究生院學(xué)位論文如果這個結(jié)果的值一直在旁路系統(tǒng)中,就沒有必要再從 RF 中讀這個值。6) 共享端口:多個讀操作同時讀 RF 的一個端口,這發(fā)生在多個運算在一個周期內(nèi)讀同一個寄存器的時候。減少寄存器端口前提是可以控制寄存器端口的使用,將 RF 看成是一個有一定數(shù)量讀寫端口的特殊功能單元,稱為寄存器單元(Register Unit, RU)。圖 2.2a 顯示了一個有 2 個 FU、1 個 RU 的 VLIW 數(shù)據(jù)路徑。與圖 2.1a 相比,,旁路寄存器 BP-1、BP-2 以及相應(yīng)的旁路總線消失了。如果寄存器讀寫需要一個整周期,那么寄存器內(nèi)部旁路仍然需要,但是相對容易的多,因為旁路是局部的。經(jīng)旁路的結(jié)果存入RU 完全由程序控制,但是旁路本身是運行時控制的。這種結(jié)構(gòu)(K 個 FU,RU 具有 R 個讀端口和 W 個寫端口)的連通模式圖如圖 2.2b 所示。立即數(shù)總線連接到每個 FU 的每個源操作數(shù)寄存器上。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2006
【分類號】:TP332.2
【參考文獻】
相關(guān)期刊論文 前2條
1 羅毅輝;李仁發(fā);熊曙初;;一種可重構(gòu)計算系統(tǒng)設(shè)計與實現(xiàn)[J];計算機應(yīng)用研究;2006年01期
2 劉功申,李寧;一種基于有序二叉樹的多模式匹配算法(英文)[J];小型微型計算機系統(tǒng);2004年07期
本文編號:2644923
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2644923.html
最近更新
教材專著