多線程環(huán)境下寄存器文件的設(shè)計(jì)與優(yōu)化
發(fā)布時(shí)間:2020-03-20 12:13
【摘要】: 如何挖掘處理器的并行性一直是處理器設(shè)計(jì)者努力的重要方向。傳統(tǒng)RISC處理器體系結(jié)構(gòu)和編譯優(yōu)化技術(shù)主要專注于開發(fā)程序執(zhí)行中的指令級并行性,通過在一個(gè)時(shí)鐘周期內(nèi)發(fā)射多個(gè)操作來提高處理器的IPC。但是,單個(gè)程序的有限指令級并行性決定了多發(fā)射處理器的資源利用率不高。因此,多線程技術(shù)應(yīng)運(yùn)而生。 多線程技術(shù)通過多個(gè)線程共享功能單元,開發(fā)線程級并行來提高處理器資源利用率。多線程處理器通過執(zhí)行來自不同線程的指令流,使得單個(gè)線程中的長延遲操作得到很好的隱藏,使處理器的性能得到顯著提高。然而,多線程并行執(zhí)行也對寄存器文件提出了很大的挑戰(zhàn)。 作為處理器的重要組成部件,寄存器文件的有效設(shè)計(jì)對于提高微處理器的性能具有舉足輕重的作用。寄存器文件也稱寄存器堆,其作用就像一個(gè)小的快速的緩沖器,用于微處理器存放操作數(shù)和運(yùn)算的中間結(jié)果。在計(jì)算機(jī)系統(tǒng)的整個(gè)存儲(chǔ)層次體系中,寄存器文件位于最頂層,離CPU運(yùn)算部件距離最近,訪問速度最快。 本文設(shè)計(jì)了一款支持多線程的高性能通用寄存器文件,它有3個(gè)讀端口和2個(gè)寫端口,支持4線程并行。我們首先研究了多線程體系結(jié)構(gòu)的特點(diǎn)以及寄存器文件的功能和結(jié)構(gòu),分析了過程調(diào)用與寄存器窗口的關(guān)系。然后針對多線程環(huán)境的特點(diǎn),我們對寄存器文件的結(jié)構(gòu)、功能和實(shí)現(xiàn)進(jìn)行了研究和設(shè)計(jì)。在設(shè)計(jì)中綜合應(yīng)用了寄存器劃分、重疊寄存器窗口、層次擴(kuò)展等技術(shù),構(gòu)造了“兩級寄存器窗口”結(jié)構(gòu)。從實(shí)現(xiàn)的角度,我們還研究了兩級寄存器文件的數(shù)據(jù)一致性管理策略,給出了寄存器文件的端口描述和時(shí)序設(shè)計(jì),并對設(shè)計(jì)進(jìn)行了驗(yàn)證。另外,我們對窗口異常處理和控制進(jìn)行了詳細(xì)設(shè)計(jì)。最后,我們對Active寄存器文件進(jìn)行電路設(shè)計(jì),并給出了面積分析。 通過采用合理的組織結(jié)構(gòu)以及有效管理策略,我們設(shè)計(jì)的寄存器文件具有很好的性能,滿足了四個(gè)線程并行執(zhí)行的需要,達(dá)到了預(yù)期的設(shè)計(jì)目標(biāo)。
【圖文】:
Odd/Even窗口關(guān)系
圖 4.7 寄存器文件功能驗(yàn)證時(shí)序圖 4.7 是我們從設(shè)計(jì)驗(yàn)證的截得得一段波形。圖中可以看出以下幾個(gè)操作:對端口 0 的寫:當(dāng)寫端口 0 的寫使能 a_wr_en_p0 和寫地址 a_wr_addr_p0(4’b0001)在 clk 的下降沿之前準(zhǔn)備好后,數(shù)據(jù)在下降沿后存儲(chǔ)在單元active_window[1]中。當(dāng)讀端口 0 讀使能 a_rd_en 和 ard_addr_p0(4’b0001)在下降沿之前準(zhǔn)備好之后,數(shù)據(jù)在下降沿之后讀出,如 a_rd_data_p0 所示。系統(tǒng)在執(zhí)行g(shù)lobal save 操作時(shí),即 a_save_global_en 為 1 時(shí),時(shí)序變化如 intrinsic_globals[8]所示,是將 active_window 中的 global 數(shù)據(jù),保存到 Intrinsic 中的 global 中。系統(tǒng)在執(zhí)行 global restore 操作時(shí),即 a_restore_global_en 為 1 時(shí),時(shí)序變化如active_window[0]所示,是將 global 中的數(shù)據(jù)恢復(fù)到 active_window 中。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2008
【分類號】:TP332
本文編號:2591762
【圖文】:
Odd/Even窗口關(guān)系
圖 4.7 寄存器文件功能驗(yàn)證時(shí)序圖 4.7 是我們從設(shè)計(jì)驗(yàn)證的截得得一段波形。圖中可以看出以下幾個(gè)操作:對端口 0 的寫:當(dāng)寫端口 0 的寫使能 a_wr_en_p0 和寫地址 a_wr_addr_p0(4’b0001)在 clk 的下降沿之前準(zhǔn)備好后,數(shù)據(jù)在下降沿后存儲(chǔ)在單元active_window[1]中。當(dāng)讀端口 0 讀使能 a_rd_en 和 ard_addr_p0(4’b0001)在下降沿之前準(zhǔn)備好之后,數(shù)據(jù)在下降沿之后讀出,如 a_rd_data_p0 所示。系統(tǒng)在執(zhí)行g(shù)lobal save 操作時(shí),即 a_save_global_en 為 1 時(shí),時(shí)序變化如 intrinsic_globals[8]所示,是將 active_window 中的 global 數(shù)據(jù),保存到 Intrinsic 中的 global 中。系統(tǒng)在執(zhí)行 global restore 操作時(shí),即 a_restore_global_en 為 1 時(shí),時(shí)序變化如active_window[0]所示,是將 global 中的數(shù)據(jù)恢復(fù)到 active_window 中。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2008
【分類號】:TP332
【引證文獻(xiàn)】
相關(guān)期刊論文 前1條
1 陳勇;曹玉保;王林強(qiáng);;基于寄存器窗口互相重疊的多核間數(shù)據(jù)交換方法[J];中國集成電路;2012年08期
,本文編號:2591762
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2591762.html
最近更新
教材專著