高性能DSP的二級高速緩存設(shè)計與實現(xiàn)

發(fā)布時間：2020-06-20 03:03

【摘要】：數(shù)字信號處理器(Digital Signal Processor,DSP)專門用于數(shù)字信號處理,已在通信、軍事、家電等各個領(lǐng)域得到了廣泛的應(yīng)用。隨著集成電路的發(fā)展,微處理器的運算速度迅速提高,而相對于微處理器而言,存儲器存取速度的改善較慢,二者之間的速度差異越來越大,導致了瓶頸問題的產(chǎn)生,嚴重影響系統(tǒng)整體性能。在微處理器和和主存之間加入一個容量小但速度快的高速緩存(cache)能有效解決此問題。本文的主要研究工作是設(shè)計并實現(xiàn)一款DSP芯片的二級高速緩存。深入分析了G1000的體系結(jié)構(gòu)和片內(nèi)兩級存儲結(jié)構(gòu),研究了現(xiàn)代cache的設(shè)計技術(shù)和相關(guān)理論,完成了L1P、L1D和L2的設(shè)計與實現(xiàn)。其中,L1P設(shè)計為只能被CPU讀訪問的一級程序cache;L1D設(shè)計為二組相聯(lián)映射結(jié)構(gòu),采用LRU替換策略,具有兩組讀寫通路,在寫通路上設(shè)計了Write Buffer單元,當寫miss時,直接寫入Write Buffer,而不用立即寫入L2中,有效提高了cache操作速度;L2設(shè)計為cache與RAM的組合體,結(jié)構(gòu)比較復雜,利用snoop請求來維護L1D、L1P與主存存數(shù)據(jù)一致性。對設(shè)計進行了充分的邏輯驗證,結(jié)果表明設(shè)計可以實現(xiàn)課題要求的各種功能,各個模塊均可正常工作,完成了課題的研究任務(wù)。
【學位授予單位】：西安電子科技大學
【學位級別】：碩士
【學位授予年份】：2011
【分類號】：TP333
【圖文】：

存儲器,訪問速度,內(nèi)部存儲器,處理器

第二章 G1000 的存儲結(jié)構(gòu)從 DSP 應(yīng)用角度來說，一個足夠大且足夠快的片內(nèi)存儲器是最理想的，但是最近幾年處理器的速度不斷提高，CPU 速度比存儲器速度要快很多，雖然高速的存儲器能夠?qū)崿F(xiàn)，但隨著容量的提高，其成本要比低速存儲器昂貴很多�？紤]圖 2.1 左側(cè)所示的存儲器結(jié)構(gòu)，CPU 和內(nèi)部存儲器都是 300MHz，所以訪問存儲器不會產(chǎn)生 stalls（延遲流水線的執(zhí)行），當 CPU 的時鐘增到 600MHz 時，內(nèi)部存儲器只能兩個CPU周期被訪問一次，因此CPU一次訪問會被延遲一個周期對于那些需要每個周期訪問的循環(huán)而言，延遲非常巨大。由于目前存儲器的技術(shù)其速度跟不上處理器的速度，而那些快速的存儲器價格非常昂貴。解決方案只有改變存儲器體系結(jié)構(gòu)，如圖 2.1 右側(cè)所示，一個快速的小容量存儲器緊挨著 CPU，CPU 訪問它沒有 stalls，下一級的存儲器遠離 CPU，其容量較第一級的大，但速度相對較慢。地址從大容量存儲器映射到小容量存儲器。而這小小容量存儲器被稱為 cache，由 cache 控制器自動管理。使用這種結(jié)構(gòu)的存儲器，訪問速度接近于快速的小容量存儲器的訪問速度。

框圖,指令譯碼,功能單元,單元

2.2 G1000 DSP 體系結(jié)構(gòu)總體框圖G1000 由三部分組成：CPU（DSP core）、片內(nèi)存儲系統(tǒng)、片內(nèi) EDMA。而 CP如圖 2.2 所示，包括取指、指令分配、指令譯碼單元，8 個功能單元，一些控制寄存器與中斷寄存器。片內(nèi)存儲系統(tǒng)由二級 cache 組成，包括一級程序存儲單元（L1P）、一級數(shù)據(jù)存儲單元（L1D）與第二級存儲單元（L2）。2.2 二級 cache 結(jié)構(gòu)分析2.2.1 設(shè)置 cache 的理論依據(jù)設(shè)置 cache 的理論[5]依據(jù)是訪問的局部性原理。局部性原理是指處理器存取指令或數(shù)據(jù)的操作在時間、空間和次序上往往都集中在一定的范圍內(nèi)進行。換句話說，大多數(shù)程序在任何時間窗口上，常常在他們地址空間的某一部分活動。產(chǎn)生局部性原理的原因是：1．除了調(diào)用和轉(zhuǎn)移指令（它們只占很小的一部分）以外，程序的執(zhí)行是按順序的從而在大多數(shù)情況下，下一條指令可以在當前指令之后立即取進處理器。

【參考文獻】

相關(guān)期刊論文前7條

1 孫慧,李文宏,章倩苓;一種低功耗的高性能四路組相聯(lián)CMOS高速緩沖存儲器(英文)[J];半導體學報;2004年04期

2 趙學梅,葉以正,李曉明,時銳;一種低功耗高性能的滑動Cache方案[J];計算機研究與發(fā)展;2004年11期

3 周學海;余潔;李曦;王志剛;;基于指令行為的Cache可靠性評估研究[J];計算機研究與發(fā)展;2007年04期

4 楊文華,羅曉沛;專用集成電路的設(shè)計驗證方法及一種實際的通用微處理器設(shè)計的多級驗證體系[J];計算機研究與發(fā)展;1999年06期

5 彭軍;楊樂;稂嬋新;盛立琨;;基于總線偵聽Cache一致性協(xié)議算法與實現(xiàn)[J];計算機與現(xiàn)代化;2007年10期

6 劉洪波;龍娟;郝曉莉;沈緒榜;;異步FIFO狀態(tài)判斷的研究與設(shè)計[J];微電子學與計算機;2007年03期

7 武楊;;高速緩沖存儲器Cache設(shè)計的關(guān)鍵技術(shù)分析[J];中國科技信息;2006年07期

相關(guān)碩士學位論文前3條

1 程由猛;高性能DSP片內(nèi)二級Cache控制器設(shè)計研究[D];國防科學技術(shù)大學;2003年

2 盧晏安;“銀河飛騰”DSP片內(nèi)存儲系統(tǒng)的優(yōu)化設(shè)計研究[D];國防科學技術(shù)大學;2005年

3 李衛(wèi)偉;32位嵌入式處理器的Cache設(shè)計[D];西北工業(yè)大學;2007年

本文編號：2721763

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2721763.html

上一篇：基于ARM-LINUX的嵌入式點檢儀開發(fā)
下一篇：時域有限元的二維導體微波成像及其圖形處理器（GPU）加速的探索

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

高性能DSP的二級高速緩存設(shè)計與實現(xiàn)