并行向量訪存單元的設(shè)計與優(yōu)化
發(fā)布時間:2017-12-14 11:17
本文關(guān)鍵詞:并行向量訪存單元的設(shè)計與優(yōu)化
更多相關(guān)文章: SIMD 并行向量訪存 訪存沖突 非對齊訪問 FFT
【摘要】:現(xiàn)代通信技術(shù)的迅速發(fā)展和媒體處理信息的爆炸性增長,對數(shù)字信號處理器(DSP)的性能提出了更高的要求。速度和實時性信息處理需求的不斷提高,促使高性能DSP向超寬度SIMD發(fā)展。如何為基于SIMD結(jié)構(gòu)的DSP集成的多路運(yùn)算單元提供高效、高帶寬的訪存數(shù)據(jù)成為其存儲系統(tǒng)設(shè)計面臨的重要問題。本文基于一款16路超寬SIMD結(jié)構(gòu)高性能DSP內(nèi)核Matrix2,設(shè)計實現(xiàn)了高帶寬的并行向量訪存單元(AM),研究了如何在特定應(yīng)用中提高SIMD處理器的訪存性能的方法。本文的主要工作和創(chuàng)新點體現(xiàn)在以下幾個方面:1、基于Matrix2指令集體系結(jié)構(gòu),設(shè)計了一套支持半字(4B)、字(8B)、雙字(16B)等多粒度數(shù)據(jù)訪問的向量訪存指令,其中提出了特殊的用于FFT算法向量加速的專用向量訪存指令。2、支持兩條并行的向量訪存指令操作,每一條指令的數(shù)據(jù)帶寬均高達(dá)256B/拍。雙訪問給SIMD并行運(yùn)算部件提供了充足的數(shù)據(jù)帶寬。3、支持SIMD非對齊訪問。在字訪存粒度和雙字訪存粒度上實現(xiàn)了SIMD非對齊訪問,提高了向量訪存的效率和靈活性。4、支持DMA并行訪問,實現(xiàn)了低沖突率的兩條向量訪存指令和DMA讀寫四路請求的并行訪存。采用特殊的地址高低位交叉存儲體組織方式和優(yōu)先級可配置的仲裁機(jī)制,可顯著減少DMA后臺數(shù)據(jù)傳輸對并行訪存指令操作的打攪,減少了程序?qū)嶋H執(zhí)行時間。5、以較低的硬件代價實現(xiàn)了易于擴(kuò)展的訪存流水線節(jié)拍同步控制器,保證了SIMD結(jié)構(gòu)指令同步執(zhí)行的正確性。6、設(shè)計了Cache結(jié)構(gòu)的DMA傳輸接口,實現(xiàn)了并行向量訪存單元和DMA之間的數(shù)據(jù)傳輸?shù)膸捚ヅ?提高了并行向量訪存單元的帶寬使用效率。最后基于System Verilog的驗證方法搭建模塊級驗證平臺,對設(shè)計的AM進(jìn)行了模塊級功能驗證,提高了驗證效率;并在Matrix2系統(tǒng)級驗證環(huán)境中完成了AM的功能驗證模擬,驗證的代碼覆蓋率達(dá)到了100%。系統(tǒng)級測試結(jié)果表明在不同點數(shù)下,FFT運(yùn)算能獲得1.29到2.26的加速比。同時,基于某廠家40nm工藝庫進(jìn)行邏輯綜合,結(jié)合后端物理設(shè)計進(jìn)行時序優(yōu)化,結(jié)果達(dá)到了性能要求。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP332
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 胡曉燕;;淺談行向量引導(dǎo)的鏈表存儲結(jié)構(gòu)[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年17期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 燕世林;并行向量訪存單元的設(shè)計與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2014年
2 劉敏;面向?qū)ο蟮牟⑿邢蛄繋斓脑O(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2006年
,本文編號:1287694
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1287694.html
最近更新
教材專著