天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

超寬SIMD DSP片上并行數(shù)據(jù)訪存關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2018-08-17 18:31
【摘要】:隨著嵌入式應(yīng)用的不斷發(fā)展以及芯片設(shè)計(jì)技術(shù)的不斷進(jìn)步,以單指令流多數(shù)據(jù)流(Single Instruction stream Multiple Data streams,SIMD)技術(shù)為主體且融合其它技術(shù)的嵌入式體系結(jié)構(gòu),能夠以較低的硬件開銷充分開發(fā)應(yīng)用程序的并行性,已經(jīng)成為DSP體系結(jié)構(gòu)技術(shù)發(fā)展的主流。當(dāng)前,采用SIMD技術(shù)的DSP的數(shù)據(jù)通路寬度已經(jīng)逐漸由傳統(tǒng)的4或8向32或64發(fā)展。這在給系統(tǒng)帶來(lái)高效能的同時(shí),也使系統(tǒng)面臨著數(shù)據(jù)帶寬供給能力不足、存儲(chǔ)沖突過(guò)多、數(shù)據(jù)混洗開銷過(guò)大等諸多問(wèn)題。因而,研究超寬SIMD DSP高效的存儲(chǔ)機(jī)制具有重要意義。 并行存儲(chǔ)技術(shù)是實(shí)現(xiàn)超寬SIMD DSP高效存儲(chǔ)機(jī)制的有效途徑。本文針對(duì)超寬SIMD DSP片上并行數(shù)據(jù)訪存的關(guān)鍵技術(shù)進(jìn)行研究,主要從片上并行存儲(chǔ)系統(tǒng)的高效低開銷設(shè)計(jì)、系統(tǒng)集成、沖突減少機(jī)制以及混洗單元的高效設(shè)計(jì)等方面展開工作。本文的主要內(nèi)容與創(chuàng)新點(diǎn)體現(xiàn)在以下幾個(gè)方面: 1).提出了一種模塊數(shù)匹配的雙線性偏斜2D存儲(chǔ)機(jī)制。該機(jī)制所需要的存儲(chǔ)模塊數(shù)目和SIMD的寬度相同,并且每個(gè)存儲(chǔ)模塊的寬度加倍深度減半。雙線性偏斜的映射函數(shù)保證了它能夠同時(shí)支持無(wú)沖突的行、列、塊等訪問(wèn)模式,可以在水平和垂直方向上支持循環(huán)尋址。和傳統(tǒng)的方案相比,該機(jī)制能夠有效地減少片上并行存儲(chǔ)技術(shù)的面積開銷,并且其控制邏輯較為簡(jiǎn)單,關(guān)鍵路徑延時(shí)合理。 2).提出了一種基于相鄰訪存數(shù)據(jù)重用的低功耗2D存儲(chǔ)機(jī)制。該機(jī)制根據(jù)滑窗類應(yīng)用在2D存儲(chǔ)器中的訪存特點(diǎn),設(shè)計(jì)了相鄰地址判斷器對(duì)連續(xù)的2D訪存請(qǐng)求進(jìn)行相關(guān)性判斷并生成體控掩碼,從而關(guān)閉部分存儲(chǔ)體的偏移地址生成電路及片選信號(hào)。該機(jī)制能夠在引入較小的硬件開銷的情況下,顯著地降低2D存儲(chǔ)器的功耗開銷,并且不影響存儲(chǔ)系統(tǒng)的性能。 3).提出了一種面向應(yīng)用領(lǐng)域的多態(tài)并行存儲(chǔ)方案。該方案通過(guò)采用1D/2D可配置的并行存儲(chǔ)機(jī)制,存儲(chǔ)器 寄存器兩級(jí)協(xié)同方案以及配套的訪存指令來(lái)解決應(yīng)用領(lǐng)域中的不規(guī)則訪存問(wèn)題。在性能和開銷之間進(jìn)行了合理地折衷,從而為高性能通用DSP提供了統(tǒng)一的并行存儲(chǔ)框架。該方案的硬件開銷適中,能夠有效地壓縮應(yīng)用程序的代碼尺寸,并且能夠使應(yīng)用程序獲得較好的性能加速。 4).提出了一種向量DMA Cache技術(shù)。該技術(shù)將傳統(tǒng)的CPU Cache技術(shù)遷移到DMA和VM的接口中,將多個(gè)分離的DMA請(qǐng)求合并為Cache的行請(qǐng)求去訪問(wèn)VM,從而有效地減少了DMA訪問(wèn)VM的次數(shù)和VM的沖突次數(shù)。向量DMACache技術(shù)能夠有效地緩解并行存儲(chǔ)器的競(jìng)爭(zhēng)問(wèn)題,提高應(yīng)用程序的執(zhí)行效率,并且其作用隨著SIMD寬度的增加而愈發(fā)有效。 5).設(shè)計(jì)了一種具有高效混洗模式存儲(chǔ)器的可編程混洗單元,并提出了混洗矩陣的奇偶劃分方法?删幊袒煜磫卧ㄟ^(guò)使用高效的混洗模式存儲(chǔ)器及對(duì)應(yīng)的指令,使程序員能夠提前加載所需要的混洗模式。應(yīng)用程序在執(zhí)行時(shí),混洗指令能夠和通用寄存器或訪存帶寬等系統(tǒng)的關(guān)鍵資源分離,從而提高執(zhí)行效率;煜淳仃嚨钠媾紕澐址椒ň哂袛(shù)據(jù)選擇跨度值較小、循環(huán)移位穩(wěn)定性等特征,在解決超寬SIMD DSP中小粒度混洗數(shù)據(jù)進(jìn)出Crossbar方面存在優(yōu)勢(shì)。 本文提出的方法和技術(shù)絕大部分已經(jīng)或即將在FT-Matrix系列DSP中得到實(shí)現(xiàn)和應(yīng)用,,能夠?yàn)楦咝阅蹹SP的設(shè)計(jì)提供較好的技術(shù)儲(chǔ)備或借鑒思路。
[Abstract]:......
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP333

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 高德遠(yuǎn);田杭沛;朱怡安;;軟件無(wú)線電的可重構(gòu)流處理器體系結(jié)構(gòu)[J];航空學(xué)報(bào);2008年06期

2 陳書明;汪東;陳小文;萬(wàn)江華;;一種面向多核DSP的小容量緊耦合快速共享數(shù)據(jù)池[J];計(jì)算機(jī)學(xué)報(bào);2008年10期



本文編號(hào):2188521

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2188521.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶086a5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com