一種面向SIMD擴(kuò)展部件的向量化統(tǒng)一架構(gòu)
【圖文】:
t類型歸約加3convolution二維卷積運(yùn)算4MMM_f32float類型矩陣乘5MMM_f64double類型矩陣乘5.2實(shí)驗(yàn)結(jié)果與分析實(shí)驗(yàn)面向申威1600、華為某DSP和Alpha3種平臺(tái)的SIMD部件進(jìn)行測(cè)試,,主要測(cè)試3種平臺(tái)的向量化加速比,驗(yàn)證向量化工具的有效性,并對(duì)比SIMD部件的加速效果。實(shí)現(xiàn)架構(gòu)為源源變換,對(duì)向量化后的代碼膨脹率進(jìn)行測(cè)試,分析不同的指令集特征對(duì)代碼膨脹率的影響。各平臺(tái)SIMD部件加速比和膨脹率分別如圖4和圖5所示。圖4各平臺(tái)SIMD部件向量化加速比(下轉(zhuǎn)第44頁)·31·
【作者單位】: 信息工程大學(xué);數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室;
【基金】:核高基國(guó)家科技重大專項(xiàng)(2009ZX01036)資助
【分類號(hào)】:TP332
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 季振洲,史捷,方濱興,胡銘曾,曲云波;一種陣列計(jì)算機(jī)輸入輸出系統(tǒng)的設(shè)計(jì)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2000年01期
2 何冬明,楊新志,薛忠杰;基于算法的DSP硬件結(jié)構(gòu)分析[J];電子與封裝;2004年01期
3 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計(jì)研究[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期
4 杜慧敏,張智泉,沈緒榜;一種適用于數(shù)字圖像處理的DSP片上系統(tǒng)[J];微電子學(xué)與計(jì)算機(jī);2004年01期
5 季振洲,周勇林,方濱興,胡銘曾;基于FPGA的ABC95陣列機(jī)PE芯片的設(shè)計(jì)[J];高技術(shù)通訊;2000年06期
6 江志紅,康立功;新一代數(shù)字信號(hào)處理器ADSP21161[J];信息技術(shù);2003年07期
7 曾國(guó)蓀,陸鑫達(dá),周定康;自動(dòng)提取程序異構(gòu)性的框架[J];計(jì)算機(jī)與現(xiàn)代化;1999年04期
8 馬蘭,沈笑云,侯春萍;高速三維實(shí)時(shí)圖象幀緩存設(shè)計(jì)[J];中國(guó)圖象圖形學(xué)報(bào);2000年08期
9 林智華;對(duì)陣列處理機(jī)和多處理機(jī)的深入比較[J];福建金融管理干部學(xué)院學(xué)報(bào);2004年01期
10 錢藝;李占才;李昂;王沁;;一種神經(jīng)網(wǎng)絡(luò)并行處理器的體系結(jié)構(gòu)[J];小型微型計(jì)算機(jī)系統(tǒng);2007年10期
相關(guān)會(huì)議論文 前6條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗(yàn)證[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點(diǎn)乘加器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
3 莊巍;劉衡竹;楊惠;;基數(shù)分離的快速定點(diǎn)SIMD除法器[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
4 周鋒;彭元喜;楊惠;;面向X處理器的SIMD移位器[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
5 張科勛;李勇;郭海勇;;一種半定制與全定制相結(jié)合的SIMD乘法器設(shè)計(jì)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
6 辛乃軍;陳旭燦;孫海燕;陽柳;羅杰;淡孝強(qiáng);王霽;;基于GCC的高性能DSP Matrix向量指令集擴(kuò)展[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
相關(guān)重要報(bào)紙文章 前5條
1 秋葉;“架構(gòu)”的戰(zhàn)爭(zhēng)[N];電腦報(bào);2010年
2 土勻;了解“愛妻”[N];電腦報(bào);2008年
3 秋葉;CUDA普及之路[N];電腦報(bào);2010年
4 ;AMD新武器到來[N];電腦報(bào);2010年
5 大老客;DX11時(shí)代誰能奪標(biāo)[N];電腦報(bào);2010年
相關(guān)博士學(xué)位論文 前7條
1 劉勝;超寬SIMD DSP片上并行數(shù)據(jù)訪存關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
2 黃立波;片上集群體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
3 何義;流體系結(jié)構(gòu)指令管理及系統(tǒng)虛擬化仿真技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
4 葛海通;32位高性能嵌入式CPU及平臺(tái)研發(fā)[D];浙江大學(xué);2009年
5 王淼;面向多核處理器的并行編譯及優(yōu)化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
6 張波濤;片上高性能嵌入式計(jì)算—面向軟基帶的應(yīng)用并行處理模型及體系結(jié)構(gòu)[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
7 吳丹;高效能計(jì)算型存儲(chǔ)器體系結(jié)構(gòu)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];華中科技大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 陳向;SIMD數(shù)據(jù)置換指令的自動(dòng)生成與優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
2 楊明;基于存儲(chǔ)訪問的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
3 李國(guó)強(qiáng);SIMD DSP中的高性能定點(diǎn)算術(shù)運(yùn)算部件的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
4 黃遠(yuǎn)廣;多寬度SIMD結(jié)構(gòu)DSP向量存儲(chǔ)器的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
5 張慶丹;基于GPU的串匹配算法的實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
6 盧捚;基于Cell多核處理器的MPEG-2視頻解碼技術(shù)的研究[D];浙江大學(xué);2008年
7 楊強(qiáng);DSP高性能乘法部件的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年
8 周海亮;基于X流處理器的循環(huán)實(shí)現(xiàn)及優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年
9 黃敬磊;GPU通用計(jì)算中的數(shù)據(jù)結(jié)構(gòu)組織與應(yīng)用研究[D];解放軍信息工程大學(xué);2007年
10 羅飛;“銀河飛騰”DSP乘法部件及算術(shù)邏輯運(yùn)算部件的設(shè)計(jì)[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年
本文編號(hào):2533178
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2533178.html