天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

SIMD向量指令的非滿載使用方法研究

發(fā)布時(shí)間:2018-04-15 20:24

  本文選題:大規(guī)模SIMD + 并行; 參考:《計(jì)算機(jī)科學(xué)》2015年07期


【摘要】:大規(guī)模SIMD體系結(jié)構(gòu)提供了更強(qiáng)的向量并行硬件支持,但是,大量迭代次數(shù)不足的循環(huán)由于不能提供足夠的并行性,難以用等價(jià)的向量方式實(shí)現(xiàn)。為了更有效地利用SIMD,提出了一種非滿載地使用SIMD指令的向量化方法。研究了向量寄存器的使用方式,基于非滿載的向量寄存器使用方式實(shí)現(xiàn)了非滿載的向量操作和短循環(huán)的向量化,并將非滿載的向量化方法用于一般循環(huán)的向量化。提供了收益分析方法來(lái)為本向量化方法作精確指導(dǎo)。實(shí)驗(yàn)結(jié)果表明了該方法的有效性,所選測(cè)試用例的目標(biāo)循環(huán)被向量化,平均加速比達(dá)到1.2。
[Abstract]:Large-scale SIMD architecture provides stronger vector parallel hardware support, but the cycle with insufficient number of iterations cannot be implemented in a vector equivalent way because it can not provide enough parallelism.In order to make more efficient use of SIMD, a vectorization method using SIMD instructions is proposed.The use of vector registers is studied. Vector operations with non-full loads and vectorization of short cycles are realized based on the non-full load vector registers, and the non-full load vector quantization method is applied to the vectorization of general cycles.The income analysis method is provided to provide accurate guidance for this vectorization method.The experimental results show that the method is effective and the target cycle of the selected test cases is vectorized with an average speedup of 1.2.
【作者單位】: 信息工程大學(xué)數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863)(2009AA01220) “核高基”重大專項(xiàng)(2009zx10036-001-001)資助
【分類號(hào)】:TP332

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 辛乃軍;陳旭燦;孫海燕;陽(yáng)柳;羅杰;淡孝強(qiáng);王霽;;基于GCC的高性能DSP Matrix向量指令集擴(kuò)展[J];計(jì)算機(jī)工程與科學(xué);2012年01期

相關(guān)博士學(xué)位論文 前1條

1 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年

【共引文獻(xiàn)】

相關(guān)期刊論文 前4條

1 徐穎;李春江;董鈺山;周思齊;;GCC編譯器中編譯指導(dǎo)的自動(dòng)向量化實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2014年S2期

2 徐金龍;趙榮彩;韓林;;分段約束的超字并行向量發(fā)掘路徑優(yōu)化算法[J];計(jì)算機(jī)應(yīng)用;2015年04期

3 高偉;趙榮彩;韓林;龐建民;丁銳;;SIMD自動(dòng)向量化編譯優(yōu)化概述[J];軟件學(xué)報(bào);2015年06期

4 徐金龍;趙榮彩;丁銳;;面向循環(huán)的混合向量化方法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2014年12期

相關(guān)碩士學(xué)位論文 前2條

1 高偉;面向SIMD的自動(dòng)向量化優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年

2 劉蘇;基于ARM11和Linux的網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)[D];江西理工大學(xué);2014年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 付雄;王汝傳;;一種基于局部性的數(shù)據(jù)重組框架[J];計(jì)算機(jī)科學(xué);2009年02期

2 魏帥;趙榮彩;姚遠(yuǎn);侯永生;;面向SIMD的數(shù)組重組和對(duì)齊優(yōu)化[J];計(jì)算機(jī)科學(xué);2012年02期

3 錢興隆;臧斌宇;朱傳琪;;一種SIMD優(yōu)化中的向量寄存器部分重用方法[J];計(jì)算機(jī)工程與科學(xué);2007年05期

4 姜偉華,梅超,郭一,朱嘉華,臧斌宇,朱傳琪;一種針對(duì)多媒體擴(kuò)展指令集和實(shí)際多媒體程序的自動(dòng)向量化方法[J];計(jì)算機(jī)學(xué)報(bào);2005年08期

5 魏帥;趙榮彩;姚遠(yuǎn);;面向國(guó)產(chǎn)CPU SW-1600的向量重組[J];計(jì)算機(jī)應(yīng)用與軟件;2011年11期

6 魏帥;魏然;侯永生;;面向科學(xué)計(jì)算程序的向量化[J];信息工程大學(xué)學(xué)報(bào);2011年06期

7 李玉祥;施慧;陳莉;;面向非多媒體程序的SIMD向量化算法的研究及改進(jìn)[J];小型微型計(jì)算機(jī)系統(tǒng);2009年10期

相關(guān)博士學(xué)位論文 前3條

1 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年

2 付雄;利用程序分析和優(yōu)化提高Cache性能[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

3 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

相關(guān)碩士學(xué)位論文 前2條

1 楊明;基于存儲(chǔ)訪問(wèn)的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年

2 趙常智;支持SIMD的DSP編譯優(yōu)化技術(shù)的研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2005年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計(jì)研究[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期

2 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計(jì)算機(jī)工程;2009年10期

3 李初輝;王偉;肖瑋;;一種共享主存二維SIMD結(jié)構(gòu)資源分配算法的改進(jìn)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2008年09期

4 陳向;沈立;李家文;;SIMD數(shù)據(jù)置換操作的自動(dòng)生成和優(yōu)化[J];計(jì)算機(jī)科學(xué);2011年05期

5 桑紅石,沈緒榜,陳朝陽(yáng);LS SIMD陣列微處理器控制信號(hào)時(shí)序分析[J];小型微型計(jì)算機(jī)系統(tǒng);2001年12期

6 單睿;一種基于SIMD結(jié)構(gòu)的可重組乘累加器設(shè)計(jì)[J];微計(jì)算機(jī)應(yīng)用;2003年03期

7 鄭偉,姚慶棟,張明,蔣志迪,李東曉,賴?yán)騺?周莉;一種支持SIMD指令的低功耗分裂式ALU設(shè)計(jì)[J];計(jì)算機(jī)工程;2004年17期

8 王光;;一種基于PIM技術(shù)的SIMD核設(shè)計(jì)[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2013年07期

9 于澤德;;基于SIMD-MC~2的并行FFT算法[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年10期

10 王光;;一種基于嵌入式微處理器SIMD核的可重構(gòu)數(shù)據(jù)總線設(shè)計(jì)[J];電子產(chǎn)品世界;2012年11期

相關(guān)會(huì)議論文 前3條

1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗(yàn)證[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點(diǎn)乘加器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年

3 張科勛;李勇;郭海勇;;一種半定制與全定制相結(jié)合的SIMD乘法器設(shè)計(jì)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

相關(guān)碩士學(xué)位論文 前9條

1 張倩;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[D];復(fù)旦大學(xué);2008年

2 李璋輝;支持浮點(diǎn)融合乘加的SIMD運(yùn)算部件設(shè)計(jì)優(yōu)化及實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

3 楊明;基于存儲(chǔ)訪問(wèn)的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年

4 劉楷;基于SIMD結(jié)構(gòu)的高性能DSP處理器評(píng)測(cè)程序的優(yōu)化與實(shí)現(xiàn)[D];西安電子科技大學(xué);2012年

5 陳向;SIMD數(shù)據(jù)置換指令的自動(dòng)生成與優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

6 劉洋徐瑞;高性能DSP中SIMD關(guān)鍵計(jì)算部件的研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年

7 成興華;FT-XDSP高性能64位定點(diǎn)SIMD乘加部件的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

8 劉純悅;基于SIMD的媒體處理器的數(shù)據(jù)存儲(chǔ)與組織體系結(jié)構(gòu)優(yōu)化研究[D];浙江大學(xué);2007年

9 黃遠(yuǎn)廣;多寬度SIMD結(jié)構(gòu)DSP向量存儲(chǔ)器的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年

,

本文編號(hào):1755636

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1755636.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cdcca***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com