一種改進的控制流SIMD向量化方法
[Abstract]:The SIMD extension is an accelerator integrated into a general purpose processor in recent years, which aims to explore the data-level parallelism of programs such as multimedia and scientific computing. Control dependence is a hindrance to data-level parallelism in mining programs. At present, both loop-based and SLP control flow direction quantization methods need if transformation without considering the vector parallelism in the loop. The resulting vector code is inefficient. In addition, the inexact cost model guides the quantization of the control flow, which also leads to the low efficiency of the generated vector code. Therefore, an improved control flow SIMD vectorization method is proposed. First of all, a cyclic distribution algorithm with control dependency is proposed to separate the quantifiable part of the loop from the non-vectorized part, and the locality of the data is considered at the same time. Secondly, a method of direct vectorization control flow is proposed. This method takes into account the vector reuse between the basic blocks. Finally, the exact cost model is used to guide the generation of superword selection instructions and superword conditional branch instructions. The experimental results show that the performance of vector code generated by the improved method is improved by 24% compared with the existing methods.
【作者單位】: 數(shù)學(xué)工程與先進計算國家重點實驗室(解放軍信息工程大學(xué));
【基金】:“核高基”國家科技重大專項(2009ZX01036)~~
【分類號】:TP314;TP332
【相似文獻】
相關(guān)期刊論文 前10條
1 BenjaminHAO,DavidPEARSON,RichardZIPPEL;Global Register Allocation for SIMD Multiprocessors[J];Journal of Computer Science and Technology;1996年03期
2 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應(yīng)用[J];計算機工程;2010年19期
3 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴展部件的循環(huán)優(yōu)化研究[J];計算機科學(xué);2014年05期
4 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計算機科學(xué)與探索;2009年01期
5 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計[J];微電子學(xué)與計算機;2010年09期
6 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計研究[J];浙江大學(xué)學(xué)報(工學(xué)版);2001年02期
7 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計算機工程;2009年10期
8 李初輝;王偉;肖瑋;;一種共享主存二維SIMD結(jié)構(gòu)資源分配算法的改進與實現(xiàn)[J];計算機工程與科學(xué);2008年09期
9 陳向;沈立;李家文;;SIMD數(shù)據(jù)置換操作的自動生成和優(yōu)化[J];計算機科學(xué);2011年05期
10 桑紅石,沈緒榜,陳朝陽;LS SIMD陣列微處理器控制信號時序分析[J];小型微型計算機系統(tǒng);2001年12期
相關(guān)會議論文 前2條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設(shè)計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
相關(guān)博士學(xué)位論文 前1條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 沈陽;基于SIMD指令的多核軟件渲染器的設(shè)計與實現(xiàn)[D];浙江大學(xué);2015年
2 黃娟娟;多線程多SIMD自動向量化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
3 趙芮;一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設(shè)計與驗證[D];國防科學(xué)技術(shù)大學(xué);2014年
4 林宗華;X-DSP定點乘累加的設(shè)計優(yōu)化與驗證[D];國防科學(xué)技術(shù)大學(xué);2014年
5 徐沛文;32位高性能DSP SIMD向量存儲器的設(shè)計和驗證[D];國防科學(xué)技術(shù)大學(xué);2015年
6 單佳坤;基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計[D];西安電子科技大學(xué);2016年
7 張倩;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[D];復(fù)旦大學(xué);2008年
8 李璋輝;支持浮點融合乘加的SIMD運算部件設(shè)計優(yōu)化及實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年
9 楊明;基于存儲訪問的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
10 劉楷;基于SIMD結(jié)構(gòu)的高性能DSP處理器評測程序的優(yōu)化與實現(xiàn)[D];西安電子科技大學(xué);2012年
,本文編號:2184362
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2184362.html