基于有向圖可達(dá)性的SLP向量化識(shí)別方法
[Abstract]:SLP (superword level parallelism) is a method to implement SIMD (single instruction multiple data) vectorization, which is implemented by current mainstream vectorization compilers. However, when SLP vectorization is carried out in current algorithms, the analysis process of vectorization cycles in applications is too conservative, which leads to insufficient ability to identify SLP vectorization. In order to improve this capability, a SLP vectorization method based on directed graph reachability is proposed in this paper. Firstly, a directed graph containing information of array and statement dependency is constructed based on array dependency graph, so that all array nodes in the same statement are within a strongly connected component, and the dependency edges between strongly connected components are pruned. Secondly, the reachability between nodes with different strongly connected components is analyzed, and all the dependent information needed to identify SLP vectorization is obtained according to the reachability of nodes, so as to determine whether the loop in the statement can be vectorized by SLP. After the implementation of this method in the Open64-5.0 compiler, the SLP vectorization effect is greatly improved. The experimental results of gcc-vect test set show that the optimized Open64-5.0 compiler has better ability to identify SLP vectorization cycles than GCC4.9, and Intel ICC14.0, and the performance of generated vectorized codes is better than that of current optimal algorithms.
【作者單位】: 解放軍信息工程大學(xué)數(shù)學(xué)工程與先進(jìn)計(jì)算國家重點(diǎn)實(shí)驗(yàn)室;
【基金】:“核高基”國家科技重大專項(xiàng)(批準(zhǔn)號:2009ZX01036-001-001-2) 數(shù)學(xué)工程與先進(jìn)計(jì)算國家重點(diǎn)實(shí)驗(yàn)室開放課題(批準(zhǔn)號:2013A11)資助項(xiàng)目
【分類號】:TP314
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳明霞;陳火旺;;串行運(yùn)算向量化初探[J];計(jì)算機(jī)工程與科學(xué);1980年02期
2 吳明霞,陳火旺;串行運(yùn)算向量化[J];計(jì)算機(jī)學(xué)報(bào);1981年03期
3 范植華 ,吳健安 ,郭強(qiáng) ,魏奎超;向量化中的識(shí)別指導(dǎo)性指令[J];計(jì)算機(jī)工程與科學(xué);1985年03期
4 范植華;向量化概論[J];電子學(xué)報(bào);1986年03期
5 陳曉樺,楊桃欄;向量化中的分段處理[J];計(jì)算機(jī)學(xué)報(bào);1989年08期
6 李勇;何偉;李秉輝;;地圖向量化的嘗試[J];農(nóng)村電工;2006年04期
7 吳健安;;串行運(yùn)算向量化綜述[J];計(jì)算機(jī)工程與科學(xué);1980年03期
8 陳曉樺;分段處理技術(shù)在向量化中的應(yīng)用[J];計(jì)算機(jī)工程與科學(xué);1986年03期
9 范植華;向量化性態(tài)的比較判別法[J];電子學(xué)報(bào);1991年05期
10 黃磊;姚遠(yuǎn);侯永生;楊明;;自動(dòng)向量化中基于數(shù)據(jù)依賴分析的循環(huán)分布算法[J];計(jì)算機(jī)科學(xué);2011年09期
相關(guān)會(huì)議論文 前2條
1 ;用非向量化聚類和預(yù)測方法改善“開始-結(jié)束”機(jī)制的運(yùn)行效率(英文)[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
2 黃君輝;劉仲;陳躍躍;;一種基于YHFT-Matrix的FFT向量化實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
相關(guān)碩士學(xué)位論文 前7條
1 周羽豐;Matrix2可擴(kuò)展向量化編譯方法的設(shè)計(jì)與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2014年
2 高翔;集成眾核平臺(tái)科學(xué)計(jì)算應(yīng)用性能測評和優(yōu)化研究[D];國防科學(xué)技術(shù)大學(xué);2014年
3 夏睿杰;基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2015年
4 徐穎;編譯指導(dǎo)的自動(dòng)向量化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
5 張媛媛;自動(dòng)向量化中的收益評估技術(shù)研究[D];解放軍信息工程大學(xué);2011年
6 索維毅;面向DSP的自動(dòng)向量化及優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年
7 徐華葉;多簇VLIW DSP向量化相關(guān)編譯技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年
,本文編號:2434129
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2434129.html