向量并行度指導(dǎo)的循環(huán)SIMD向量化方法
本文關(guān)鍵詞: SIMD擴(kuò)展部件 向量并行度 Loop-aware 循環(huán)展開(kāi) 出處:《軟件學(xué)報(bào)》2017年04期 論文類型:期刊論文
【摘要】:SIMD擴(kuò)展部件是集成到通用處理器中的加速部件,旨在發(fā)掘多媒體和科學(xué)計(jì)算等領(lǐng)域程序的數(shù)據(jù)級(jí)并行.當(dāng)前,兩種基本的向量發(fā)掘方法分別是發(fā)掘迭代間并行的Loop-based方法和發(fā)掘迭代內(nèi)并行的SLP方法.Loopaware方法是對(duì)SLP方法的改進(jìn),其思想是:首先,通過(guò)循環(huán)展開(kāi)將迭代間并行轉(zhuǎn)換為迭代內(nèi)并行,使循環(huán)體內(nèi)的同構(gòu)語(yǔ)句條數(shù)足夠多;再利用SLP方法進(jìn)行向量發(fā)掘.但當(dāng)循環(huán)展開(kāi)不合法或者并行度低于向量化因子時(shí),Loop-aware方法無(wú)法實(shí)現(xiàn)程序向量并行性的發(fā)掘.因此提出了向量并行度指導(dǎo)的循環(huán)向量化方法,依據(jù)迭代間并行度、迭代內(nèi)并行度和向量化因子構(gòu)建循環(huán)向量化方法選擇方案,同時(shí)提出了不充分向量化方法發(fā)掘并行度低于向量化因子的循環(huán)向量并行性,最后,依據(jù)向量并行度對(duì)生成的向量循環(huán)進(jìn)行展開(kāi).經(jīng)過(guò)標(biāo)準(zhǔn)測(cè)試集測(cè)試,向量并行度指導(dǎo)的循環(huán)SIMD向量化方法比Loop-aware方法的識(shí)別率提升了107.5%,性能提升了12.1%.
[Abstract]:The SIMD extension is an accelerator integrated into a general-purpose processor designed to explore data-level parallelism in fields such as multimedia and scientific computing. The two basic vector mining methods are to discover the parallel Loop-based method between iterations and the SLP method. Loopaware method is the improvement of the SLP method. The main ideas are as follows: first of all, The parallelism between iterations is transformed into intra-iteration parallelism by loop expansion, so that the number of isomorphic statements in the loop is sufficient. Then the SLP method is used for vector discovery. However, when the cyclic expansion is illegal or the degree of parallelism is lower than the vectorization factor, Loop-aware cannot realize the discovery of program vector parallelism. Therefore, a cyclic vectorization method guided by vector parallelism is proposed. According to the degree of parallelism between iterations, the degree of parallelism within iterations and the vectorization factor, the selection scheme of cyclic vectorization method is constructed. At the same time, an inadequate vectorization method is proposed to discover the parallelism of cyclic vectors with less parallelism than the vectorization factor. Finally, The vector cycle is expanded according to the degree of vector parallelism. Through the standard test set test, the recognition rate of the vector parallelism directed cyclic SIMD vectorization method is 107.5% higher than that of the Loop-aware method, and the performance is improved by 12.1%.
【作者單位】: 數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室(解放軍信息工程大學(xué));防空兵指揮學(xué)院;
【基金】:“核高基”國(guó)家科技重大專項(xiàng)(2009ZX01036)~~
【分類號(hào)】:TP332
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 高偉;趙榮彩;韓林;龐建民;丁銳;;SIMD自動(dòng)向量化編譯優(yōu)化概述[J];軟件學(xué)報(bào);2015年06期
2 徐華葉;鄭啟龍;丁陳飛;徐東鵬;;面向多簇超長(zhǎng)指令字DSP的向量化優(yōu)化算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2013年12期
3 彭飛;顧乃杰;高翔;孫明明;;龍芯3B的SIMD編譯優(yōu)化及分析[J];小型微型計(jì)算機(jī)系統(tǒng);2012年12期
4 辛乃軍;陳旭燦;孫海燕;陽(yáng)柳;羅杰;淡孝強(qiáng);王霽;;基于GCC的高性能DSP Matrix向量指令集擴(kuò)展[J];計(jì)算機(jī)工程與科學(xué);2012年01期
5 李玉祥;施慧;陳莉;;面向向量化的局部數(shù)據(jù)重組[J];小型微型計(jì)算機(jī)系統(tǒng);2009年08期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳華軍;王琦;洪超;方萌;;基于全局?jǐn)?shù)據(jù)重組的循環(huán)傾斜優(yōu)化[J];計(jì)算機(jī)與現(xiàn)代化;2017年06期
2 李忠武;;基于匯編語(yǔ)言教學(xué)中優(yōu)化語(yǔ)言代碼方法探討與研究[J];電子測(cè)試;2017年10期
3 呂鵬偉;劉從新;趙一明;沈緒榜;;基于動(dòng)態(tài)規(guī)劃的自動(dòng)向量化方法[J];北京理工大學(xué)學(xué)報(bào);2017年05期
4 張素平;韓林;丁麗麗;王鵬翔;;新型超字級(jí)并行改進(jìn)算法[J];計(jì)算機(jī)應(yīng)用;2017年02期
5 賀婷;;基于數(shù)據(jù)級(jí)自動(dòng)向量化的編譯優(yōu)化研究綜述[J];智能計(jì)算機(jī)與應(yīng)用;2016年06期
6 唐佳;王凡;劉福烈;;三維波動(dòng)方程正演的三級(jí)并行加速[J];石油地球物理勘探;2016年05期
7 范超;趙榮彩;單征;李朋遠(yuǎn);;結(jié)構(gòu)體向量化中的存儲(chǔ)優(yōu)化[J];小型微型計(jì)算機(jī)系統(tǒng);2016年09期
8 呂鵬偉;劉從新;沈緒榜;;一種新型自動(dòng)向量化編譯算法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2016年05期
9 丁麗麗;韓林;王冬;張素平;王鵬翔;于海寧;;依賴距離主導(dǎo)的向量化方法研究[J];計(jì)算機(jī)應(yīng)用研究;2017年05期
10 張素平;王冬;丁麗麗;王鵬翔;宮一;于海寧;;一種基于SLP的新型編譯框架[J];計(jì)算機(jī)應(yīng)用研究;2017年01期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 徐華葉;鄭啟龍;丁陳飛;徐東鵬;;面向多簇超長(zhǎng)指令字DSP的向量化優(yōu)化算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2013年12期
2 彭飛;顧乃杰;高翔;孫明明;;龍芯3B的SIMD編譯優(yōu)化及分析[J];小型微型計(jì)算機(jī)系統(tǒng);2012年12期
3 辛乃軍;陳旭燦;孫海燕;陽(yáng)柳;羅杰;淡孝強(qiáng);王霽;;基于GCC的高性能DSP Matrix向量指令集擴(kuò)展[J];計(jì)算機(jī)工程與科學(xué);2012年01期
4 李玉祥;施慧;陳莉;;面向向量化的局部數(shù)據(jù)重組[J];小型微型計(jì)算機(jī)系統(tǒng);2009年08期
5 鄒瓊;董峻峰;;針對(duì)龍芯2號(hào)結(jié)構(gòu)特征的GCC優(yōu)化[J];小型微型計(jì)算機(jī)系統(tǒng);2007年12期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計(jì)算機(jī)學(xué)報(bào);2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計(jì)算機(jī)與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應(yīng)用[J];計(jì)算機(jī)工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴(kuò)展部件的循環(huán)優(yōu)化研究[J];計(jì)算機(jī)科學(xué);2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計(jì)算機(jī)科學(xué)與探索;2009年01期
6 郭陽(yáng);丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計(jì)[J];微電子學(xué)與計(jì)算機(jī);2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴(kuò)展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學(xué)學(xué)報(bào);2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計(jì)研究[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計(jì)算機(jī)工程與應(yīng)用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計(jì)算機(jī)工程;2009年10期
相關(guān)會(huì)議論文 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗(yàn)證[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠(yuǎn);;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語(yǔ)句轉(zhuǎn)化方法[A];2009年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 朱明慧;;ADI浮點(diǎn)DSP軟件編程中的指令并行與SIMD應(yīng)用[A];中國(guó)航空學(xué)會(huì)信號(hào)與信息處理專業(yè)全國(guó)第八屆學(xué)術(shù)會(huì)議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點(diǎn)視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國(guó)衛(wèi)星導(dǎo)航學(xué)術(shù)年會(huì)論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點(diǎn)乘加器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
相關(guān)博士學(xué)位論文 前8條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
2 侯永生;多重循環(huán)SIMD向量化方法及性能優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2014年
3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2006年
4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年
5 張凱;向量SIMD DSP上高效矩陣運(yùn)算技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
6 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年
7 姜偉華;針對(duì)實(shí)際多媒體程序和多媒體擴(kuò)展指令集的SIMD編譯優(yōu)化[D];復(fù)旦大學(xué);2005年
8 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 沈陽(yáng);基于SIMD指令的多核軟件渲染器的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2015年
2 王力;SIMD指令在生物序列串匹配里的應(yīng)用[D];北京理工大學(xué);2015年
3 黃娟娟;多線程多SIMD自動(dòng)向量化技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
4 趙芮;一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設(shè)計(jì)與驗(yàn)證[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
5 林宗華;X-DSP定點(diǎn)乘累加的設(shè)計(jì)優(yōu)化與驗(yàn)證[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
6 宋貴環(huán);YHFT-Matrix2編譯器SIMD優(yōu)化技術(shù)研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
7 黃勝兵;面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年
8 胡辰;基于異構(gòu)SIMD并行的高分辨率星載SAR原始數(shù)據(jù)快速模擬研究[D];北京化工大學(xué);2016年
9 李國(guó)君;基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究[D];北京化工大學(xué);2016年
10 徐沛文;32位高性能DSP SIMD向量存儲(chǔ)器的設(shè)計(jì)和驗(yàn)證[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年
,本文編號(hào):1514864
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1514864.html