面向SIMD擴(kuò)展部件的循環(huán)優(yōu)化研究
本文關(guān)鍵詞:面向SIMD擴(kuò)展部件的循環(huán)優(yōu)化研究 出處:《計(jì)算機(jī)科學(xué)》2014年05期 論文類型:期刊論文
更多相關(guān)文章: SIMD 依賴關(guān)系 循環(huán)優(yōu)化 Tarjan
【摘要】:高性能微處理器中普遍采用SIMD向量擴(kuò)展作為計(jì)算加速部件。在深入研究SIMD擴(kuò)展部件數(shù)據(jù)依賴關(guān)系約束條件的基礎(chǔ)上,提出一種基于依賴關(guān)系逆向圖的Tarjan擴(kuò)展算法,提高了SIMD并行性識(shí)別率,并結(jié)合傳統(tǒng)向量化方法,實(shí)現(xiàn)了面向SIMD擴(kuò)展部件的循環(huán)優(yōu)化技術(shù),消除了不可向量化語(yǔ)句對(duì)可向量化語(yǔ)句在數(shù)據(jù)重組中不必要的開銷。實(shí)際程序測(cè)試結(jié)果顯示,其在基于依賴關(guān)系的SIMD并行性判定方面優(yōu)于ICC編譯器,經(jīng)過(guò)循環(huán)優(yōu)化后,最終生成的SIMD代碼其執(zhí)行效率平均提高了12%。
[Abstract]:In high performance microprocessors, SIMD vector expansion is widely used as the computing accelerator. Based on the in-depth study of data dependency constraints of SIMD extension components. This paper presents an extended Tarjan algorithm based on dependency reverse graph, which improves the recognition rate of SIMD parallelism, and combines with traditional vectorization method. The loop optimization technology for SIMD extension components is implemented, and the unnecessary overhead of non-vectorized statements in data recombination is eliminated. The actual program test results show. It is superior to the ICC compiler in judging the parallelism of SIMD based on dependency relationship. After loop optimization, the final generated SIMD code has an average execution efficiency of 12 points higher than that of the ICC compiler.
【作者單位】: 數(shù)字工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室;
【基金】:“核高基”重大專項(xiàng)“支持國(guó)產(chǎn)CPU的編譯系統(tǒng)及工具鏈”分課題“自動(dòng)并行化與二進(jìn)制翻譯系統(tǒng)”(2009ZX10036-001-001-2)資助
【分類號(hào)】:TP332
【正文快照】: 1引言隨著高性能微處理中SIMD擴(kuò)展指令功能日益完善,SIMD擴(kuò)展部件逐漸從多媒體專用加速部件[4]轉(zhuǎn)變?yōu)橥ㄓ糜?jì)算加速部件[3],在科學(xué)計(jì)算[12]、數(shù)字信號(hào)[11]、密碼破譯[10]等非多媒體應(yīng)用領(lǐng)域得到廣泛使用。SIMD擴(kuò)展部件利用128或256位的SIMD寄存器對(duì)多個(gè)字符型、整型、浮點(diǎn)型數(shù)
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 林日昶;陳碧歡;彭鑫;趙文耘;;支持風(fēng)險(xiǎn)偏好的Web服務(wù)動(dòng)態(tài)組合方法[J];中國(guó)科學(xué):信息科學(xué);2014年01期
2 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴(kuò)展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學(xué)學(xué)報(bào);2014年01期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 傅勇,吳永英;面向圖像處理的SIMD結(jié)構(gòu)參數(shù)優(yōu)化[J];華中科技大學(xué)學(xué)報(bào);2001年06期
2 何冬明,楊新志,薛忠杰;基于算法的DSP硬件結(jié)構(gòu)分析[J];電子與封裝;2004年01期
3 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計(jì)研究[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期
4 程翥,樓生強(qiáng),皇甫堪;H.263編碼器中運(yùn)動(dòng)補(bǔ)償?shù)腗MX加速[J];國(guó)防科技大學(xué)學(xué)報(bào);2000年04期
5 杜慧敏,張智泉,沈緒榜;一種適用于數(shù)字圖像處理的DSP片上系統(tǒng)[J];微電子學(xué)與計(jì)算機(jī);2004年01期
6 李勇;齊同斌;張瑞生;;一種SIMD多DSP數(shù)字圖像處理系統(tǒng)研究與設(shè)計(jì)[J];電子技術(shù)應(yīng)用;2007年11期
7 馮剛,劉澤民,黃振興;修正雙邊Jacobi SVD算法及其陣列處理[J];信號(hào)處理;1998年02期
8 季振洲,周勇林,方濱興,胡銘曾;基于FPGA的ABC95陣列機(jī)PE芯片的設(shè)計(jì)[J];高技術(shù)通訊;2000年06期
9 江志紅,康立功;新一代數(shù)字信號(hào)處理器ADSP21161[J];信息技術(shù);2003年07期
10 馬紹漢;謝青松;;SIMD模型上深度優(yōu)先的并行搜索算法[J];計(jì)算機(jī)科學(xué);1996年04期
相關(guān)會(huì)議論文 前10條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗(yàn)證[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點(diǎn)乘加器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
3 莊巍;劉衡竹;楊惠;;基數(shù)分離的快速定點(diǎn)SIMD除法器[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
4 周鋒;彭元喜;楊惠;;面向X處理器的SIMD移位器[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
5 張科勛;李勇;郭海勇;;一種半定制與全定制相結(jié)合的SIMD乘法器設(shè)計(jì)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
6 朱明慧;;ADI浮點(diǎn)DSP軟件編程中的指令并行與SIMD應(yīng)用[A];中國(guó)航空學(xué)會(huì)信號(hào)與信息處理專業(yè)全國(guó)第八屆學(xué)術(shù)會(huì)議論文集[C];2004年
7 李彥潔;龐一;孫立峰;;多視點(diǎn)視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年
8 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語(yǔ)句轉(zhuǎn)化方法[A];2009年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
9 涂衛(wèi)平;胡瑞敏;艾浩軍;樂(lè)攀;;基于SIMD的低碼率語(yǔ)音編碼優(yōu)化[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
10 吳茂林;金林;孫俊;于俊朋;;基于Cell多核的SAR成像并行處理技術(shù)的研究[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年
相關(guān)重要報(bào)紙文章 前6條
1 秋葉;“架構(gòu)”的戰(zhàn)爭(zhēng)[N];電腦報(bào);2010年
2 土勻;了解“愛妻”[N];電腦報(bào);2008年
3 秋葉;CUDA普及之路[N];電腦報(bào);2010年
4 ;AMD新武器到來(lái)[N];電腦報(bào);2010年
5 編譯 褚紅梅 霍光;處理器群雄搶占三網(wǎng)融合新高地[N];中國(guó)計(jì)算機(jī)報(bào);2010年
6 大老客;DX11時(shí)代誰(shuí)能奪標(biāo)[N];電腦報(bào);2010年
相關(guān)博士學(xué)位論文 前10條
1 姚遠(yuǎn);SIMD自動(dòng)向量識(shí)別及代碼調(diào)優(yōu)技術(shù)研究[D];解放軍信息工程大學(xué);2012年
2 劉勝;超寬SIMD DSP片上并行數(shù)據(jù)訪存關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
3 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年
4 黃立波;片上集群體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
5 李世勝;基于運(yùn)行時(shí)的程序執(zhí)行模型研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
6 何義;流體系結(jié)構(gòu)指令管理及系統(tǒng)虛擬化仿真技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
7 趙龍;密碼學(xué)相關(guān)橢圓曲線若干問(wèn)題研究[D];解放軍信息工程大學(xué);2011年
8 焦繼業(yè);低功耗高性能移動(dòng)圖形頂點(diǎn)處理器設(shè)計(jì)關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2013年
9 葛海通;32位高性能嵌入式CPU及平臺(tái)研發(fā)[D];浙江大學(xué);2009年
10 王淼;面向多核處理器的并行編譯及優(yōu)化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 陳向;SIMD數(shù)據(jù)置換指令的自動(dòng)生成與優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
2 楊明;基于存儲(chǔ)訪問(wèn)的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
3 高偉;面向SIMD的自動(dòng)向量化優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年
4 淡孝強(qiáng);YHFT-Matrix編譯器SIMD指令自動(dòng)向量化技術(shù)的研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
5 李國(guó)強(qiáng);SIMD DSP中的高性能定點(diǎn)算術(shù)運(yùn)算部件的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
6 郝云龍;反饋指導(dǎo)的SIMD向量識(shí)別及優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
7 朱嘉風(fēng);面向SIMD的編譯指導(dǎo)與條件分支的編譯優(yōu)化技術(shù)[D];解放軍信息工程大學(xué);2011年
8 白鵬飛;SIMD結(jié)構(gòu)并行圖像降噪處理機(jī)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2013年
9 李勇;H.264核心算法在SIMD向量DSP上的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
10 劉楷;基于SIMD結(jié)構(gòu)的高性能DSP處理器評(píng)測(cè)程序的優(yōu)化與實(shí)現(xiàn)[D];西安電子科技大學(xué);2012年
,本文編號(hào):1415430
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1415430.html