天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

SIMD數(shù)據(jù)置換指令的自動(dòng)生成與優(yōu)化

發(fā)布時(shí)間:2020-06-20 07:25
【摘要】:為了提高多媒體、編碼/解碼、加密/解密等計(jì)算密集型應(yīng)用的性能,越來越多的現(xiàn)代微處理器中集成了SIMD(Single Instruction Multiple Data)功能單元,并向原有的指令集中增加了SIMD擴(kuò)展指令,以充分挖掘這些應(yīng)用中蘊(yùn)含的豐富數(shù)據(jù)級(jí)并行。 在理想情況下,SIMD指令能夠帶來很高的性能加速比,但是目前編譯器對(duì)SIMD指令的利用并沒有達(dá)到足夠令人滿意的程度,其主要原因有兩個(gè):一是SIMD指令都是寄存器-寄存器型的,操作數(shù)的寬度必須與向量寄存器的寬度一致;二是絕大多數(shù)SIMD訪存單元僅支持地址連續(xù)、對(duì)齊(aligned)的存儲(chǔ)訪問。如果實(shí)際應(yīng)用無法滿足這兩個(gè)條件,就必須插入數(shù)據(jù)置換(permutation)指令,對(duì)參與運(yùn)算的數(shù)據(jù)進(jìn)行重新組織,以得到符合SIMD指令要求的操作數(shù)。然而,數(shù)據(jù)置換指令的加入會(huì)帶來不小的性能損失,降低程序的執(zhí)行效率。本文研究并提出了減少這種性能損失的方法,并將其集成到SIMD指令的自動(dòng)生成編譯框架中。 通過分析現(xiàn)有的數(shù)據(jù)置換指令自動(dòng)生成和優(yōu)化方法,不難發(fā)現(xiàn)現(xiàn)有的編譯策略都將置換指令的生成和優(yōu)化分為兩個(gè)階段,第一個(gè)階段生成置換指令,但其中有不少是冗余的,第二階段再盡可能地將這些冗余的置換指令優(yōu)化掉,但優(yōu)化效果往往無法令人滿意。 為了解決這些問題,本文首先提出了一種新的中間表示URSS(Unified Representation for Scalar and SIMD),它能夠?qū)?biāo)量指令和SIMD指令的表示統(tǒng)一起來。基于這種中間表示,本文設(shè)計(jì)并實(shí)現(xiàn)了一種自動(dòng)向量化算法,在向量化的過程中僅生成非冗余的置換指令,而將其他置換指令表示為數(shù)據(jù)流圖中的沖突邊。最后本文提出了沖突邊的識(shí)別和消除算法。上述工作已經(jīng)在基于SUIF2的編譯框架上實(shí)現(xiàn)。面向核心程序和MiBench基準(zhǔn)程序包的測(cè)試結(jié)果表明,我們提出的方法大大減少了數(shù)據(jù)置換指令帶來的性能損失。
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:TP332
【圖文】:

子字,單元結(jié)構(gòu)


圖 1.8 子字置換單元結(jié)構(gòu)圖[29]些文獻(xiàn)對(duì) SIMD 數(shù)據(jù)置換問題進(jìn)行了討論。Nuzman 等了一種自動(dòng)編譯策略[26]。此外,人們也提出了其他一策略[10]。SIMD 存儲(chǔ)訪問單元已經(jīng)能夠支持對(duì)齊數(shù)據(jù)重矩陣元素的重組,使用專用的 diagonal 寄存器[9]和向量的進(jìn)行優(yōu)化。為了對(duì) 2-D 數(shù)據(jù)塊中的元素進(jìn)行任意重組,組指令[32]。ELITE DSP 結(jié)構(gòu)中實(shí)現(xiàn)了數(shù)據(jù)重組[33]。究圍繞與 SIMD 編譯優(yōu)化相關(guān)的問題展開。Rainer Leu圖的指令選擇算法,將傳統(tǒng)的樹模式匹配和動(dòng)態(tài)規(guī)劃規(guī)劃相結(jié)合,最大限度地生成 SIMD 指令。還有一些研關(guān)性問題及其與傳統(tǒng)向量化之間的差異進(jìn)行詳細(xì)的討論1.4 主要工作與創(chuàng)新點(diǎn)究工作受到以下項(xiàng)目的支持:題“計(jì)算系統(tǒng)虛擬化的理論模型和體系結(jié)構(gòu)研究”

【共引文獻(xiàn)】

相關(guān)博士學(xué)位論文 前3條

1 姜偉華;針對(duì)實(shí)際多媒體程序和多媒體擴(kuò)展指令集的SIMD編譯優(yōu)化[D];復(fù)旦大學(xué);2005年

2 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年

3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2006年

相關(guān)碩士學(xué)位論文 前3條

1 張逸n

本文編號(hào):2722079


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2722079.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aff16***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com