基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)
更多相關(guān)文章: SIMD 自動(dòng)向量化 向量訪存 DMA
【摘要】:FT-Matrix2 DSP是國(guó)防科技大學(xué)微電子所自主研發(fā)的一款面向圖像處理、視頻和無(wú)線通信的高性能DSP。其采用向量和多發(fā)射超長(zhǎng)指令字體系結(jié)構(gòu)。其中,SIMD指令在FT-Matrix2指令集中的數(shù)量占比達(dá)到了近50%,而這些指令是芯片整體性能得到提升的關(guān)鍵。因此,FT-Matrix2編譯器中SIMD向量化能力直接影響著芯片的運(yùn)行效率。本文基于GCC平臺(tái)研究并實(shí)現(xiàn)了FT-Matrix2編譯器的自動(dòng)向量化技術(shù)。本文根據(jù)FT-Matrix2體系結(jié)構(gòu)特征,通過添加FT-Matrix2向量后端支持以及在自動(dòng)向量化過程中增加DMA自動(dòng)傳輸實(shí)現(xiàn)向量訪存等技術(shù),使得FT-Matrix2編譯器能夠盡量挖掘用戶C程序的自動(dòng)向量化部分,從而提高芯片的運(yùn)行效率。本文的主要工作包括以下幾個(gè)方面:(1)對(duì)GCC的編譯結(jié)構(gòu)、自動(dòng)向量化框架進(jìn)行了深入的分析。首先熟悉了GCC的結(jié)構(gòu)框架,然后定位了自動(dòng)向量化優(yōu)化在GCC內(nèi)部的位置,最后分析了自動(dòng)向量化的的結(jié)構(gòu)框架。通過對(duì)上述問題的深入分析,確定了基于GCC平臺(tái)實(shí)現(xiàn)FT-Matrix2的向量化方法和步驟。(2)基于FT-Matrix2體系結(jié)構(gòu)和指令集,在GCC中實(shí)現(xiàn)了SIMD指令自動(dòng)向量化映射。其主要工作包括:添加向量寄存器描述,向量數(shù)據(jù)機(jī)器模式,向量指令描述,匯編輸出等。(3)基于FT-Matrix2的自動(dòng)向量化訪存實(shí)現(xiàn);贔T-Matrix2體系結(jié)構(gòu)向量訪存的特點(diǎn),在GCC中實(shí)現(xiàn)了基于DMA的自動(dòng)數(shù)據(jù)傳輸功能,使得編譯器能夠根據(jù)向量程序要求自動(dòng)生成向量數(shù)據(jù)搬移代碼,實(shí)現(xiàn)了FT-Matrix2自動(dòng)向量化的向量訪存。(4)基于本文的研究工作,對(duì)DSP常用算法FFT進(jìn)行了自動(dòng)向量化實(shí)現(xiàn),測(cè)試結(jié)果表明:基于FT-Matrix2 Compiler的自動(dòng)向量化較-O2級(jí)優(yōu)化非向量化性能有明顯的提高,而較intrinsic方式向量化性能較低。
【關(guān)鍵詞】:SIMD 自動(dòng)向量化 向量訪存 DMA
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP332
【目錄】:
- 摘要9-10
- ABSTRACT10-11
- 第一章 緒論11-19
- 1.1 研究背景11-12
- 1.2 自動(dòng)向量化簡(jiǎn)介及研究現(xiàn)狀12-15
- 1.3 開發(fā)平臺(tái)選擇15-16
- 1.4 論文的主要工作16-17
- 1.5 論文結(jié)構(gòu)和組織17-19
- 第二章 GCC自動(dòng)向量化框架分析19-34
- 2.1 GCC編譯結(jié)構(gòu)分析19-23
- 2.2 自動(dòng)向量化的的框架分析23-33
- 2.2.1 循環(huán)的向量化可行性分析25-30
- 2.2.2 循環(huán)的向量化轉(zhuǎn)換30-33
- 2.3 本章小結(jié)33-34
- 第三章 基于FT-Matrix2的自動(dòng)向量化實(shí)現(xiàn)34-46
- 3.1 FT-Matrix2體系結(jié)構(gòu)34-37
- 3.1.1 FT-Matrix2內(nèi)核結(jié)構(gòu)34-35
- 3.1.2 FT-Matrix2指令集35-37
- 3.2 FT-Matrix2向量后端移植37-41
- 3.2.1 向量寄存器描述37-38
- 3.2.2 向量數(shù)據(jù)機(jī)器模式38-41
- 3.3 FT-Matrix2向量指令實(shí)現(xiàn)41-45
- 3.3.1 指令映射分析41-42
- 3.3.2 指令映射實(shí)現(xiàn)42-45
- 3.4 本章小結(jié)45-46
- 第四章 基于FT-Matrix2的向量訪存實(shí)現(xiàn)46-57
- 4.1 FT-Matrix2向量訪存介紹與分析46-47
- 4.2 自動(dòng)向量化的向量訪存實(shí)現(xiàn)過程47-48
- 4.3 基于DMA自動(dòng)傳輸?shù)南蛄吭L存實(shí)現(xiàn)48-54
- 4.4 基于SVR傳輸?shù)南蛄吭L存實(shí)現(xiàn)54-56
- 4.5 本章小結(jié)56-57
- 第五章 基于FT-Matrix2的FFT算法的自動(dòng)向量化實(shí)現(xiàn)57-68
- 5.1 FFT算法介紹及分析57-61
- 5.1.1 FFT算法介紹57-58
- 5.1.2 FFT算法的自動(dòng)向量化實(shí)現(xiàn)分析58-61
- 5.2 實(shí)驗(yàn)結(jié)果及性能分析61-67
- 5.3 本章小結(jié)67-68
- 第六章 總結(jié)與展望68-71
- 6.1 全文總結(jié)68-69
- 6.2 展望69-71
- 致謝71-73
- 參考文獻(xiàn)73-77
- 作者在學(xué)期間取得的學(xué)術(shù)成果77
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 吳明霞;陳火旺;;串行運(yùn)算向量化初探[J];計(jì)算機(jī)工程與科學(xué);1980年02期
2 吳明霞,陳火旺;串行運(yùn)算向量化[J];計(jì)算機(jī)學(xué)報(bào);1981年03期
3 范植華 ,吳健安 ,郭強(qiáng) ,魏奎超;向量化中的識(shí)別指導(dǎo)性指令[J];計(jì)算機(jī)工程與科學(xué);1985年03期
4 范植華;向量化概論[J];電子學(xué)報(bào);1986年03期
5 陳曉樺,楊桃欄;向量化中的分段處理[J];計(jì)算機(jī)學(xué)報(bào);1989年08期
6 李勇;何偉;李秉輝;;地圖向量化的嘗試[J];農(nóng)村電工;2006年04期
7 吳健安;;串行運(yùn)算向量化綜述[J];計(jì)算機(jī)工程與科學(xué);1980年03期
8 陳曉樺;分段處理技術(shù)在向量化中的應(yīng)用[J];計(jì)算機(jī)工程與科學(xué);1986年03期
9 范植華;向量化性態(tài)的比較判別法[J];電子學(xué)報(bào);1991年05期
10 黃磊;姚遠(yuǎn);侯永生;楊明;;自動(dòng)向量化中基于數(shù)據(jù)依賴分析的循環(huán)分布算法[J];計(jì)算機(jī)科學(xué);2011年09期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 ;用非向量化聚類和預(yù)測(cè)方法改善“開始-結(jié)束”機(jī)制的運(yùn)行效率(英文)[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
2 黃君輝;劉仲;陳躍躍;;一種基于YHFT-Matrix的FFT向量化實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 周羽豐;Matrix2可擴(kuò)展向量化編譯方法的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
2 高翔;集成眾核平臺(tái)科學(xué)計(jì)算應(yīng)用性能測(cè)評(píng)和優(yōu)化研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
3 夏睿杰;基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年
4 徐穎;編譯指導(dǎo)的自動(dòng)向量化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
5 張媛媛;自動(dòng)向量化中的收益評(píng)估技術(shù)研究[D];解放軍信息工程大學(xué);2011年
6 索維毅;面向DSP的自動(dòng)向量化及優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年
7 徐華葉;多簇VLIW DSP向量化相關(guān)編譯技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
,本文編號(hào):920387
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/920387.html