基于FT-Matrix2的自動向量化關鍵技術研究與實現(xiàn)
本文關鍵詞:基于FT-Matrix2的自動向量化關鍵技術研究與實現(xiàn)
【摘要】:FT-Matrix2 DSP是國防科技大學微電子所自主研發(fā)的一款面向圖像處理、視頻和無線通信的高性能DSP。其采用向量和多發(fā)射超長指令字體系結構。其中,SIMD指令在FT-Matrix2指令集中的數(shù)量占比達到了近50%,而這些指令是芯片整體性能得到提升的關鍵。因此,FT-Matrix2編譯器中SIMD向量化能力直接影響著芯片的運行效率。本文基于GCC平臺研究并實現(xiàn)了FT-Matrix2編譯器的自動向量化技術。本文根據(jù)FT-Matrix2體系結構特征,通過添加FT-Matrix2向量后端支持以及在自動向量化過程中增加DMA自動傳輸實現(xiàn)向量訪存等技術,使得FT-Matrix2編譯器能夠盡量挖掘用戶C程序的自動向量化部分,從而提高芯片的運行效率。本文的主要工作包括以下幾個方面:(1)對GCC的編譯結構、自動向量化框架進行了深入的分析。首先熟悉了GCC的結構框架,然后定位了自動向量化優(yōu)化在GCC內(nèi)部的位置,最后分析了自動向量化的的結構框架。通過對上述問題的深入分析,確定了基于GCC平臺實現(xiàn)FT-Matrix2的向量化方法和步驟。(2)基于FT-Matrix2體系結構和指令集,在GCC中實現(xiàn)了SIMD指令自動向量化映射。其主要工作包括:添加向量寄存器描述,向量數(shù)據(jù)機器模式,向量指令描述,匯編輸出等。(3)基于FT-Matrix2的自動向量化訪存實現(xiàn);贔T-Matrix2體系結構向量訪存的特點,在GCC中實現(xiàn)了基于DMA的自動數(shù)據(jù)傳輸功能,使得編譯器能夠根據(jù)向量程序要求自動生成向量數(shù)據(jù)搬移代碼,實現(xiàn)了FT-Matrix2自動向量化的向量訪存。(4)基于本文的研究工作,對DSP常用算法FFT進行了自動向量化實現(xiàn),測試結果表明:基于FT-Matrix2 Compiler的自動向量化較-O2級優(yōu)化非向量化性能有明顯的提高,而較intrinsic方式向量化性能較低。
【關鍵詞】:SIMD 自動向量化 向量訪存 DMA
【學位授予單位】:國防科學技術大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP332
【目錄】:
- 摘要9-10
- ABSTRACT10-11
- 第一章 緒論11-19
- 1.1 研究背景11-12
- 1.2 自動向量化簡介及研究現(xiàn)狀12-15
- 1.3 開發(fā)平臺選擇15-16
- 1.4 論文的主要工作16-17
- 1.5 論文結構和組織17-19
- 第二章 GCC自動向量化框架分析19-34
- 2.1 GCC編譯結構分析19-23
- 2.2 自動向量化的的框架分析23-33
- 2.2.1 循環(huán)的向量化可行性分析25-30
- 2.2.2 循環(huán)的向量化轉換30-33
- 2.3 本章小結33-34
- 第三章 基于FT-Matrix2的自動向量化實現(xiàn)34-46
- 3.1 FT-Matrix2體系結構34-37
- 3.1.1 FT-Matrix2內(nèi)核結構34-35
- 3.1.2 FT-Matrix2指令集35-37
- 3.2 FT-Matrix2向量后端移植37-41
- 3.2.1 向量寄存器描述37-38
- 3.2.2 向量數(shù)據(jù)機器模式38-41
- 3.3 FT-Matrix2向量指令實現(xiàn)41-45
- 3.3.1 指令映射分析41-42
- 3.3.2 指令映射實現(xiàn)42-45
- 3.4 本章小結45-46
- 第四章 基于FT-Matrix2的向量訪存實現(xiàn)46-57
- 4.1 FT-Matrix2向量訪存介紹與分析46-47
- 4.2 自動向量化的向量訪存實現(xiàn)過程47-48
- 4.3 基于DMA自動傳輸?shù)南蛄吭L存實現(xiàn)48-54
- 4.4 基于SVR傳輸?shù)南蛄吭L存實現(xiàn)54-56
- 4.5 本章小結56-57
- 第五章 基于FT-Matrix2的FFT算法的自動向量化實現(xiàn)57-68
- 5.1 FFT算法介紹及分析57-61
- 5.1.1 FFT算法介紹57-58
- 5.1.2 FFT算法的自動向量化實現(xiàn)分析58-61
- 5.2 實驗結果及性能分析61-67
- 5.3 本章小結67-68
- 第六章 總結與展望68-71
- 6.1 全文總結68-69
- 6.2 展望69-71
- 致謝71-73
- 參考文獻73-77
- 作者在學期間取得的學術成果77
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳明霞;陳火旺;;串行運算向量化初探[J];計算機工程與科學;1980年02期
2 吳明霞,陳火旺;串行運算向量化[J];計算機學報;1981年03期
3 范植華 ,吳健安 ,郭強 ,魏奎超;向量化中的識別指導性指令[J];計算機工程與科學;1985年03期
4 范植華;向量化概論[J];電子學報;1986年03期
5 陳曉樺,楊桃欄;向量化中的分段處理[J];計算機學報;1989年08期
6 李勇;何偉;李秉輝;;地圖向量化的嘗試[J];農(nóng)村電工;2006年04期
7 吳健安;;串行運算向量化綜述[J];計算機工程與科學;1980年03期
8 陳曉樺;分段處理技術在向量化中的應用[J];計算機工程與科學;1986年03期
9 范植華;向量化性態(tài)的比較判別法[J];電子學報;1991年05期
10 黃磊;姚遠;侯永生;楊明;;自動向量化中基于數(shù)據(jù)依賴分析的循環(huán)分布算法[J];計算機科學;2011年09期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 ;用非向量化聚類和預測方法改善“開始-結束”機制的運行效率(英文)[A];第二十屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2003年
2 黃君輝;劉仲;陳躍躍;;一種基于YHFT-Matrix的FFT向量化實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
中國碩士學位論文全文數(shù)據(jù)庫 前7條
1 周羽豐;Matrix2可擴展向量化編譯方法的設計與實現(xiàn)[D];國防科學技術大學;2014年
2 高翔;集成眾核平臺科學計算應用性能測評和優(yōu)化研究[D];國防科學技術大學;2014年
3 夏睿杰;基于FT-Matrix2的自動向量化關鍵技術研究與實現(xiàn)[D];國防科學技術大學;2015年
4 徐穎;編譯指導的自動向量化關鍵技術研究[D];國防科學技術大學;2014年
5 張媛媛;自動向量化中的收益評估技術研究[D];解放軍信息工程大學;2011年
6 索維毅;面向DSP的自動向量化及優(yōu)化技術研究[D];解放軍信息工程大學;2013年
7 徐華葉;多簇VLIW DSP向量化相關編譯技術研究[D];中國科學技術大學;2014年
,本文編號:920387
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/920387.html