天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-09-26 00:15

  本文關(guān)鍵詞:基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)


  更多相關(guān)文章: SIMD 自動(dòng)向量化 向量訪存 DMA


【摘要】:FT-Matrix2 DSP是國(guó)防科技大學(xué)微電子所自主研發(fā)的一款面向圖像處理、視頻和無(wú)線通信的高性能DSP。其采用向量和多發(fā)射超長(zhǎng)指令字體系結(jié)構(gòu)。其中,SIMD指令在FT-Matrix2指令集中的數(shù)量占比達(dá)到了近50%,而這些指令是芯片整體性能得到提升的關(guān)鍵。因此,FT-Matrix2編譯器中SIMD向量化能力直接影響著芯片的運(yùn)行效率。本文基于GCC平臺(tái)研究并實(shí)現(xiàn)了FT-Matrix2編譯器的自動(dòng)向量化技術(shù)。本文根據(jù)FT-Matrix2體系結(jié)構(gòu)特征,通過添加FT-Matrix2向量后端支持以及在自動(dòng)向量化過程中增加DMA自動(dòng)傳輸實(shí)現(xiàn)向量訪存等技術(shù),使得FT-Matrix2編譯器能夠盡量挖掘用戶C程序的自動(dòng)向量化部分,從而提高芯片的運(yùn)行效率。本文的主要工作包括以下幾個(gè)方面:(1)對(duì)GCC的編譯結(jié)構(gòu)、自動(dòng)向量化框架進(jìn)行了深入的分析。首先熟悉了GCC的結(jié)構(gòu)框架,然后定位了自動(dòng)向量化優(yōu)化在GCC內(nèi)部的位置,最后分析了自動(dòng)向量化的的結(jié)構(gòu)框架。通過對(duì)上述問題的深入分析,確定了基于GCC平臺(tái)實(shí)現(xiàn)FT-Matrix2的向量化方法和步驟。(2)基于FT-Matrix2體系結(jié)構(gòu)和指令集,在GCC中實(shí)現(xiàn)了SIMD指令自動(dòng)向量化映射。其主要工作包括:添加向量寄存器描述,向量數(shù)據(jù)機(jī)器模式,向量指令描述,匯編輸出等。(3)基于FT-Matrix2的自動(dòng)向量化訪存實(shí)現(xiàn);贔T-Matrix2體系結(jié)構(gòu)向量訪存的特點(diǎn),在GCC中實(shí)現(xiàn)了基于DMA的自動(dòng)數(shù)據(jù)傳輸功能,使得編譯器能夠根據(jù)向量程序要求自動(dòng)生成向量數(shù)據(jù)搬移代碼,實(shí)現(xiàn)了FT-Matrix2自動(dòng)向量化的向量訪存。(4)基于本文的研究工作,對(duì)DSP常用算法FFT進(jìn)行了自動(dòng)向量化實(shí)現(xiàn),測(cè)試結(jié)果表明:基于FT-Matrix2 Compiler的自動(dòng)向量化較-O2級(jí)優(yōu)化非向量化性能有明顯的提高,而較intrinsic方式向量化性能較低。
【關(guān)鍵詞】:SIMD 自動(dòng)向量化 向量訪存 DMA
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP332
【目錄】:
  • 摘要9-10
  • ABSTRACT10-11
  • 第一章 緒論11-19
  • 1.1 研究背景11-12
  • 1.2 自動(dòng)向量化簡(jiǎn)介及研究現(xiàn)狀12-15
  • 1.3 開發(fā)平臺(tái)選擇15-16
  • 1.4 論文的主要工作16-17
  • 1.5 論文結(jié)構(gòu)和組織17-19
  • 第二章 GCC自動(dòng)向量化框架分析19-34
  • 2.1 GCC編譯結(jié)構(gòu)分析19-23
  • 2.2 自動(dòng)向量化的的框架分析23-33
  • 2.2.1 循環(huán)的向量化可行性分析25-30
  • 2.2.2 循環(huán)的向量化轉(zhuǎn)換30-33
  • 2.3 本章小結(jié)33-34
  • 第三章 基于FT-Matrix2的自動(dòng)向量化實(shí)現(xiàn)34-46
  • 3.1 FT-Matrix2體系結(jié)構(gòu)34-37
  • 3.1.1 FT-Matrix2內(nèi)核結(jié)構(gòu)34-35
  • 3.1.2 FT-Matrix2指令集35-37
  • 3.2 FT-Matrix2向量后端移植37-41
  • 3.2.1 向量寄存器描述37-38
  • 3.2.2 向量數(shù)據(jù)機(jī)器模式38-41
  • 3.3 FT-Matrix2向量指令實(shí)現(xiàn)41-45
  • 3.3.1 指令映射分析41-42
  • 3.3.2 指令映射實(shí)現(xiàn)42-45
  • 3.4 本章小結(jié)45-46
  • 第四章 基于FT-Matrix2的向量訪存實(shí)現(xiàn)46-57
  • 4.1 FT-Matrix2向量訪存介紹與分析46-47
  • 4.2 自動(dòng)向量化的向量訪存實(shí)現(xiàn)過程47-48
  • 4.3 基于DMA自動(dòng)傳輸?shù)南蛄吭L存實(shí)現(xiàn)48-54
  • 4.4 基于SVR傳輸?shù)南蛄吭L存實(shí)現(xiàn)54-56
  • 4.5 本章小結(jié)56-57
  • 第五章 基于FT-Matrix2的FFT算法的自動(dòng)向量化實(shí)現(xiàn)57-68
  • 5.1 FFT算法介紹及分析57-61
  • 5.1.1 FFT算法介紹57-58
  • 5.1.2 FFT算法的自動(dòng)向量化實(shí)現(xiàn)分析58-61
  • 5.2 實(shí)驗(yàn)結(jié)果及性能分析61-67
  • 5.3 本章小結(jié)67-68
  • 第六章 總結(jié)與展望68-71
  • 6.1 全文總結(jié)68-69
  • 6.2 展望69-71
  • 致謝71-73
  • 參考文獻(xiàn)73-77
  • 作者在學(xué)期間取得的學(xué)術(shù)成果77

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 吳明霞;陳火旺;;串行運(yùn)算向量化初探[J];計(jì)算機(jī)工程與科學(xué);1980年02期

2 吳明霞,陳火旺;串行運(yùn)算向量化[J];計(jì)算機(jī)學(xué)報(bào);1981年03期

3 范植華 ,吳健安 ,郭強(qiáng) ,魏奎超;向量化中的識(shí)別指導(dǎo)性指令[J];計(jì)算機(jī)工程與科學(xué);1985年03期

4 范植華;向量化概論[J];電子學(xué)報(bào);1986年03期

5 陳曉樺,楊桃欄;向量化中的分段處理[J];計(jì)算機(jī)學(xué)報(bào);1989年08期

6 李勇;何偉;李秉輝;;地圖向量化的嘗試[J];農(nóng)村電工;2006年04期

7 吳健安;;串行運(yùn)算向量化綜述[J];計(jì)算機(jī)工程與科學(xué);1980年03期

8 陳曉樺;分段處理技術(shù)在向量化中的應(yīng)用[J];計(jì)算機(jī)工程與科學(xué);1986年03期

9 范植華;向量化性態(tài)的比較判別法[J];電子學(xué)報(bào);1991年05期

10 黃磊;姚遠(yuǎn);侯永生;楊明;;自動(dòng)向量化中基于數(shù)據(jù)依賴分析的循環(huán)分布算法[J];計(jì)算機(jī)科學(xué);2011年09期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條

1 ;用非向量化聚類和預(yù)測(cè)方法改善“開始-結(jié)束”機(jī)制的運(yùn)行效率(英文)[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年

2 黃君輝;劉仲;陳躍躍;;一種基于YHFT-Matrix的FFT向量化實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條

1 周羽豐;Matrix2可擴(kuò)展向量化編譯方法的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年

2 高翔;集成眾核平臺(tái)科學(xué)計(jì)算應(yīng)用性能測(cè)評(píng)和優(yōu)化研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年

3 夏睿杰;基于FT-Matrix2的自動(dòng)向量化關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年

4 徐穎;編譯指導(dǎo)的自動(dòng)向量化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年

5 張媛媛;自動(dòng)向量化中的收益評(píng)估技術(shù)研究[D];解放軍信息工程大學(xué);2011年

6 索維毅;面向DSP的自動(dòng)向量化及優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年

7 徐華葉;多簇VLIW DSP向量化相關(guān)編譯技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

,

本文編號(hào):920387

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/920387.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0b98a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com