基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計
本文關(guān)鍵詞:基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計,由筆耕文化傳播整理發(fā)布。
【摘要】:在現(xiàn)代處理器設(shè)計中,隨著多媒體處理、DSP信號處理、3D圖形處理的廣泛應(yīng)用,支持SIMD計算的向量運算單元越來越突出其重要的地位。向量運算單元往往具有較大的實現(xiàn)面積,同時大多也處于計算的關(guān)鍵路徑之中,其設(shè)計方案直接影響著整個CPU的性能。本文針對IBM的POWER處理器的128位SIMD復(fù)雜向量算術(shù)(Vector Complex)指令架構(gòu),給出了一種高性能的基于亞字并行技術(shù)的實現(xiàn)方案。本文的128位SIMD算術(shù)單元兼容POWER指令集中的27條向量類指令,包括向量乘、向量乘加/乘累加和向量累加3大類指令,支持定點飽和操作,運算過程在6個時鐘周期內(nèi)完成。本設(shè)計由3大部分組成:亞字并行乘加器、選擇部件和累加器,其中設(shè)計的核心部件是亞字并行乘加器。根據(jù)指令集的功能,SIMD算術(shù)單元需要實現(xiàn)4個32-bit的亞字并行乘加器。每個乘加器支持1個32×32-bit,2個16×16-bit或者4個8×8-bit的有符號/無符號操作,其中在8-bit模式下還支持混合符號(有符號×無符號)操作,并且在16-bit模式下支持有符號操作的飽和判斷。本文對亞字并行乘加器的關(guān)鍵部件進行了詳細(xì)的設(shè)計,每個部件都給出了多種實現(xiàn)方法。部分積生成部件給出了2種實現(xiàn)方法,其中,混合亞字并行法的實現(xiàn)不用考慮進位鏈的傳播,相應(yīng)的壓縮器和加法器也得到簡化,電路邏輯簡單;布思選擇法可以使部分積的數(shù)目減少一半,大大減少壓縮時電路的時延。壓縮部件的實現(xiàn),首先對3-2壓縮器和4-2壓縮器進行改進使其適應(yīng)3種模式的壓縮,并采用改進型的Wallace樹型結(jié)構(gòu)進行壓縮,壓縮部件只需增加少量控制邏輯就能在支持多種模式的同時而不增加額外的時延。加法器的結(jié)構(gòu)選擇了綜合性能突出的LF并行前綴加法器,對其采用進位截斷機制實現(xiàn)亞字并行功能。飽和判斷部分,給出了基礎(chǔ)加減法飽和判斷方法,并對其經(jīng)行了優(yōu)化,接著分析了乘加運算預(yù)判斷溢出技術(shù),并結(jié)合指令集給出了適合本設(shè)計的飽和判斷方法。按照本文給出的亞字并行技術(shù),可以以較小的實現(xiàn)代價完成任意位寬的高性能乘/乘加單元。本設(shè)計為6級流水線結(jié)構(gòu),使用UVM平臺進行驗證,在DC綜合工具的環(huán)境及使用0.18μm SIMC工藝庫下,128位SIMD算術(shù)單元的面積為590015(μm2),最高頻率可達350MHz。對比普通乘加器,本設(shè)計的亞字并行乘加器可實現(xiàn)多種復(fù)雜的向量算術(shù)運算。綜合結(jié)果表明,較之普通乘加器,時延只增加了9.1%,同時面積只增加了5.9%。在SIMD運算中,和傳統(tǒng)的乘法/乘加器相比,本文提出的高性能亞字并行技術(shù)具有明顯的技術(shù)優(yōu)勢,能夠滿足各種高性能CPU的向量計算要求。
【關(guān)鍵詞】:SIMD 亞字并行 乘/乘加 booth算法 加法
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP332.2
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 縮略語對照表11-14
- 第一章 緒論14-20
- 1.1 研究背景與意義14-15
- 1.2 亞字并行SIMD運算部件的主要研究現(xiàn)狀15-18
- 1.2.1 加法算法15-16
- 1.2.2 乘法算法16-17
- 1.2.3 有限域乘法算法17-18
- 1.3 論文的主要工作和組織18-20
- 第二章 SIMD算術(shù)單元涉及的相關(guān)理論20-32
- 2.1 基本乘法理論20-22
- 2.1.1 無符號乘法20
- 2.1.2 有符號乘法20-22
- 2.2 布思算法22-27
- 2.2.1 基2布思算法22-23
- 2.2.2 基4布思算法23-27
- 2.3 壓縮器27-31
- 2.3.1 3-2 壓縮器27-28
- 2.3.2 4-2 壓縮器28-31
- 2.4 小結(jié)31-32
- 第三章 SIMD算術(shù)單元的總體設(shè)計32-38
- 3.1 SIMD算術(shù)單元所支持的指令集32-34
- 3.2 SIMD算術(shù)單元的總體設(shè)計34-38
- 第四章 SIMD算術(shù)單元關(guān)鍵部件設(shè)計38-70
- 4.1 亞字并行乘加器設(shè)計38-65
- 4.1.1 亞字并行乘加部分積生成39-48
- 4.1.2 加數(shù)生成器48-49
- 4.1.3 部分積壓縮器49-53
- 4.1.4 亞字并行加法器53-59
- 4.1.5 飽和判斷單元59-65
- 4.2 選擇器功能部件65
- 4.2.1 select4選擇器65
- 4.2.2 select0-3 選擇器65
- 4.3 累加器設(shè)計65-69
- 4.3.1 加數(shù)擴展67
- 4.3.2 壓縮操作數(shù)67
- 4.3.3 加法器67-68
- 4.3.4 飽和判斷68-69
- 4.4 小結(jié)69-70
- 第五章 SIMD算術(shù)單元的流水線設(shè)計與驗證綜合70-84
- 5.1 SIMD算術(shù)單元的流水線設(shè)計70-74
- 5.1.1 流水線設(shè)計策略70-72
- 5.1.2 算術(shù)單元的流水線設(shè)計72-74
- 5.2 SIMD算術(shù)單元的驗證74-77
- 5.2.1 UVM驗證方法學(xué)74-75
- 5.2.2 算術(shù)單元的驗證75-77
- 5.3 SIMD算術(shù)單元的綜合77-82
- 5.3.1 綜合概述及綜合策略77-79
- 5.3.2 算術(shù)單元的綜合79-82
- 5.4 小結(jié)82-84
- 第六章 總結(jié)與展望84-86
- 6.1 對本設(shè)計的總結(jié)84
- 6.2 進一步的工作84-86
- 參考文獻86-88
- 致謝88-90
- 作者簡介90-91
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計算機學(xué)報;2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計算機與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應(yīng)用[J];計算機工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴展部件的循環(huán)優(yōu)化研究[J];計算機科學(xué);2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計算機科學(xué)與探索;2009年01期
6 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計[J];微電子學(xué)與計算機;2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學(xué)學(xué)報;2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計研究[J];浙江大學(xué)學(xué)報(工學(xué)版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計算機工程與應(yīng)用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計算機工程;2009年10期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠(yuǎn);;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語句轉(zhuǎn)化方法[A];2009年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2009年
4 朱明慧;;ADI浮點DSP軟件編程中的指令并行與SIMD應(yīng)用[A];中國航空學(xué)會信號與信息處理專業(yè)全國第八屆學(xué)術(shù)會議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導(dǎo)航學(xué)術(shù)年會論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設(shè)計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
2 侯永生;多重循環(huán)SIMD向量化方法及性能優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2014年
3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2006年
4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年
5 張凱;向量SIMD DSP上高效矩陣運算技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
6 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年
7 姜偉華;針對實際多媒體程序和多媒體擴展指令集的SIMD編譯優(yōu)化[D];復(fù)旦大學(xué);2005年
8 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 黃勝兵;面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2016年
2 胡辰;基于異構(gòu)SIMD并行的高分辨率星載SAR原始數(shù)據(jù)快速模擬研究[D];北京化工大學(xué);2016年
3 李國君;基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究[D];北京化工大學(xué);2016年
4 徐沛文;32位高性能DSP SIMD向量存儲器的設(shè)計和驗證[D];國防科學(xué)技術(shù)大學(xué);2015年
5 單佳坤;基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計[D];西安電子科技大學(xué);2016年
6 張倩;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[D];復(fù)旦大學(xué);2008年
7 李璋輝;支持浮點融合乘加的SIMD運算部件設(shè)計優(yōu)化及實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年
8 楊明;基于存儲訪問的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
9 劉楷;基于SIMD結(jié)構(gòu)的高性能DSP處理器評測程序的優(yōu)化與實現(xiàn)[D];西安電子科技大學(xué);2012年
10 陳向;SIMD數(shù)據(jù)置換指令的自動生成與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2010年
本文關(guān)鍵詞:基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計,,由筆耕文化傳播整理發(fā)布。
本文編號:255499
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/255499.html