基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計(jì)
本文關(guān)鍵詞:基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計(jì),由筆耕文化傳播整理發(fā)布。
【摘要】:在現(xiàn)代處理器設(shè)計(jì)中,隨著多媒體處理、DSP信號(hào)處理、3D圖形處理的廣泛應(yīng)用,支持SIMD計(jì)算的向量運(yùn)算單元越來越突出其重要的地位。向量運(yùn)算單元往往具有較大的實(shí)現(xiàn)面積,同時(shí)大多也處于計(jì)算的關(guān)鍵路徑之中,其設(shè)計(jì)方案直接影響著整個(gè)CPU的性能。本文針對(duì)IBM的POWER處理器的128位SIMD復(fù)雜向量算術(shù)(Vector Complex)指令架構(gòu),給出了一種高性能的基于亞字并行技術(shù)的實(shí)現(xiàn)方案。本文的128位SIMD算術(shù)單元兼容POWER指令集中的27條向量類指令,包括向量乘、向量乘加/乘累加和向量累加3大類指令,支持定點(diǎn)飽和操作,運(yùn)算過程在6個(gè)時(shí)鐘周期內(nèi)完成。本設(shè)計(jì)由3大部分組成:亞字并行乘加器、選擇部件和累加器,其中設(shè)計(jì)的核心部件是亞字并行乘加器。根據(jù)指令集的功能,SIMD算術(shù)單元需要實(shí)現(xiàn)4個(gè)32-bit的亞字并行乘加器。每個(gè)乘加器支持1個(gè)32×32-bit,2個(gè)16×16-bit或者4個(gè)8×8-bit的有符號(hào)/無符號(hào)操作,其中在8-bit模式下還支持混合符號(hào)(有符號(hào)×無符號(hào))操作,并且在16-bit模式下支持有符號(hào)操作的飽和判斷。本文對(duì)亞字并行乘加器的關(guān)鍵部件進(jìn)行了詳細(xì)的設(shè)計(jì),每個(gè)部件都給出了多種實(shí)現(xiàn)方法。部分積生成部件給出了2種實(shí)現(xiàn)方法,其中,混合亞字并行法的實(shí)現(xiàn)不用考慮進(jìn)位鏈的傳播,相應(yīng)的壓縮器和加法器也得到簡化,電路邏輯簡單;布思選擇法可以使部分積的數(shù)目減少一半,大大減少壓縮時(shí)電路的時(shí)延。壓縮部件的實(shí)現(xiàn),首先對(duì)3-2壓縮器和4-2壓縮器進(jìn)行改進(jìn)使其適應(yīng)3種模式的壓縮,并采用改進(jìn)型的Wallace樹型結(jié)構(gòu)進(jìn)行壓縮,壓縮部件只需增加少量控制邏輯就能在支持多種模式的同時(shí)而不增加額外的時(shí)延。加法器的結(jié)構(gòu)選擇了綜合性能突出的LF并行前綴加法器,對(duì)其采用進(jìn)位截?cái)鄼C(jī)制實(shí)現(xiàn)亞字并行功能。飽和判斷部分,給出了基礎(chǔ)加減法飽和判斷方法,并對(duì)其經(jīng)行了優(yōu)化,接著分析了乘加運(yùn)算預(yù)判斷溢出技術(shù),并結(jié)合指令集給出了適合本設(shè)計(jì)的飽和判斷方法。按照本文給出的亞字并行技術(shù),可以以較小的實(shí)現(xiàn)代價(jià)完成任意位寬的高性能乘/乘加單元。本設(shè)計(jì)為6級(jí)流水線結(jié)構(gòu),使用UVM平臺(tái)進(jìn)行驗(yàn)證,在DC綜合工具的環(huán)境及使用0.18μm SIMC工藝庫下,128位SIMD算術(shù)單元的面積為590015(μm2),最高頻率可達(dá)350MHz。對(duì)比普通乘加器,本設(shè)計(jì)的亞字并行乘加器可實(shí)現(xiàn)多種復(fù)雜的向量算術(shù)運(yùn)算。綜合結(jié)果表明,較之普通乘加器,時(shí)延只增加了9.1%,同時(shí)面積只增加了5.9%。在SIMD運(yùn)算中,和傳統(tǒng)的乘法/乘加器相比,本文提出的高性能亞字并行技術(shù)具有明顯的技術(shù)優(yōu)勢,能夠滿足各種高性能CPU的向量計(jì)算要求。
【關(guān)鍵詞】:SIMD 亞字并行 乘/乘加 booth算法 加法
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP332.2
【目錄】:
- 摘要5-6
- ABSTRACT6-11
- 縮略語對(duì)照表11-14
- 第一章 緒論14-20
- 1.1 研究背景與意義14-15
- 1.2 亞字并行SIMD運(yùn)算部件的主要研究現(xiàn)狀15-18
- 1.2.1 加法算法15-16
- 1.2.2 乘法算法16-17
- 1.2.3 有限域乘法算法17-18
- 1.3 論文的主要工作和組織18-20
- 第二章 SIMD算術(shù)單元涉及的相關(guān)理論20-32
- 2.1 基本乘法理論20-22
- 2.1.1 無符號(hào)乘法20
- 2.1.2 有符號(hào)乘法20-22
- 2.2 布思算法22-27
- 2.2.1 基2布思算法22-23
- 2.2.2 基4布思算法23-27
- 2.3 壓縮器27-31
- 2.3.1 3-2 壓縮器27-28
- 2.3.2 4-2 壓縮器28-31
- 2.4 小結(jié)31-32
- 第三章 SIMD算術(shù)單元的總體設(shè)計(jì)32-38
- 3.1 SIMD算術(shù)單元所支持的指令集32-34
- 3.2 SIMD算術(shù)單元的總體設(shè)計(jì)34-38
- 第四章 SIMD算術(shù)單元關(guān)鍵部件設(shè)計(jì)38-70
- 4.1 亞字并行乘加器設(shè)計(jì)38-65
- 4.1.1 亞字并行乘加部分積生成39-48
- 4.1.2 加數(shù)生成器48-49
- 4.1.3 部分積壓縮器49-53
- 4.1.4 亞字并行加法器53-59
- 4.1.5 飽和判斷單元59-65
- 4.2 選擇器功能部件65
- 4.2.1 select4選擇器65
- 4.2.2 select0-3 選擇器65
- 4.3 累加器設(shè)計(jì)65-69
- 4.3.1 加數(shù)擴(kuò)展67
- 4.3.2 壓縮操作數(shù)67
- 4.3.3 加法器67-68
- 4.3.4 飽和判斷68-69
- 4.4 小結(jié)69-70
- 第五章 SIMD算術(shù)單元的流水線設(shè)計(jì)與驗(yàn)證綜合70-84
- 5.1 SIMD算術(shù)單元的流水線設(shè)計(jì)70-74
- 5.1.1 流水線設(shè)計(jì)策略70-72
- 5.1.2 算術(shù)單元的流水線設(shè)計(jì)72-74
- 5.2 SIMD算術(shù)單元的驗(yàn)證74-77
- 5.2.1 UVM驗(yàn)證方法學(xué)74-75
- 5.2.2 算術(shù)單元的驗(yàn)證75-77
- 5.3 SIMD算術(shù)單元的綜合77-82
- 5.3.1 綜合概述及綜合策略77-79
- 5.3.2 算術(shù)單元的綜合79-82
- 5.4 小結(jié)82-84
- 第六章 總結(jié)與展望84-86
- 6.1 對(duì)本設(shè)計(jì)的總結(jié)84
- 6.2 進(jìn)一步的工作84-86
- 參考文獻(xiàn)86-88
- 致謝88-90
- 作者簡介90-91
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計(jì)算機(jī)學(xué)報(bào);2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計(jì)算機(jī)與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應(yīng)用[J];計(jì)算機(jī)工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴(kuò)展部件的循環(huán)優(yōu)化研究[J];計(jì)算機(jī)科學(xué);2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計(jì)算機(jī)科學(xué)與探索;2009年01期
6 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計(jì)[J];微電子學(xué)與計(jì)算機(jī);2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴(kuò)展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學(xué)學(xué)報(bào);2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計(jì)研究[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計(jì)算機(jī)工程與應(yīng)用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計(jì)算機(jī)工程;2009年10期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗(yàn)證[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠(yuǎn);;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語句轉(zhuǎn)化方法[A];2009年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 朱明慧;;ADI浮點(diǎn)DSP軟件編程中的指令并行與SIMD應(yīng)用[A];中國航空學(xué)會(huì)信號(hào)與信息處理專業(yè)全國第八屆學(xué)術(shù)會(huì)議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點(diǎn)視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導(dǎo)航學(xué)術(shù)年會(huì)論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點(diǎn)乘加器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
2 侯永生;多重循環(huán)SIMD向量化方法及性能優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2014年
3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2006年
4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年
5 張凱;向量SIMD DSP上高效矩陣運(yùn)算技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
6 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年
7 姜偉華;針對(duì)實(shí)際多媒體程序和多媒體擴(kuò)展指令集的SIMD編譯優(yōu)化[D];復(fù)旦大學(xué);2005年
8 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 黃勝兵;面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2016年
2 胡辰;基于異構(gòu)SIMD并行的高分辨率星載SAR原始數(shù)據(jù)快速模擬研究[D];北京化工大學(xué);2016年
3 李國君;基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究[D];北京化工大學(xué);2016年
4 徐沛文;32位高性能DSP SIMD向量存儲(chǔ)器的設(shè)計(jì)和驗(yàn)證[D];國防科學(xué)技術(shù)大學(xué);2015年
5 單佳坤;基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計(jì)[D];西安電子科技大學(xué);2016年
6 張倩;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[D];復(fù)旦大學(xué);2008年
7 李璋輝;支持浮點(diǎn)融合乘加的SIMD運(yùn)算部件設(shè)計(jì)優(yōu)化及實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年
8 楊明;基于存儲(chǔ)訪問的SIMD優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2011年
9 劉楷;基于SIMD結(jié)構(gòu)的高性能DSP處理器評(píng)測程序的優(yōu)化與實(shí)現(xiàn)[D];西安電子科技大學(xué);2012年
10 陳向;SIMD數(shù)據(jù)置換指令的自動(dòng)生成與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2010年
本文關(guān)鍵詞:基于亞字并行技術(shù)的128位SIMD算術(shù)單元設(shè)計(jì),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):255499
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/255499.html