天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

浮點(diǎn)運(yùn)算加速器的設(shè)計(jì)研究

發(fā)布時(shí)間:2018-01-15 06:28

  本文關(guān)鍵詞:浮點(diǎn)運(yùn)算加速器的設(shè)計(jì)研究 出處:《浙江大學(xué)》2013年碩士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 浮點(diǎn)數(shù)運(yùn)算器 融合乘加 乘累加 單周期累加算法 SIMD 操作數(shù)隔離 門控時(shí)鐘


【摘要】:信息社會(huì)的發(fā)展使得科學(xué)研究、工業(yè)生產(chǎn)、人工智能以及3D游戲等應(yīng)用都對(duì)浮點(diǎn)運(yùn)算性能提出了更高的要求。因此低延遲高吞吐的浮點(diǎn)數(shù)運(yùn)算單元是各類處理器設(shè)計(jì)中的關(guān)鍵部件。 在研究了傳統(tǒng)的浮點(diǎn)加法器,浮點(diǎn)乘法器以及浮點(diǎn)融合乘加器的架構(gòu)與實(shí)現(xiàn)方法后,本文基于一種單周期累加算法,改進(jìn)了浮點(diǎn)運(yùn)算單元的經(jīng)典結(jié)構(gòu),在流水線中添加一條累加環(huán)路,通過(guò)進(jìn)位保留算法使最終求和與規(guī)格化模塊后置,實(shí)現(xiàn)了可在一個(gè)周期內(nèi)完成浮點(diǎn)加法運(yùn)算的累加模塊,大幅提高了運(yùn)算單元處理向量點(diǎn)乘時(shí)的效率,達(dá)到每周期一次浮點(diǎn)乘加。同時(shí)為了滿足更多場(chǎng)合的需求,采用資源復(fù)用的設(shè)計(jì)支持SIMD運(yùn)算,使其兼容雙精度浮點(diǎn)數(shù)、兩組單精度浮點(diǎn)數(shù),32位有符號(hào)數(shù)以及兩組16位有符號(hào)數(shù),可執(zhí)行加法,乘法,融合乘加和連續(xù)乘累加四種操作,并對(duì)乘法器、前導(dǎo)零檢測(cè)等模塊做了優(yōu)化,以降低延遲與面積。最后針對(duì)該結(jié)構(gòu)的數(shù)據(jù)流特性,采取了操作數(shù)隔離與門控時(shí)鐘的低功耗技術(shù)。 本文采用SystemVerilog語(yǔ)言搭建驗(yàn)證平臺(tái),生成帶約束的隨機(jī)測(cè)試向量并自動(dòng)檢驗(yàn)結(jié)果,保證了代碼覆蓋率的要求。在SMIC0.13um的邏輯工藝下頻率達(dá)到400MHz,電路規(guī)模等效于58.4k個(gè)與非門。通過(guò)門級(jí)網(wǎng)表仿真得出加入低功耗設(shè)計(jì)后動(dòng)態(tài)功耗為54.8mW,降低了24.1%。
[Abstract]:With the development of information society, the applications of scientific research, industrial production, AI and 3D games have raised higher requirements for the performance of floating-point operation. Therefore, the floating point arithmetic units with low latency and high throughput are the key components in the design of all kinds of processors.
In the study of traditional floating point adder, and the realization method of Floating-Point Multiplier and floating point multiply add fused device structure, in this paper, a single cycle accumulation algorithm based on improved classical structure of FPU, add a loop accumulated in the pipeline, carry through retention so that the final sum algorithm module and post specifications the module can be completed, the cumulative floating point addition operation in a period, a substantial increase in the operational efficiency of the unit vector multiplication per cycle, a floating point multiply add. At the same time in order to meet the needs of more occasions, the design resource reuse support SIMD operations, making it compatible with double precision floating-point number. Two sets of single precision floating point, 32 of the number of symbols and two sets of 16 of the number of symbols, can perform addition, multiplication, multiply add fused and continuous multiply accumulate four kinds of operation, and the multiplier, lead zero detection module Optimization is done to reduce the delay and area. Finally, in view of the data flow characteristics of the structure, the low power technology of operating number isolation and gating clock is adopted.
The verification platform is constructed using SystemVerilog language to generate constrained random test vectors and automatic inspection results, ensure the code coverage requirements. In the logic process of SMIC0.13um under the frequency of 400MHz, the circuit scale is equivalent to the 58.4k NAND gate level netlist. Through simulation to low power design of dynamic power consumption of 54.8mW, reduce the 24.1%.

【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:TP332.2

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朱玉田,,徐君;高效浮點(diǎn)FFT的匯編語(yǔ)言程序編制[J];計(jì)算機(jī)應(yīng)用研究;1996年05期

2 ;高速浮點(diǎn)處理器[J];計(jì)算機(jī)工程與應(yīng)用;1983年03期

3 傅斌;486DLC一個(gè)浮點(diǎn)問(wèn)題的解決辦法[J];電腦;1996年01期

4 ;SGI TFP──最高浮點(diǎn)性能的RISC微處理器[J];導(dǎo)彈與航天運(yùn)載技術(shù);1994年01期

5 于春;浮點(diǎn)BASIC語(yǔ)言編程技巧[J];家用電器.消費(fèi);1994年09期

6 李五文;一個(gè)奇怪的CORE DUMP問(wèn)題[J];電子科技;1998年07期

7 王建農(nóng);PL/M-51軟件中實(shí)現(xiàn)浮點(diǎn)運(yùn)算的方法[J];內(nèi)蒙古科技與經(jīng)濟(jì);2005年09期

8 周少武;如何安全創(chuàng)建TSR程序[J];湘潭工學(xué)院學(xué)報(bào);1996年03期

9 ;讓你的夢(mèng)想加個(gè)“倍”──K6-2 3D now![J];軟件世界;1998年01期

10 李偉;MMX2正在向時(shí)代走來(lái)[J];現(xiàn)代電子技術(shù);1998年06期

相關(guān)會(huì)議論文 前10條

1 閔銀皮;倪曉強(qiáng);邢座程;;多線程向量浮點(diǎn)部件的驗(yàn)證方法[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

2 鄧中華;仲偉亞;;DZH-16B多功能浮點(diǎn)地震儀在工程物探中的應(yīng)用[A];1995年中國(guó)地球物理學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];1995年

3 蔣景紅;楊力;蔡惠智;侯衛(wèi)民;;GPU在實(shí)時(shí)信號(hào)處理系統(tǒng)中應(yīng)用的可行性研究[A];2009年全國(guó)水聲學(xué)學(xué)術(shù)交流暨水聲學(xué)分會(huì)換屆改選會(huì)議論文集[C];2009年

4 陳敏;喬清泉;劉華東;丁善兵;;大空間、大跨度框架結(jié)構(gòu)無(wú)黏結(jié)預(yù)應(yīng)力現(xiàn)澆空心樓蓋施工[A];建設(shè)工程混凝土應(yīng)用新技術(shù)[C];2009年

5 王曉光;昃琳;劉濤;;CUDA構(gòu)筑廉價(jià)的高性能計(jì)算平臺(tái)[A];信息時(shí)代——科技情報(bào)研究學(xué)術(shù)論文集(第三輯)[C];2008年

6 Erik Hagersten;鄧錫銀;;幫軟件找尋內(nèi)存墻之門(第一部分)[A];工程三維模型與虛擬現(xiàn)實(shí)表現(xiàn)——第二屆工程建設(shè)計(jì)算機(jī)應(yīng)用創(chuàng)新論壇論文集[C];2009年

7 陳虹;宋磊;吳國(guó)清;;大規(guī)模數(shù)值模擬數(shù)據(jù)的無(wú)損壓縮[A];中國(guó)工程物理研究院科技年報(bào)(2005)[C];2005年

8 朱紅麗;;數(shù)字音頻廣播系統(tǒng)模型和硬件仿真[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(3)[C];2008年

9 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細(xì)粒度并行結(jié)構(gòu)與實(shí)現(xiàn)[A];2010年第16屆全國(guó)信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年

10 金紅新;吳簡(jiǎn)彤;劉鳳舉;;基于DSP的捷聯(lián)導(dǎo)航計(jì)算機(jī)系統(tǒng)的硬件設(shè)計(jì)[A];2004年船舶儀器儀表學(xué)術(shù)年會(huì)論文集[C];2004年

相關(guān)重要報(bào)紙文章 前10條

1 計(jì)算機(jī)世界實(shí)驗(yàn)室 盤(pán)駿;實(shí)力的證明[N];計(jì)算機(jī)世界;2011年

2 001pc.com;按應(yīng)用需求選擇CPU[N];中國(guó)計(jì)算機(jī)報(bào);2001年

3 ;用了PowerPC G4的高端彩激[N];中國(guó)計(jì)算機(jī)報(bào);2006年

4 尚云山;AMD推首款高檔專用“顯卡”[N];電子資訊時(shí)報(bào);2007年

5 廣西 姑蘇飄雪;“呼喚”渲染世界真色彩[N];電腦報(bào);2004年

6 廣東 林鳴;從4004到Athlon64(三)[N];電腦報(bào);2004年

7 斯諾;PC按誰(shuí)的規(guī)則玩[N];中國(guó)經(jīng)營(yíng)報(bào);2001年

8 王寒輝;透視 CPU 的性能[N];中國(guó)電腦教育報(bào);2000年

9 Eliot;推倒重來(lái)[N];中國(guó)電腦教育報(bào);2003年

10 IT Boy;下一站天王NVIDIA?[N];中國(guó)電腦教育報(bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 陳立前;基于區(qū)間線性抽象域的可靠浮點(diǎn)及非凸靜態(tài)分析[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

2 姜浩;高精度可靠浮點(diǎn)計(jì)算及舍入誤差分析研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

3 姜忠鼎;基于深度全景視頻的虛擬場(chǎng)景繪制技術(shù)研究[D];浙江大學(xué);2004年

4 田紅麗;可重構(gòu)計(jì)算系統(tǒng)芯片中的動(dòng)態(tài)數(shù)據(jù)調(diào)度模型及部件的研究[D];河北工業(yè)大學(xué);2011年

5 張林生;數(shù)字信號(hào)處理系統(tǒng)的定點(diǎn)化技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年

6 杜學(xué)亮;定制指令與協(xié)處理器加速機(jī)制的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

7 王超;先進(jìn)電力錄波系統(tǒng)信息處理與數(shù)據(jù)壓縮技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年

8 徐曉東;基于CCSDS IDC星載圖像壓縮算法的FPGA實(shí)現(xiàn)技術(shù)[D];山東大學(xué);2011年

9 吳東暉;智能移動(dòng)機(jī)器人的視覺(jué)導(dǎo)航技術(shù)[D];浙江大學(xué);2001年

10 韓澤耀;高速高性能FFT處理器的VLSI實(shí)現(xiàn)研究[D];浙江大學(xué);2002年

相關(guān)碩士學(xué)位論文 前10條

1 李叢;LEON3浮點(diǎn)部件控制器的研究與實(shí)現(xiàn)[D];大連理工大學(xué);2010年

2 姜加紅;面向浮點(diǎn)C程序的區(qū)間分析方法[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年

3 田甜;FT-XDSP中高性能SIMD浮點(diǎn)乘加單元的研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

4 羅雪茍;COFDM傳輸系統(tǒng)IFFT/FFT算法研究與FPGA實(shí)現(xiàn)[D];西安電子科技大學(xué);2002年

5 何偉;設(shè)計(jì)高性能浮點(diǎn)加法器[D];合肥工業(yè)大學(xué);2004年

6 劉凌;P1750A浮點(diǎn)執(zhí)行部件的設(shè)計(jì)與實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2001年

7 楊國(guó)剛;機(jī)器人大腦浮點(diǎn)化及其半物理仿真架構(gòu)研究[D];長(zhǎng)安大學(xué);2011年

8 程俊;浮點(diǎn)FFT的VHDL實(shí)現(xiàn)及HDL功能測(cè)試方法的研究[D];湖南大學(xué);2004年

9 許向榮;基于DSP的便攜式雙通道信號(hào)分析儀的研究[D];華北電力大學(xué)(河北);2003年

10 張博為;可重構(gòu)系統(tǒng)中快速高斯消元算法的并行硬件體系實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2009年



本文編號(hào):1427199

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1427199.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2c1ad***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com