流水的浮點(diǎn)倒數(shù)近似值運(yùn)算部件的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-07-21 09:22
在部分低精度浮點(diǎn)運(yùn)算應(yīng)用中,需要流水的浮點(diǎn)倒數(shù)近似值運(yùn)算。本文基于SRT-4算法設(shè)計(jì)并實(shí)現(xiàn)了一種流水的浮點(diǎn)倒數(shù)近似值運(yùn)算部件。該部件采用6級流水線結(jié)構(gòu),運(yùn)算結(jié)果精度至少為8位有效尾數(shù)。為了支持對非規(guī)格化浮點(diǎn)數(shù)的硬件處理,還設(shè)計(jì)并實(shí)現(xiàn)了改進(jìn)版,有利于進(jìn)一步提高浮點(diǎn)倒數(shù)近似值運(yùn)算的性能。改進(jìn)版采用8級流水線結(jié)構(gòu),新增了源操作數(shù)預(yù)規(guī)格化和結(jié)果后規(guī)格化功能模塊,可以實(shí)現(xiàn)對非規(guī)格化浮點(diǎn)數(shù)的硬件處理。經(jīng)過邏輯綜合評估,改進(jìn)版的硬件開銷是面積在合理范圍內(nèi)增加19.23%,且對時(shí)序沒有明顯影響,可以滿足預(yù)期的1.6 GHz頻率設(shè)計(jì)目標(biāo)。
【文章來源】:國防科技大學(xué)學(xué)報(bào). 2020,42(02)北大核心EICSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
SRT-4商值選擇函數(shù)的實(shí)現(xiàn)
圖1 SRT-4商值選擇函數(shù)的實(shí)現(xiàn)對于一次SRT-4迭代來說,其實(shí)現(xiàn)原理如圖2所示。查表得到的商數(shù)q采用3位編碼表示。根據(jù)商數(shù)q,選擇得到多倍除數(shù),并利用進(jìn)位保留加法器(CSA3B2)得到更新后的部分余數(shù)Carry和Sum;同時(shí)并行得到最新的商。這里商也采用了冗余形式保存在兩個(gè)寄存器Q和Qm中,兩者始終相差1,即Qm=Q-1。利用飛速轉(zhuǎn)換(on-the-fly)技術(shù)[14],每得到商數(shù)q,就對當(dāng)前的寄存器Q和Qm值進(jìn)行更新,得到新的商。其轉(zhuǎn)換表參見表 2,由SRT4_QQM模塊實(shí)現(xiàn)。
FREC部件結(jié)構(gòu)
【參考文獻(xiàn)】:
碩士論文
[1]X微處理器FPU的設(shè)計(jì)與實(shí)現(xiàn)[D]. 付仲滿.國防科學(xué)技術(shù)大學(xué) 2005
本文編號:3294760
【文章來源】:國防科技大學(xué)學(xué)報(bào). 2020,42(02)北大核心EICSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
SRT-4商值選擇函數(shù)的實(shí)現(xiàn)
圖1 SRT-4商值選擇函數(shù)的實(shí)現(xiàn)對于一次SRT-4迭代來說,其實(shí)現(xiàn)原理如圖2所示。查表得到的商數(shù)q采用3位編碼表示。根據(jù)商數(shù)q,選擇得到多倍除數(shù),并利用進(jìn)位保留加法器(CSA3B2)得到更新后的部分余數(shù)Carry和Sum;同時(shí)并行得到最新的商。這里商也采用了冗余形式保存在兩個(gè)寄存器Q和Qm中,兩者始終相差1,即Qm=Q-1。利用飛速轉(zhuǎn)換(on-the-fly)技術(shù)[14],每得到商數(shù)q,就對當(dāng)前的寄存器Q和Qm值進(jìn)行更新,得到新的商。其轉(zhuǎn)換表參見表 2,由SRT4_QQM模塊實(shí)現(xiàn)。
FREC部件結(jié)構(gòu)
【參考文獻(xiàn)】:
碩士論文
[1]X微處理器FPU的設(shè)計(jì)與實(shí)現(xiàn)[D]. 付仲滿.國防科學(xué)技術(shù)大學(xué) 2005
本文編號:3294760
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3294760.html
最近更新
教材專著