浮點(diǎn)單元超越函數(shù)的硬件實(shí)現(xiàn)及其優(yōu)化
發(fā)布時(shí)間:2020-05-11 16:21
【摘要】:結(jié)合西北工業(yè)大學(xué)航空微電子中心所承擔(dān)的某國(guó)家項(xiàng)目,作者參加了“龍騰”C2微處理器的設(shè)計(jì)與實(shí)現(xiàn),主要負(fù)責(zé)浮點(diǎn)處理單元的結(jié)構(gòu)設(shè)計(jì)和浮點(diǎn)超越函數(shù)的設(shè)計(jì)與實(shí)現(xiàn)。 “龍騰”C2微處理器與Intel 80486DX4指令系統(tǒng)兼容,支持IEEE754標(biāo)準(zhǔn)的單精度、雙精度和擴(kuò)展精度的浮點(diǎn)基本函數(shù)和超越函數(shù)的運(yùn)算。 論文的主要工作如下: 1.在分析浮點(diǎn)指令的基礎(chǔ)上,根據(jù)指令的特點(diǎn)和功能對(duì)浮點(diǎn)處理單元進(jìn)行模塊化分。 2.分析浮點(diǎn)超越函數(shù)的各種實(shí)現(xiàn)算法,并重點(diǎn)討論了HP CORDIC算法及其流程,設(shè)計(jì)了超越函數(shù)實(shí)現(xiàn)的總體結(jié)構(gòu)。 3.完成超越函數(shù)實(shí)現(xiàn)的數(shù)據(jù)路徑設(shè)計(jì),主要包括加法器、移位器、常數(shù)ROM和旋轉(zhuǎn)控制邏輯,同時(shí)針對(duì)“龍騰”C2微處理器的性能要求對(duì)各個(gè)部件進(jìn)行優(yōu)化設(shè)計(jì)。 4.完成了超越函數(shù)實(shí)現(xiàn)的控制路徑設(shè)計(jì),主要包括控制路徑的整體結(jié)構(gòu)設(shè)計(jì)、每條超越函數(shù)指令的控制過(guò)程及狀態(tài)轉(zhuǎn)換、使用比較頻繁的宏操作的控制過(guò)程和浮點(diǎn)異常的檢測(cè)過(guò)程。 5.完成了浮點(diǎn)超越函數(shù)的驗(yàn)證和邏輯綜合,主要驗(yàn)證內(nèi)容包括單模塊的驗(yàn)證、模塊聯(lián)合驗(yàn)證和系統(tǒng)驗(yàn)證。 通過(guò)驗(yàn)證和邏輯綜合的結(jié)果表明,,浮點(diǎn)超越函數(shù)的運(yùn)算精度和速度均滿足“龍騰”C2微處理器的設(shè)計(jì)要求,主頻達(dá)到143MHz。其后端設(shè)計(jì)由Cadence公司協(xié)助完成。
【圖文】:
指令和 HPCORDIC算法對(duì)浮點(diǎn)單元進(jìn)行了模塊的劃分。2.1“龍騰”CZ微處理器結(jié)構(gòu)圖2一1是“龍騰”CZ微處理器的體系結(jié)構(gòu)圖。從圖上可以看到,包括一個(gè)總線接口單元 BIU(BusInterfaceUnit),一個(gè)時(shí)鐘和復(fù)位控制單元 CRU(clockResetUnit),一個(gè)存儲(chǔ)管理單元MMU(Memo砂ManagementU址t),一個(gè)數(shù)據(jù)和指令混合的CACHE單元 UCu(UnifiedCacheUait),一個(gè)整數(shù)處理單元IEU(Integer ExeeutionUnit),一個(gè)指令譯碼器 IDU(InstructionDeeoderUnit),一個(gè)浮點(diǎn)處理單元FpU(Floating一 pointUnit)
同樣存在硬件資源浪費(fèi)的問題。根據(jù)前面三通路和雙通路結(jié)構(gòu)的分析,知道這兩種結(jié)構(gòu)在不同程度上都存在著硬件資源浪費(fèi)的情況。綜合考慮,將雙通路結(jié)構(gòu)減少一條通路,使得成為單通路結(jié)構(gòu),如圖3一3所示。圖3一3單通路結(jié)構(gòu)通過(guò)前面的分析可知,使用單通路結(jié)構(gòu)實(shí)現(xiàn) HPCORDIC算法不會(huì)存在硬件資源的空閑。雖然和雙通路結(jié)構(gòu)比較,運(yùn)算速度會(huì)有所降低,但是“龍騰”CZ微處理器的主頻要求是133MHz,使用單通路結(jié)構(gòu)可以滿足這個(gè)要求,同時(shí)還節(jié)省了面積,減少了硬件資源的浪費(fèi)。圖3一4是采用單通路結(jié)構(gòu)實(shí)現(xiàn)的數(shù)據(jù)路徑圖。從圖上看到,浮點(diǎn)超越函數(shù)實(shí)現(xiàn)的數(shù)據(jù)路徑主要分成了三大部分,一是指數(shù)路徑;二是尾數(shù)路徑:三是符號(hào)路徑。尾數(shù)路徑主要的部件是加法器、移位器和常數(shù)ROM;指數(shù)路徑主要的部件是加法器:符號(hào)路徑主要的部件是CORDIC的旋轉(zhuǎn)控制邏輯 Cordicindex;每條路徑上
【學(xué)位授予單位】:西北工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:TP332.3
本文編號(hào):2658737
【圖文】:
指令和 HPCORDIC算法對(duì)浮點(diǎn)單元進(jìn)行了模塊的劃分。2.1“龍騰”CZ微處理器結(jié)構(gòu)圖2一1是“龍騰”CZ微處理器的體系結(jié)構(gòu)圖。從圖上可以看到,包括一個(gè)總線接口單元 BIU(BusInterfaceUnit),一個(gè)時(shí)鐘和復(fù)位控制單元 CRU(clockResetUnit),一個(gè)存儲(chǔ)管理單元MMU(Memo砂ManagementU址t),一個(gè)數(shù)據(jù)和指令混合的CACHE單元 UCu(UnifiedCacheUait),一個(gè)整數(shù)處理單元IEU(Integer ExeeutionUnit),一個(gè)指令譯碼器 IDU(InstructionDeeoderUnit),一個(gè)浮點(diǎn)處理單元FpU(Floating一 pointUnit)
同樣存在硬件資源浪費(fèi)的問題。根據(jù)前面三通路和雙通路結(jié)構(gòu)的分析,知道這兩種結(jié)構(gòu)在不同程度上都存在著硬件資源浪費(fèi)的情況。綜合考慮,將雙通路結(jié)構(gòu)減少一條通路,使得成為單通路結(jié)構(gòu),如圖3一3所示。圖3一3單通路結(jié)構(gòu)通過(guò)前面的分析可知,使用單通路結(jié)構(gòu)實(shí)現(xiàn) HPCORDIC算法不會(huì)存在硬件資源的空閑。雖然和雙通路結(jié)構(gòu)比較,運(yùn)算速度會(huì)有所降低,但是“龍騰”CZ微處理器的主頻要求是133MHz,使用單通路結(jié)構(gòu)可以滿足這個(gè)要求,同時(shí)還節(jié)省了面積,減少了硬件資源的浪費(fèi)。圖3一4是采用單通路結(jié)構(gòu)實(shí)現(xiàn)的數(shù)據(jù)路徑圖。從圖上看到,浮點(diǎn)超越函數(shù)實(shí)現(xiàn)的數(shù)據(jù)路徑主要分成了三大部分,一是指數(shù)路徑;二是尾數(shù)路徑:三是符號(hào)路徑。尾數(shù)路徑主要的部件是加法器、移位器和常數(shù)ROM;指數(shù)路徑主要的部件是加法器:符號(hào)路徑主要的部件是CORDIC的旋轉(zhuǎn)控制邏輯 Cordicindex;每條路徑上
【學(xué)位授予單位】:西北工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:TP332.3
【引證文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 王松;基于FPGA的浮點(diǎn)協(xié)處理器IP核設(shè)計(jì)[D];南京航空航天大學(xué);2010年
本文編號(hào):2658737
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2658737.html
最近更新
教材專著