一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設(shè)計與驗證
發(fā)布時間:2017-11-19 01:02
本文關(guān)鍵詞:一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設(shè)計與驗證
更多相關(guān)文章: 通路分離結(jié)構(gòu) 浮點融合乘加部件 通路復用 復數(shù)乘法 黃金模型 功能驗證
【摘要】:X-DSP是我校自主研制的面向密集型數(shù)據(jù)計算的64位高性能通用DSP,采用11發(fā)射的超長指令字結(jié)構(gòu)。該DSP內(nèi)核設(shè)有浮點乘加(FMAC)部件,X-DSP的FMAC部件功能強大,其性能指標直接決定X-DSP的峰值性能,如何設(shè)計出功耗低、面積小、性能高的FMAC部件是一項極具挑戰(zhàn)性的工作。本文圍繞FMAC的優(yōu)化設(shè)計和功能驗證展開,主要工作和創(chuàng)新點如下:(1)根據(jù)算法和性能需求設(shè)計了通路分離FMAC部件總體結(jié)構(gòu)該部件能夠支持64位雙精度浮點操作和32位SIMD(Single Instruction Multiple Data)單精度浮點操作,實現(xiàn)了乘法、加法、融合乘加、點積和復數(shù)乘法共12條指令。在設(shè)計過程中根據(jù)功能需求提出三種FMAC結(jié)構(gòu)(非融合乘加FMAC結(jié)構(gòu)、非分離融合乘加FMAC結(jié)構(gòu)、通路分離FMAC結(jié)構(gòu)),并進行了全面的性能和代價分析,其中非融合乘加FMAC結(jié)構(gòu)在實現(xiàn)雙精度乘加操作時延時較大;非分離融合乘加FMAC結(jié)構(gòu)采用單、雙精度數(shù)據(jù)通路復用設(shè)計,導致點積和復數(shù)乘法的算法實現(xiàn)復雜、計算延時長、硬件開銷大。本文針對以上兩種結(jié)構(gòu)的優(yōu)缺點設(shè)計了通路分離FMAC總體結(jié)構(gòu)。(2)通路分離結(jié)構(gòu)FMAC部件的優(yōu)化設(shè)計與指令的數(shù)據(jù)通路復用設(shè)計首先,提出單、雙精度通路分離的FMAC部件結(jié)構(gòu),優(yōu)化關(guān)鍵路徑延時和減小面積開銷,其中雙精度通路采用融合乘加(A*B+C)策略,將對階移位后的操作數(shù)C作為部分積融合到尾數(shù)乘法部分積壓縮陣列中,縮短雙精度乘加尾數(shù)計算延時;單精度通路通過簡化點積和復數(shù)乘法操作的算法實現(xiàn)復雜度以減小面積和優(yōu)化時序。其次,優(yōu)化乘法器結(jié)構(gòu),采用4個32*32乘法器來實現(xiàn)雙精度和SIMD單精度乘法、融合乘加、點積和復數(shù)乘法中的尾數(shù)乘法,復用單、雙精度通路實現(xiàn)復數(shù)乘法中的實部運算和虛部運算。最后,在通路分離FMAC結(jié)構(gòu)基礎(chǔ)上,復用尾數(shù)對階、尾數(shù)加法和規(guī)格化等邏輯,實現(xiàn)了5周期雙精度浮點加法和SIMD單精度浮點加法。(3)FMAC部件的功能驗證根據(jù)FMAC實現(xiàn)的12條指令,為每條指令編寫了擁有4種rounding-mode(舍入模式)的C語言仿硬件執(zhí)行的Golden Model,用于功能驗證中的結(jié)果比對以及作為形式化驗證中的參考模型。通過模擬驗證和形式化驗證等方法,從模塊級和系統(tǒng)級對FMAC進行了功能驗證,最后對FMAC部件進行了覆蓋率分析。
【學位授予單位】:國防科學技術(shù)大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP332.2
,
本文編號:1201742
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1201742.html
最近更新
教材專著