使用融合乘加加速快速傅里葉變換計(jì)算的向量化方法
【圖文】:
算,包括16個(gè)向量處理單元(VectorProcessingElement,VPE),每個(gè)VPE含一個(gè)局部寄存器文件,以及3個(gè)浮點(diǎn)乘加單元(FloatMultiplyandAccumulate,F(xiàn)MAC)、1個(gè)BP和2個(gè)L/S共6個(gè)并行功能部件,3個(gè)FMAC均支持FMA指令。局部寄存器文件包含64個(gè)64位寄存器,所有VPE的同一編號的局部寄存器在邏輯上又組成一個(gè)1024位的向量寄存器。功能部件支持定點(diǎn)和浮點(diǎn)操作,向量指令在各個(gè)VPE上同時(shí)獨(dú)立運(yùn)行。向量數(shù)據(jù)訪問單元支持向量數(shù)據(jù)的Load/Store,提供大容量陣列向量存儲器(ArrayMemory,AM),每周期同時(shí)支持2個(gè)Load/Store指令。圖1Matrix的體系結(jié)構(gòu)Fig.1ArchitectureofMatrix·73·
0x(2l)Wk2lN+∑N/2-1l=0x(2l+1)Wk(2l+1)N由旋轉(zhuǎn)因子的周期性特性易知:W2klN=WklN/2,Wk+N/2N=-WkN,Wk+NN=WkN令a(l)=x(2l),b(l)=x(2l+1),則序列X(k)劃分為2個(gè)長度為N/2的子序列:X(k)=A(k)+WkNB(k)X(k+N2)=A(k)+Wk+N2NB(k)=A(k)-WkNB(k{)(1)圖2是DIT基2FFT的蝶形單元運(yùn)算流程圖,DIT基2FFT的每次蝶形單元運(yùn)算需要1次復(fù)數(shù)乘法,2次復(fù)數(shù)加法,轉(zhuǎn)變實(shí)數(shù)計(jì)算即為4次實(shí)數(shù)乘法和6次實(shí)數(shù)加法,即需要10次實(shí)數(shù)乘(加)操作。圖2DIT基2FFT的蝶形單元運(yùn)算流程圖Fig.2Radix-2DITFFTbutterflydiagram2.1.2DIT基4FFT的蝶形單元計(jì)算方法當(dāng)N是4的整數(shù)次方時(shí),DIT基4FFT將輸入數(shù)據(jù)序列x(n)按模4后的余數(shù)分組:X(k)=∑N-1n=0x(n)WknN=∑N/4-1l=0x(4l)Wk4lN+∑N/4-1l=0x(4l+1)Wk(4l+1)N+∑N/4-1l=0x(4l+2)Wk(4l+2)N+∑N/4-1l=0x(4l+3)Wk(4l+3)N=∑N/4-1l=0x(4l)WklN/4+WkN∑N/4-1l=0x(4l+1)WklN/4+W2kN∑N/4-1l=0x(4l+2)WklN/4+W3kN∑N/4-1l=0x(4l+3)WklN/4由旋轉(zhuǎn)因子的周期性特性易知:W4klN=WklN/4,Wk+N/4N=-jWkN,Wk+2N/4N=-WkN,Wk+3N/4N=jWkN,Wk+NN=WkN令a(l)=x(4l),b(l)=x(4l+1),,c(l)=x(4l+2),d(l)=x(4l+3),則序列X(k)劃分為4個(gè)長度為N/4的子序列:X(k)=A(k)+WkNB(k)+W2kNC(k)+W3kND(k)X(k+N4)=A(k)-jWkNB(k)-W2kNC(k)+jW3kND(k)X(k+2N4)=A(k)-WkNB(k)+W2kNC(k)?
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 劉仲;陳躍躍;陳海燕;;支持任意系數(shù)長度和數(shù)據(jù)類型的FIR濾波器向量化方法[J];電子學(xué)報(bào);2013年02期
2 劉仲;邢彬朝;陳躍躍;;一種面向多核處理器的高效并行PCA-SIFT算法[J];國防科技大學(xué)學(xué)報(bào);2012年04期
3 何濤;朱岱寅;;大點(diǎn)數(shù)一維FFT的GPU設(shè)計(jì)實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2013年11期
4 李焱;張?jiān)迫?劉益群;龍國平;賈海鵬;;MPFFT:An Auto-Tuning FFT Library for OpenCL GPUs[J];Journal of Computer Science & Technology;2013年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 樊明迪;林輝;呂帥帥;;一種抑制PMSM-DTC周期性轉(zhuǎn)速脈動的方法[J];電機(jī)與控制學(xué)報(bào);2013年09期
2 孫冬;高清維;竺德;盧一相;;離散傅里葉變換的自適應(yīng)循環(huán)電力諧波分析算法[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
3 盛建國;朱鳴君;胡瑞;;一種便攜式消防救援通信箱系統(tǒng)的設(shè)計(jì)[J];電腦知識與技術(shù);2013年28期
4 曹鵬;楊錦江;梅晨;;基于粗粒度可重構(gòu)架構(gòu)的并行FFT算法實(shí)現(xiàn)[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
5 楊雪;李學(xué)友;李家國;馬駿;張力;楊健;杜全葉;;基于GPU和分塊技術(shù)的巨幅影像快速傅里葉變換算法研究(英文)[J];光譜學(xué)與光譜分析;2014年02期
6 楊陽;張志榮;倪志波;;基于光閃爍的煙氣流速測量技術(shù)[J];光電子.激光;2014年04期
7 何其佳;劉振丙;;基于一階矩的無乘法DFT算法[J];桂林電子科技大學(xué)學(xué)報(bào);2014年03期
8 常麗;楊繼敏;;基于校正多相位快速傅里葉變換算法的疊柵條紋相位差測量[J];光學(xué)學(xué)報(bào);2014年06期
9 陳大銀;;Matlab軟件在頻譜分析中的應(yīng)用[J];貴陽學(xué)院學(xué)報(bào)(自然科學(xué)版);2014年02期
10 曾博;唐求;卿柏元;溫和;李剛;滕召勝;;基于Nuttall自卷積窗的改進(jìn)FFT譜分析方法[J];電工技術(shù)學(xué)報(bào);2014年07期
相關(guān)會議論文 前2條
1 Wenqiang Guo;Qiang Zhou;Yongyan Hou;Zoe Zhu;Jingjing Yang;Baorong Zhang;;Early Classification for Bearing Faults of Rotating Machinery Based on MFES and Bayesian Network[A];第25屆中國控制與決策會議論文集[C];2013年
2 Zhu Jin;Luo Jun;Zhang Shuang;;The Design and Implementation of FFT Algorithm Based on The Xilinx FPGA IP Core[A];2012年計(jì)算機(jī)應(yīng)用與系統(tǒng)建模國際會議論文集[C];2012年
相關(guān)博士學(xué)位論文 前10條
1 陳緒荃;雷電信號特征分析及其分選研究[D];華中科技大學(xué);2013年
2 朱霄s
本文編號:2556835
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2556835.html