基于GPU并行計(jì)算的雷達(dá)雜波模擬研究
發(fā)布時(shí)間:2021-02-06 03:09
現(xiàn)代雷達(dá)雜波模擬需使用雜波數(shù)據(jù)實(shí)時(shí)分析與處理回波信號(hào),然而傳統(tǒng)球不變隨機(jī)過程(SIRP)方法生成雜波數(shù)據(jù)耗時(shí)較長(zhǎng)。通過對(duì)SIRP方法進(jìn)行改進(jìn),提出一種利用圖形處理器(GPU)并行計(jì)算提升雜波生成實(shí)時(shí)性的方法。在計(jì)算統(tǒng)一設(shè)備架構(gòu)(CUDA)下,對(duì)相關(guān)相干K分布雜波算法進(jìn)行多任務(wù)串-并行分析,采用cuBLAS庫對(duì)細(xì)粒度卷積計(jì)算進(jìn)行優(yōu)化,利用OpenMP+CUDA多任務(wù)調(diào)度機(jī)制改進(jìn)粗粒度任務(wù)并行計(jì)算,以提高CPU-GPU利用率并減少數(shù)據(jù)等待時(shí)間。實(shí)驗(yàn)結(jié)果表明,該方法生成雜波數(shù)據(jù)的實(shí)時(shí)性顯著提升,且隨著雜波數(shù)據(jù)量增大其加速效果更好,相較傳統(tǒng)GPU方法計(jì)算速率提高61%。
【文章來源】:計(jì)算機(jī)工程. 2020,46(11)北大核心
【文章頁數(shù)】:9 頁
【部分圖文】:
SIRP方法流程
設(shè)矩陣維度 m=Q×p、n=Q、k=Q/p,其中Q分別為500、1 000、2 000,矩陣A=m×n、B=n×k,使用cuBLAS庫對(duì)矩陣A和B進(jìn)行相乘運(yùn)算,不同矩陣維度下計(jì)算效率如圖2所示。其中,以每秒10億次的浮點(diǎn)運(yùn)算數(shù)(Giga Floating-point Operations Per Second,GFLOPS)作為計(jì)算效率的評(píng)價(jià)指標(biāo)?梢钥闯霾煌仃嚲S度下計(jì)算所得GFLOPS均隨著加權(quán)值p的增加而下降,且各個(gè)矩陣維度的GFLOPS在相同計(jì)算量下變化趨勢(shì)明顯。設(shè)m=Q、n=Q/p、k=Q,矩陣A=m×n,B=n×k,當(dāng)Q取值為500、1 000、2 000時(shí),不同矩陣維度下計(jì)算量隨加權(quán)值p的增大而減小,計(jì)算量減小倍數(shù)為p,計(jì)算時(shí)間隨加權(quán)值p的變化情況如圖3所示。可以看出不同維度矩陣相乘的計(jì)算時(shí)間隨加權(quán)值p的增大均出現(xiàn)下降,且當(dāng)p取值范圍為[1,10]時(shí)降幅明顯,而在p=10后計(jì)算時(shí)間趨于恒定。
設(shè)m=Q、n=Q/p、k=Q,矩陣A=m×n,B=n×k,當(dāng)Q取值為500、1 000、2 000時(shí),不同矩陣維度下計(jì)算量隨加權(quán)值p的增大而減小,計(jì)算量減小倍數(shù)為p,計(jì)算時(shí)間隨加權(quán)值p的變化情況如圖3所示?梢钥闯霾煌S度矩陣相乘的計(jì)算時(shí)間隨加權(quán)值p的增大均出現(xiàn)下降,且當(dāng)p取值范圍為[1,10]時(shí)降幅明顯,而在p=10后計(jì)算時(shí)間趨于恒定。本文通過分析不同矩陣維度的計(jì)算特性,推導(dǎo)出適合cuBLAS庫進(jìn)行卷積計(jì)算的卷積加速方法ConvC。設(shè)L為高斯隨機(jī)數(shù)序列長(zhǎng)度,n為濾波器系數(shù)個(gè)數(shù),若L可分解為M×N行矩陣,設(shè)i=N-(n-1),拓展到第k行,設(shè)K=(k-1)×N-(n-1),則矩陣A可變換為(M+1)×(N+n-1)維矩陣,矩陣B可變換為(N+n-1)×N維矩陣,具體變換如下:
【參考文獻(xiàn)】:
期刊論文
[1]基于CPU-GPU異構(gòu)并行的MOC中子輸運(yùn)計(jì)算并行效率優(yōu)化研究[J]. 宋佩濤,張志儉,梁亮,張乾,趙強(qiáng). 原子能科學(xué)技術(shù). 2019(11)
[2]高性能行任務(wù)散列法GPU一般稀疏矩陣-矩陣乘法[J]. 湯洋,趙達(dá)非,黃智瀕,戴志濤. 北京郵電大學(xué)學(xué)報(bào). 2019(03)
[3]基于MPI+OpenMP混合編程模式的大規(guī)模顆粒兩相流LBM并行模擬[J]. 何強(qiáng),李永健,黃偉峰,李德才,胡洋,王玉明. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(10)
[4]基于概率定義擴(kuò)展樣本的機(jī)載雷達(dá)空間和時(shí)間相關(guān)海雜波數(shù)據(jù)仿真方法[J]. 毛輝煌,謝文沖,徐鵬,劉暢. 兵工學(xué)報(bào). 2019(03)
[5]基于CUDA與CUBLAS的Tucker分解模塊設(shè)計(jì)與實(shí)現(xiàn)[J]. 周琦,柴小麗,馬克杰,俞則人. 計(jì)算機(jī)工程. 2019(03)
[6]基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝圖像分類檢索算法[J]. 厲智,孫玉寶,王楓,劉青山. 計(jì)算機(jī)工程. 2016(11)
[7]基于改進(jìn)的ZMNL和SIRP的K分布雜波模擬方法[J]. 朱潔麗,湯俊. 雷達(dá)學(xué)報(bào). 2014(05)
碩士論文
[1]濱海復(fù)雜背景下機(jī)載雷達(dá)非均勻雜波的建模與仿真研究[D]. 吳奇.電子科技大學(xué) 2015
[2]基于CUDA的機(jī)載雷達(dá)雜波仿真[D]. 張鵬飛.西安電子科技大學(xué) 2013
本文編號(hào):3020049
【文章來源】:計(jì)算機(jī)工程. 2020,46(11)北大核心
【文章頁數(shù)】:9 頁
【部分圖文】:
SIRP方法流程
設(shè)矩陣維度 m=Q×p、n=Q、k=Q/p,其中Q分別為500、1 000、2 000,矩陣A=m×n、B=n×k,使用cuBLAS庫對(duì)矩陣A和B進(jìn)行相乘運(yùn)算,不同矩陣維度下計(jì)算效率如圖2所示。其中,以每秒10億次的浮點(diǎn)運(yùn)算數(shù)(Giga Floating-point Operations Per Second,GFLOPS)作為計(jì)算效率的評(píng)價(jià)指標(biāo)?梢钥闯霾煌仃嚲S度下計(jì)算所得GFLOPS均隨著加權(quán)值p的增加而下降,且各個(gè)矩陣維度的GFLOPS在相同計(jì)算量下變化趨勢(shì)明顯。設(shè)m=Q、n=Q/p、k=Q,矩陣A=m×n,B=n×k,當(dāng)Q取值為500、1 000、2 000時(shí),不同矩陣維度下計(jì)算量隨加權(quán)值p的增大而減小,計(jì)算量減小倍數(shù)為p,計(jì)算時(shí)間隨加權(quán)值p的變化情況如圖3所示。可以看出不同維度矩陣相乘的計(jì)算時(shí)間隨加權(quán)值p的增大均出現(xiàn)下降,且當(dāng)p取值范圍為[1,10]時(shí)降幅明顯,而在p=10后計(jì)算時(shí)間趨于恒定。
設(shè)m=Q、n=Q/p、k=Q,矩陣A=m×n,B=n×k,當(dāng)Q取值為500、1 000、2 000時(shí),不同矩陣維度下計(jì)算量隨加權(quán)值p的增大而減小,計(jì)算量減小倍數(shù)為p,計(jì)算時(shí)間隨加權(quán)值p的變化情況如圖3所示?梢钥闯霾煌S度矩陣相乘的計(jì)算時(shí)間隨加權(quán)值p的增大均出現(xiàn)下降,且當(dāng)p取值范圍為[1,10]時(shí)降幅明顯,而在p=10后計(jì)算時(shí)間趨于恒定。本文通過分析不同矩陣維度的計(jì)算特性,推導(dǎo)出適合cuBLAS庫進(jìn)行卷積計(jì)算的卷積加速方法ConvC。設(shè)L為高斯隨機(jī)數(shù)序列長(zhǎng)度,n為濾波器系數(shù)個(gè)數(shù),若L可分解為M×N行矩陣,設(shè)i=N-(n-1),拓展到第k行,設(shè)K=(k-1)×N-(n-1),則矩陣A可變換為(M+1)×(N+n-1)維矩陣,矩陣B可變換為(N+n-1)×N維矩陣,具體變換如下:
【參考文獻(xiàn)】:
期刊論文
[1]基于CPU-GPU異構(gòu)并行的MOC中子輸運(yùn)計(jì)算并行效率優(yōu)化研究[J]. 宋佩濤,張志儉,梁亮,張乾,趙強(qiáng). 原子能科學(xué)技術(shù). 2019(11)
[2]高性能行任務(wù)散列法GPU一般稀疏矩陣-矩陣乘法[J]. 湯洋,趙達(dá)非,黃智瀕,戴志濤. 北京郵電大學(xué)學(xué)報(bào). 2019(03)
[3]基于MPI+OpenMP混合編程模式的大規(guī)模顆粒兩相流LBM并行模擬[J]. 何強(qiáng),李永健,黃偉峰,李德才,胡洋,王玉明. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(10)
[4]基于概率定義擴(kuò)展樣本的機(jī)載雷達(dá)空間和時(shí)間相關(guān)海雜波數(shù)據(jù)仿真方法[J]. 毛輝煌,謝文沖,徐鵬,劉暢. 兵工學(xué)報(bào). 2019(03)
[5]基于CUDA與CUBLAS的Tucker分解模塊設(shè)計(jì)與實(shí)現(xiàn)[J]. 周琦,柴小麗,馬克杰,俞則人. 計(jì)算機(jī)工程. 2019(03)
[6]基于深度卷積神經(jīng)網(wǎng)絡(luò)的服裝圖像分類檢索算法[J]. 厲智,孫玉寶,王楓,劉青山. 計(jì)算機(jī)工程. 2016(11)
[7]基于改進(jìn)的ZMNL和SIRP的K分布雜波模擬方法[J]. 朱潔麗,湯俊. 雷達(dá)學(xué)報(bào). 2014(05)
碩士論文
[1]濱海復(fù)雜背景下機(jī)載雷達(dá)非均勻雜波的建模與仿真研究[D]. 吳奇.電子科技大學(xué) 2015
[2]基于CUDA的機(jī)載雷達(dá)雜波仿真[D]. 張鵬飛.西安電子科技大學(xué) 2013
本文編號(hào):3020049
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3020049.html
最近更新
教材專著