SAR成像的GPU并行計算技術研究
發(fā)布時間:2017-07-04 22:01
本文關鍵詞:SAR成像的GPU并行計算技術研究
更多相關文章: SAR成像 CUDA 多GPU 多節(jié)點 RD CS和ωK算法
【摘要】:合成孔徑雷達(SAR)在軍事和民用領域具有很大的實用價值,但是SAR系統(tǒng)產生的數(shù)據(jù)量大,成像算法計算復雜,實際應用對成像速度要求較高,而傳統(tǒng)的CPU集群處理方法效率較低,成本較高。GPU通用計算憑借其強勁的浮點計算性能和高速帶寬成為SAR系統(tǒng)高速成像處理的有效手段。目前基于GPU的SAR成像處理的研究還不夠深入,主要集中在單個GPU上的一些特定算法實現(xiàn)。本文主要開展了GPU集群上大規(guī)模SAR數(shù)據(jù)成像技術的系統(tǒng)架構設計與實現(xiàn)的相關研究,具體工作包括以下幾個方面:第一,在深入分析頻域SAR成像算法并行特征的基礎上,結合GPU高性能計算平臺的特點,設計了基于CPU+GPU異構集群的主從模式的SAR成像處理框架?蚣馨ㄖ骺啬K和計算模塊,主控模塊負責主節(jié)點控制邏輯和任務分配,計算模塊負責計算節(jié)點控制邏輯和GPU處理邏輯。在該框架下,本文詳細設計了單節(jié)點多GPU實現(xiàn)方案和多節(jié)點多GPU實現(xiàn)方案。同時深入分析了條帶模式下的SAR原始回波數(shù)據(jù)特點,在保證負載均衡的前提下設計了多節(jié)點多GPU環(huán)境下的SAR任務并行粒度選擇方案,包括節(jié)點間并行粒度選擇方案和節(jié)點內并行粒度選擇方案。第二,在節(jié)點內進行GPU成像計算時,利用CUDA共享存儲器和寄存器對成像算法的主要kernel函數(shù)進行了優(yōu)化;針對數(shù)據(jù)分塊帶來的多次CPU和GPU之間數(shù)據(jù)拷貝問題,利用CUDA流和異步并行技術設計了拷貝時間隱藏方法。針對多節(jié)點之間SAR任務傳輸帶來的通信延遲問題,設計了多線程流水處理方法,隱藏了節(jié)點間SAR數(shù)據(jù)傳輸時間。第三,研究條帶模式下的頻域成像算法,選擇了典型的頻域算法RD、CS和ωK對方案進行了驗證,并分析三種算法在效果上的差異。實驗結果表明,單節(jié)點多GPU方案相較于單GPU成像計算具有明顯的加速效果和較高的并行效率,多節(jié)點多GPU方案具有良好的擴展性,并且方案滿足實時性。本文工作面向實際應用,研究GPU環(huán)境下的高速成像方法,對SAR成像算法研究和SAR成像應用具有較大的現(xiàn)實意義。
【關鍵詞】:SAR成像 CUDA 多GPU 多節(jié)點 RD CS和ωK算法
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN957.52
【目錄】:
- 摘要4-5
- ABSTRACT5-12
- 注釋表12-13
- 縮略詞13-14
- 第一章 緒論14-21
- 1.1 研究背景及意義14-15
- 1.2 國內外研究現(xiàn)狀15-19
- 1.2.1 SAR成像算法在單GPU上的研究現(xiàn)狀16-17
- 1.2.2 SAR成像算法在單節(jié)點多GPU上的研究現(xiàn)狀17-18
- 1.2.3 SAR成像算法在多節(jié)點上的研究現(xiàn)狀18-19
- 1.3 主要研究內容19
- 1.4 論文組織結構19-21
- 第二章 SAR成像算法及GPU并行計算相關研究21-27
- 2.1 SAR成像算法21-23
- 2.1.1 SAR成像模型21
- 2.1.2 SAR成像算法流程21-23
- 2.2 GPU并行計算23-26
- 2.2.1 CUDA編程模型24-25
- 2.2.2 CUDA存儲器模型25-26
- 2.3 本章小結26-27
- 第三章 GPU高性能平臺下SAR成像總體框架設計27-36
- 3.1 GPU高性能計算平臺總體設計27-30
- 3.1.1 設計原則及目標27-28
- 3.1.2 總體框架設計28-30
- 3.2 SAR成像并行粒度選擇方案30-32
- 3.2.1 集群節(jié)點間并行粒度選擇30-32
- 3.2.2 節(jié)點內并行粒度選擇32
- 3.3 具體設計及主要工作流程32-35
- 3.3.1 主控模塊設計及工作流程33-34
- 3.3.2 計算模塊設計及工作流程34-35
- 3.4 本章小結35-36
- 第四章 單節(jié)點多GPU的SAR成像算法設計與優(yōu)化36-51
- 4.1 相關CUDA編程技巧36-38
- 4.1.1 多GPU并行計算36
- 4.1.2 CUDA異步并行技術與流技術36-37
- 4.1.3 SAR轉置處理與CUDA內存分段拷貝37-38
- 4.2 存儲空間分配策略38-39
- 4.2.1 內存分配38
- 4.2.2 顯存分配38-39
- 4.3 SAR成像的多GPU處理算法設計39-41
- 4.4 kernel函數(shù)的設計及優(yōu)化41-44
- 4.4.1 kernel函數(shù)優(yōu)化方法41-42
- 4.4.2 矩陣轉置kernel42-43
- 4.4.3 FFTshift kernel43
- 4.4.4 RCMC kernel43-44
- 4.5 實驗驗證及結果分析44-50
- 4.5.1 實驗環(huán)境44
- 4.5.2 成像效果分析44-45
- 4.5.3 并行效果分析45-46
- 4.5.4 執(zhí)行時間和加速比分析46-48
- 4.5.5 并行效率分析48-49
- 4.5.6 實時性分析49-50
- 4.6 本章小結50-51
- 第五章 多節(jié)點多GPU的SAR成像算法設計與實現(xiàn)51-63
- 5.1 多CPU+多GPU協(xié)同計算方法51-52
- 5.1.1 硬件平臺和軟件架構51-52
- 5.1.2 負載均衡設計52
- 5.2 多節(jié)點多GPU的SAR成像方案52-56
- 5.2.1 多節(jié)點控制邏輯53
- 5.2.2 SAR任務分配方案53
- 5.2.3 SAR數(shù)據(jù)調度方法53-55
- 5.2.4 批量SAR任務優(yōu)化設計55-56
- 5.3 實驗驗證及結果分析56-62
- 5.3.1 實驗環(huán)境56
- 5.3.2 多節(jié)點執(zhí)行時間測試56-58
- 5.3.3 網(wǎng)絡通信影響測試58-60
- 5.3.4 可擴展性測試60-62
- 5.3.5 并行架構綜合分析62
- 5.4 本章小結62-63
- 第六章 總結與展望63-65
- 6.1 研究工作總結63-64
- 6.2 下一步工作展望64-65
- 參考文獻65-69
- 致謝69-70
- 在學期間的研究成果及發(fā)表的學術論文70
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 馬伯寧;王晨昊;湯曉安;匡綱要;;基于GPU的二維離散小波變換快速計算[J];國防科技大學學報;2011年03期
2 ZW;;3D游戲利器 主流嵌入式處理器GPU逐個看[J];電腦迷;2011年19期
3 王志國;王貴錦;施陳博;苗權;林行剛;;積分圖像的快速GPU計算[J];計算機應用研究;2011年10期
4 盧永菁;王東;;基于GPU的高速網(wǎng)絡入侵檢測系統(tǒng)設計[J];計算機工程與應用;2011年33期
5 儲t熆,
本文編號:519432
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/519432.html
最近更新
教材專著