基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究
本文關(guān)鍵詞:基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究
更多相關(guān)文章: 合成孔徑雷達 單指令多數(shù)據(jù) 快速成像 協(xié)同計算
【摘要】:綜合孔徑雷達(Synthetic Aperture Radar, SAR)技術(shù)近幾年有了很快的發(fā)展,更高的分辨率以及更大的照射范圍都使地面處理系統(tǒng)面臨著越來越龐大的數(shù)據(jù)量,與此同時,對于SAR數(shù)據(jù)處理的性能和效率的要求也在同時變得更加嚴格。因此,人們對于SAR快速甚至實時成像系統(tǒng)的研究也越來越深入,各種高性能計算的平臺和方法越來越多地被運用到SAR成像系統(tǒng)中去。在現(xiàn)有的快速SAR成像方法中,利用圖形處理器加速的例子非常多見。傳統(tǒng)的基于GPU的快速SAR成像方法中,GPU由于自身的超多線程、大規(guī)模并行的模式,而被用作SAR成像系統(tǒng)中主要的計算處理器,承擔算法中主要的甚至所有的計算工作,與此同時,中央處理器(Central Processing Unit, CPU)只被用來承擔一些算法實現(xiàn)過程中輔助性的工作,比如數(shù)據(jù)的讀取與存盤(Input/Output, I/O),流程控制等工作。因此,傳統(tǒng)的基于GPU的快速SAR成像方法中,CPU的計算資源和計算能力是被低估甚至忽略的。本文設(shè)計了一種基于深度CPU/GPU異構(gòu)協(xié)同并行計算的快速SAR成像方法。通過面向異構(gòu)協(xié)同并行計算的合理分塊以及任務調(diào)度策略,整個成像算法可以部署到CPU和GPU上協(xié)同并行實現(xiàn)。部署在CPU上的并行任務,本文首次在多核CPU的基礎(chǔ)上引入基于單指令多數(shù)據(jù)(SingleInstruction Multiple Data, SIMD)架構(gòu)的高級矢量擴展指令集(Advanced Vector Extensions, AVX)來進行深度的并行優(yōu)化。部署在GPU上的并行任務部分,借助英偉達(NVIDIA)的統(tǒng)一計算設(shè)備架構(gòu),本文解決了現(xiàn)有的基于GPU實現(xiàn)的快速SAR成像方法面臨的兩個問題,其一是有限的顯存對SAR回波數(shù)據(jù)量的限制;其二是避免了現(xiàn)有方法中過于頻繁的設(shè)備和主機之間的內(nèi)存拷貝行為。在此基礎(chǔ)上還運用了很豐富的優(yōu)化策略,比如流技術(shù),并行流水線等。實驗結(jié)果表明,與基于單核CPU的SAR成像算法相比,本文提出的這種深度CPU/GPU異構(gòu)協(xié)同并行計算的快速SAR成像方法比起經(jīng)典的單核CPU實現(xiàn)的SAR成像算法可以提高大約270倍的運行效率;谶@種方法的SAR數(shù)據(jù)處理的效率遠高于SAR數(shù)據(jù)生成的效率,所以可以說這種方法實現(xiàn)了SAR的實時成像。
【關(guān)鍵詞】:合成孔徑雷達 單指令多數(shù)據(jù) 快速成像 協(xié)同計算
【學位授予單位】:北京化工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN957.52
【目錄】:
- 學位論文數(shù)據(jù)集3-4
- 摘要4-6
- ABSTRACT6-15
- 第一章 緒論15-23
- 1.1 課題背景意義15-16
- 1.2 課題研究現(xiàn)狀16-19
- 1.2.1 經(jīng)典合成孔徑雷達成像方法概述16-17
- 1.2.2 快速合成孔徑雷達成像方法概述17-19
- 1.3 課題研究內(nèi)容19-20
- 1.4 全文組織結(jié)構(gòu)20-23
- 第二章 SAR基礎(chǔ)理論23-39
- 2.1 合成孔徑雷達原理24-28
- 2.1.1 SAR的分辨能力24-25
- 2.1.2 SAR數(shù)據(jù)采集25-27
- 2.1.3 點目標回波的生成27-28
- 2.2 合成孔徑雷達成像處理基礎(chǔ)28-33
- 2.2.1 星載SAR成像幾何29-31
- 2.2.2 星載SAR成像模式31
- 2.2.3 星載SAR成像原理31-33
- 2.3 合成孔徑雷達成像處理算法33-37
- 2.3.1 RD算法33-35
- 2.3.2 CS算法35-37
- 2.4 本章小結(jié)37-39
- 第三章 基于CPU的快速星載SAR成像39-53
- 3.1 CPU并行技術(shù)介紹39-41
- 3.1.1 基于OpenMP的單機多CPU并行技術(shù)39-40
- 3.1.2 基于SSE/AVX的SIMD CPU矢量化并行技術(shù)40-41
- 3.2 CPU平臺下星載SAR成像的并行性分析41-44
- 3.2.1 基于OpenMP的粗粒度并行性分析42-43
- 3.2.2 基于AVX的細粒度并行性分析43-44
- 3.3 基于多核CPU和SIMD的星載SAR并行成像44-50
- 3.3.1 并行算法設(shè)計44-46
- 3.3.2 矩陣轉(zhuǎn)置的優(yōu)化46-47
- 3.3.3 快速傅里葉變換的優(yōu)化47-48
- 3.3.4 相位相乘的優(yōu)化48-50
- 3.4 實驗結(jié)果與分析50-52
- 3.5 本章小結(jié)52-53
- 第四章 基于GPU的快速星載SAR成像53-67
- 4.1 GPU并行技術(shù)綜述53-57
- 4.1.1 線程級的并行53-55
- 4.1.2 任務級的并行55-56
- 4.1.3 設(shè)備級的并行56-57
- 4.2 GPU平臺下的星載SAR成像并行性分析57-59
- 4.2.1 基于多GPU的粗粒度并行性分析57-58
- 4.2.2 基于單GPU的細粒度并行性分析58-59
- 4.3 基于GPU的星載SAR并行成像59-64
- 4.3.1 并行算法設(shè)計59-61
- 4.3.2 矩陣轉(zhuǎn)置的優(yōu)化61-63
- 4.3.3 快速傅里葉變換的優(yōu)化63
- 4.3.4 相位相乘的優(yōu)化63-64
- 4.4 實驗結(jié)果與分析64-66
- 4.5 本章小結(jié)66-67
- 第五章 基于CPU/GPU異構(gòu)協(xié)同并行的快速星載SAR成像67-81
- 5.1 異構(gòu)協(xié)同并行快速SAR成像算法分析67-69
- 5.2 異構(gòu)協(xié)同并行快速SAR成像算法設(shè)計69-77
- 5.2.1 雙向的數(shù)據(jù)分塊策略71-72
- 5.2.2 基于多GPU和多核CPU的粗粒度任務劃分72-73
- 5.2.3 基于流調(diào)度和AVX的細粒度任務劃分73-75
- 5.2.4 基于異構(gòu)協(xié)同計算的內(nèi)存行為優(yōu)化75-77
- 5.3 實驗結(jié)果與分析77-80
- 5.4 本章小結(jié)80-81
- 第六章 總結(jié)與展望81-83
- 6.1 結(jié)論81-82
- 6.2 展望82-83
- 參考文獻83-87
- 致謝87-89
- 研究成果及發(fā)表的學術(shù)論文89-91
- 作者和導師簡介91-93
- 附件93-94
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計算機學報;2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計算機與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應用[J];計算機工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴展部件的循環(huán)優(yōu)化研究[J];計算機科學;2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計算機科學與探索;2009年01期
6 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計[J];微電子學與計算機;2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學學報;2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計研究[J];浙江大學學報(工學版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計算機工程與應用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計算機工程;2009年10期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠;;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國開放式分布與并行計算機學術(shù)會議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語句轉(zhuǎn)化方法[A];2009年全國開放式分布與并行計算機學術(shù)會議論文集(上冊)[C];2009年
4 朱明慧;;ADI浮點DSP軟件編程中的指令并行與SIMD應用[A];中國航空學會信號與信息處理專業(yè)全國第八屆學術(shù)會議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機環(huán)境聯(lián)合學術(shù)會議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導航學術(shù)年會論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設(shè)計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
中國博士學位論文全文數(shù)據(jù)庫 前8條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學技術(shù)大學;2014年
2 侯永生;多重循環(huán)SIMD向量化方法及性能優(yōu)化技術(shù)研究[D];解放軍信息工程大學;2014年
3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復旦大學;2006年
4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國科學技術(shù)大學;2008年
5 張凱;向量SIMD DSP上高效矩陣運算技術(shù)研究[D];國防科學技術(shù)大學;2013年
6 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復旦大學;2005年
7 姜偉華;針對實際多媒體程序和多媒體擴展指令集的SIMD編譯優(yōu)化[D];復旦大學;2005年
8 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 沈陽;基于SIMD指令的多核軟件渲染器的設(shè)計與實現(xiàn)[D];浙江大學;2015年
2 王力;SIMD指令在生物序列串匹配里的應用[D];北京理工大學;2015年
3 黃娟娟;多線程多SIMD自動向量化技術(shù)研究[D];國防科學技術(shù)大學;2013年
4 趙芮;一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設(shè)計與驗證[D];國防科學技術(shù)大學;2014年
5 林宗華;X-DSP定點乘累加的設(shè)計優(yōu)化與驗證[D];國防科學技術(shù)大學;2014年
6 宋貴環(huán);YHFT-Matrix2編譯器SIMD優(yōu)化技術(shù)研究與實現(xiàn)[D];國防科學技術(shù)大學;2014年
7 黃勝兵;面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實現(xiàn)[D];中國科學技術(shù)大學;2016年
8 胡辰;基于異構(gòu)SIMD并行的高分辨率星載SAR原始數(shù)據(jù)快速模擬研究[D];北京化工大學;2016年
9 李國君;基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究[D];北京化工大學;2016年
10 張倩;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[D];復旦大學;2008年
,本文編號:610530
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/610530.html