嵌入式GPU滑動聚束SAR實(shí)時(shí)成像方法

發(fā)布時(shí)間：2020-12-15 03:10

　　針對SAR實(shí)時(shí)成像系統(tǒng)的傳統(tǒng)計(jì)算平臺實(shí)時(shí)性不足與功耗過高的問題,研究了一種基于嵌入式GPU的實(shí)現(xiàn)方法.為了充分利用嵌入式GPU中有限的內(nèi)存資源,提出一種內(nèi)存分割與重配置方案,采用頁鎖定內(nèi)存和zero-copy技術(shù),實(shí)現(xiàn)數(shù)傳-計(jì)算并行化處理;為解決實(shí)時(shí)性問題,在算法并行計(jì)算環(huán)節(jié),利用共享內(nèi)存、寄存器等資源實(shí)現(xiàn)大規(guī)模數(shù)據(jù)并行.結(jié)果表明,在TX2上完成16 384×8 192點(diǎn)滑聚SAR成像處理時(shí)間為12.66 s,功耗為15 W.該優(yōu)化方法也適用于其他模式的雷達(dá)處理算法,并可為未來嵌入式實(shí)時(shí)成像處理提供參考.

【文章來源】：北京理工大學(xué)學(xué)報(bào). 2020年09期北大核心

【文章頁數(shù)】：8 頁

【部分圖文】：

滑聚SAR成像算法流程

流程圖,方案設(shè)計(jì),流程圖,內(nèi)存碎片

① 用于存放升采樣前數(shù)據(jù)的存儲空間在升采樣后便不復(fù)使用,因而升采樣結(jié)束后將其立即釋放;而用于放置升采樣后數(shù)據(jù)的mem21和mem22分配將在mem11與mem12釋放成功后進(jìn)行.② 中間變量,如CS因子、距離徙動因子、距離向時(shí)間軸、方位向頻率軸等,都采取即分配、即利用、即釋放的手段. 這些變量數(shù)據(jù)量較小,占用的空間往往是kB量級,因而可以順利獲取,不用擔(dān)心由頻繁釋放帶來的內(nèi)存碎片化問題.

示意圖,數(shù)據(jù)傳輸,方式,內(nèi)存

考慮到TX2的主機(jī)和設(shè)備的內(nèi)存共享特性,若分別開辟內(nèi)存,會導(dǎo)致兩段內(nèi)存中的內(nèi)容重復(fù). 故此處采用了zero-copy技術(shù),借助免費(fèi)的映射關(guān)系達(dá)到有效規(guī)避傳輸時(shí)間的作用,如圖 3(b).首先分配CPU頁鎖定內(nèi)存,這段主機(jī)存儲在經(jīng)過指針映射后可以投入到設(shè)備空間中使用. 在讀取與寫入磁盤時(shí)用到的是主機(jī)端指針,在需要設(shè)備端做加速計(jì)算處理時(shí),使用相應(yīng)的設(shè)備端指針即可. 在傳統(tǒng)GPU上,zero-copy是將數(shù)據(jù)傳輸與內(nèi)核計(jì)算操作以流水線的方式執(zhí)行,因而只能對該塊內(nèi)存讀寫一次,且性能提升不明顯,通常不加以考慮;而TX2得益于其內(nèi)存共享的特性,節(jié)約設(shè)備端存儲器的同時(shí)省去了數(shù)據(jù)拷貝的時(shí)間,因而可以實(shí)現(xiàn)真正意義上的零復(fù)制.

本文編號：2917541

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/2917541.html

上一篇：新型平面寬帶及多頻濾波天線研究
下一篇：340GHz低噪聲接收機(jī)前端研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

嵌入式GPU滑動聚束SAR實(shí)時(shí)成像方法