嵌入式GPU滑動(dòng)聚束SAR實(shí)時(shí)成像方法
發(fā)布時(shí)間:2020-12-15 03:10
針對SAR實(shí)時(shí)成像系統(tǒng)的傳統(tǒng)計(jì)算平臺實(shí)時(shí)性不足與功耗過高的問題,研究了一種基于嵌入式GPU的實(shí)現(xiàn)方法.為了充分利用嵌入式GPU中有限的內(nèi)存資源,提出一種內(nèi)存分割與重配置方案,采用頁鎖定內(nèi)存和zero-copy技術(shù),實(shí)現(xiàn)數(shù)傳-計(jì)算并行化處理;為解決實(shí)時(shí)性問題,在算法并行計(jì)算環(huán)節(jié),利用共享內(nèi)存、寄存器等資源實(shí)現(xiàn)大規(guī)模數(shù)據(jù)并行.結(jié)果表明,在TX2上完成16 384×8 192點(diǎn)滑聚SAR成像處理時(shí)間為12.66 s,功耗為15 W.該優(yōu)化方法也適用于其他模式的雷達(dá)處理算法,并可為未來嵌入式實(shí)時(shí)成像處理提供參考.
【文章來源】:北京理工大學(xué)學(xué)報(bào). 2020年09期 北大核心
【文章頁數(shù)】:8 頁
【部分圖文】:
滑聚SAR成像算法流程
① 用于存放升采樣前數(shù)據(jù)的存儲(chǔ)空間在升采樣后便不復(fù)使用,因而升采樣結(jié)束后將其立即釋放;而用于放置升采樣后數(shù)據(jù)的mem21和mem22分配將在mem11與mem12釋放成功后進(jìn)行.② 中間變量,如CS因子、距離徙動(dòng)因子、距離向時(shí)間軸、方位向頻率軸等,都采取即分配、即利用、即釋放的手段. 這些變量數(shù)據(jù)量較小,占用的空間往往是kB量級,因而可以順利獲取,不用擔(dān)心由頻繁釋放帶來的內(nèi)存碎片化問題.
考慮到TX2的主機(jī)和設(shè)備的內(nèi)存共享特性,若分別開辟內(nèi)存,會(huì)導(dǎo)致兩段內(nèi)存中的內(nèi)容重復(fù). 故此處采用了zero-copy技術(shù),借助免費(fèi)的映射關(guān)系達(dá)到有效規(guī)避傳輸時(shí)間的作用,如圖 3(b).首先分配CPU頁鎖定內(nèi)存,這段主機(jī)存儲(chǔ)在經(jīng)過指針映射后可以投入到設(shè)備空間中使用. 在讀取與寫入磁盤時(shí)用到的是主機(jī)端指針,在需要設(shè)備端做加速計(jì)算處理時(shí),使用相應(yīng)的設(shè)備端指針即可. 在傳統(tǒng)GPU上,zero-copy是將數(shù)據(jù)傳輸與內(nèi)核計(jì)算操作以流水線的方式執(zhí)行,因而只能對該塊內(nèi)存讀寫一次,且性能提升不明顯,通常不加以考慮;而TX2得益于其內(nèi)存共享的特性,節(jié)約設(shè)備端存儲(chǔ)器的同時(shí)省去了數(shù)據(jù)拷貝的時(shí)間,因而可以實(shí)現(xiàn)真正意義上的零復(fù)制.
本文編號:2917541
【文章來源】:北京理工大學(xué)學(xué)報(bào). 2020年09期 北大核心
【文章頁數(shù)】:8 頁
【部分圖文】:
滑聚SAR成像算法流程
① 用于存放升采樣前數(shù)據(jù)的存儲(chǔ)空間在升采樣后便不復(fù)使用,因而升采樣結(jié)束后將其立即釋放;而用于放置升采樣后數(shù)據(jù)的mem21和mem22分配將在mem11與mem12釋放成功后進(jìn)行.② 中間變量,如CS因子、距離徙動(dòng)因子、距離向時(shí)間軸、方位向頻率軸等,都采取即分配、即利用、即釋放的手段. 這些變量數(shù)據(jù)量較小,占用的空間往往是kB量級,因而可以順利獲取,不用擔(dān)心由頻繁釋放帶來的內(nèi)存碎片化問題.
考慮到TX2的主機(jī)和設(shè)備的內(nèi)存共享特性,若分別開辟內(nèi)存,會(huì)導(dǎo)致兩段內(nèi)存中的內(nèi)容重復(fù). 故此處采用了zero-copy技術(shù),借助免費(fèi)的映射關(guān)系達(dá)到有效規(guī)避傳輸時(shí)間的作用,如圖 3(b).首先分配CPU頁鎖定內(nèi)存,這段主機(jī)存儲(chǔ)在經(jīng)過指針映射后可以投入到設(shè)備空間中使用. 在讀取與寫入磁盤時(shí)用到的是主機(jī)端指針,在需要設(shè)備端做加速計(jì)算處理時(shí),使用相應(yīng)的設(shè)備端指針即可. 在傳統(tǒng)GPU上,zero-copy是將數(shù)據(jù)傳輸與內(nèi)核計(jì)算操作以流水線的方式執(zhí)行,因而只能對該塊內(nèi)存讀寫一次,且性能提升不明顯,通常不加以考慮;而TX2得益于其內(nèi)存共享的特性,節(jié)約設(shè)備端存儲(chǔ)器的同時(shí)省去了數(shù)據(jù)拷貝的時(shí)間,因而可以實(shí)現(xiàn)真正意義上的零復(fù)制.
本文編號:2917541
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2917541.html
最近更新
教材專著