天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

NCS成像算法的并行模型設計和優(yōu)化

發(fā)布時間:2018-04-23 10:51

  本文選題:雷達成像算法 + NCS算法; 參考:《南京大學》2014年碩士論文


【摘要】:SAR合成孔徑雷達成像系統(tǒng)是先進的微波對地觀察系統(tǒng),經(jīng)過幾十年的發(fā)展,其用途已經(jīng)滲透到科學和工程的各個領域。合成孔徑雷達成像算法中基于FFT快速傅里葉變換的頻域算法解決了與方位頻率的相關性問題,但是不利于高分辨率、低頻情況下的并行計算,其中NCS算法就是其中的一種。NCS成像算法對源數(shù)據(jù)的處理主要包括了FFT/IFFT和復數(shù)計算以及一些轉(zhuǎn)置、倒序等等。本文介紹了并行計算及NCS算法實現(xiàn)所使用的多核系統(tǒng)架構,同時介紹了NCS算法的具體實現(xiàn)流程。對NCS算法的整體系統(tǒng)架構和運算簇、轉(zhuǎn)置簇以及運算簇中的FFT模塊進行了詳細闡述。同時介紹了如PRAM等常用的并行計算模型,并對其性能進行了詳細分析,為NCS算法的性能評測提供了理論基礎。在具體設計上,本文介紹了在Linux環(huán)境下的NCS算法的具體實現(xiàn)。NCS算法中最重要的模塊為FFT運算模塊和矩陣轉(zhuǎn)置模塊,而FFT模塊在計算過程中所耗費時間占整個程序的大部分,因此本文對于FFT模塊的設計和實現(xiàn)進行了重點闡述。NCS算法模型是基于存儲器精確的系統(tǒng)模型,存儲精確的系統(tǒng)模型的特點是對于任意一個并行計算算法問題,需要在問題開始之前,對算法進行拆解,將所需要的結果以及中間數(shù)據(jù)人為的放在特定的內(nèi)存地址中,達到存儲級精確。好處是在問題后續(xù)修改中較為節(jié)省時間,缺點是初始階段工作較多。在存儲器精確方面,本文詳細介紹了NCS算法實現(xiàn)過程中的存儲器存儲方式和數(shù)據(jù)搬運流程,實現(xiàn)了對存儲器的精確控制。本文最后對已實現(xiàn)的NCS算法模型進行了部分優(yōu)化。因為NCS算法模型的搭建目的是為硬件提供任務劃分方案和提供中間數(shù)據(jù),支持硬件系統(tǒng)后期調(diào)試,因此NCS算法的任務劃分方案是否高效直接影響了硬件的最終實現(xiàn)過程和實現(xiàn)效率。優(yōu)化部分我們采用了在虛擬機環(huán)境下,通過使用多線程技術,模擬實現(xiàn)了多核并行計算。同時,根據(jù)程序所用的時間,分析了在不同線程數(shù)目下程序的運行效率,這也從一方面為硬件提供了參考,說明在一定工作量的下,處理器核數(shù)并非越大越好,合理的任務劃分和充分的處理器資源運用對一個多核系統(tǒng)來說至關重要。實驗結果顯示,優(yōu)化前子孔徑運行時間TFFT=89.1s,Tstart=5.5s,優(yōu)化后Tsub=65.3s, TFFT=48.6s, Tstart=5.5s,優(yōu)化加速比為1.39。系統(tǒng)中串行代碼部分約占R=25.6%,因此其加速比極限為3.9。在實驗條件下,不考慮算法邏輯和功耗要求,加速比極限為2.56,主要是由于實際條件下的優(yōu)化無法完全忽略并行部分所需要的時間。目前項目已經(jīng)完成了基于FPGA的原型演示系統(tǒng)的演示。
[Abstract]:SAR synthetic aperture radar imaging system is an advanced microwave to earth observation system. After decades of development, its use has penetrated into various fields of science and engineering. The frequency domain algorithm based on FFT fast Fourier transform in synthetic aperture radar imaging algorithm solves the problem of correlation with azimuth frequency, but it is not conducive to high resolution. In the low frequency parallel computing, NCS algorithm is one of the.NCS imaging algorithms for the source data processing mainly including FFT/IFFT and the complex number calculation and some transposed, reverse order. This paper introduces the parallel computing and the NCS algorithm implementation of the multi-core system architecture, and introduces the specific implementation process of the NCS algorithm. The overall system architecture and operation cluster of NCS algorithm, the transposed cluster and the FFT module in the operation cluster are expounded in detail. At the same time, the common parallel computing models, such as PRAM, are introduced, and their performance is analyzed in detail, which provides a theoretical basis for the performance evaluation of the NCS algorithm. In the body design, this paper introduces the NC under the Linux environment. The most important modules in the implementation of the S algorithm are the FFT operation module and the matrix transposed module, while the time consuming of the FFT module takes up most of the whole program. Therefore, this paper focuses on the design and implementation of the FFT module. The.NCS algorithm model is based on the precise memory system model and storage precision. The characteristic of the system model is that for any parallel computing problem, it is necessary to disassemble the algorithm before the problem begins, and put the required results and the intermediate data in the specific memory address to achieve the precision of the storage level. The advantage is that it saves time and the disadvantage is the initial stage in the aftermath of the problem. In the memory precision, the memory storage mode and data handling process in the implementation of NCS algorithm are introduced in detail, and the precise control of memory is realized. Finally, the NCS algorithm model has been partially optimized. The purpose of the NCS algorithm model is to provide the task partition for the hardware. The case and the intermediate data are provided to support the later debugging of the hardware system, so the task partition scheme of the NCS algorithm has a direct impact on the final implementation and efficiency of the hardware. In the virtual machine environment, we have implemented multi core parallel computing by using multithread technology in the virtual machine environment. The operation efficiency of the program under different threads is analyzed. It also provides a reference for the hardware on the one hand. It shows that the number of processors is not as large as possible in a certain amount of work. The rational task division and the full application of the processor resources are very important for a multi-core system. The aperture operation time TFFT=89.1s, Tstart=5.5s, optimized Tsub=65.3s, TFFT=48.6s, Tstart=5.5s, the optimized acceleration ratio is about R=25.6% in the serial code part of the 1.39. system, so its acceleration ratio limit is 3.9. under the experimental conditions, without considering the logic and power requirements of the algorithm, the acceleration ratio limit is 2.56, mainly due to the optimization under the actual conditions. The time required for the parallel part can not be completely ignored. At present, the project has completed the demonstration of the prototype demonstration system based on FPGA.

【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TN957.52

【相似文獻】

相關期刊論文 前10條

1 孫廣中;陳國良;徐云;鄭啟龍;吳俊敏;;并行計算系列課程教學團隊建設[J];中國大學教學;2008年02期

2 孫廣中;徐云;鄭啟龍;吳俊敏;陳國良;;并行計算系列課程教學團隊建設[J];計算機教育;2008年15期

3 陸克中;孫宏元;;同構集群中并行計算熵研究[J];深圳大學學報(理工版);2009年01期

4 胡霞;;并行計算如何用于科學問題研究[J];科技資訊;2009年27期

5 顏寶勇;快速富里葉變換的并行計算[J];計算機工程與科學;1984年03期

6 吳靖;;一種用于基因序列比較的并行計算方法[J];國外醫(yī)學.生物醫(yī)學工程分冊;1992年01期

7 李斌;并行計算用的計算機和模型[J];管理科學文摘;1996年04期

8 魏臻;;高性能計算,高興能計算[J];中國教育網(wǎng)絡;2010年06期

9 劉杰,遲利華,胡慶豐;優(yōu)化并行計算的性能評價[J];計算機工程與設計;2000年06期

10 劉赫男,羅霄,高曉東;并行計算的現(xiàn)狀與發(fā)展[J];煤;2001年01期

相關會議論文 前10條

1 黃宇光;;整體同步并行計算方法的現(xiàn)狀與發(fā)展[A];信息科學與微電子技術:中國科協(xié)第三屆青年學術年會論文集[C];1998年

2 羅文彩;陳小前;;并行計算的多方法優(yōu)化協(xié)作[A];第二十四屆中國控制會議論文集(上冊)[C];2005年

3 左風麗;莫則堯;葉文華;;計算流體三維分裂格式的高效并行計算[A];中國工程物理研究院科技年報(2003)[C];2003年

4 王欣;李志山;張志遠;;并行計算在彈塑性時程分析中的應用[A];信息化推動工程建設工業(yè)化——第四屆工程建設計算機應用創(chuàng)新論壇論文集[C];2013年

5 張理濤;黃廷祝;谷同祥;左憲禹;;一種適合于分布式并行計算改進的平方共軛殘差法[A];2008年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2008年

6 胡金初;;并行計算中的任務分配算法[A];2005年全國理論計算機科學學術年會論文集[C];2005年

7 宋庭新;李慧;;面向服務的有限元并行計算網(wǎng)格系統(tǒng)設計[A];湖北省機械工程學會設計與傳動學會、武漢機械設計與傳動學會2008年學術年會論文集(2)[C];2008年

8 裘懿勇;徐斌;劉曉明;;并行計算作業(yè)調(diào)度系統(tǒng)的架構及應用[A];第十四屆中國科協(xié)年會第5分會場:綠色船舶與海洋裝備創(chuàng)新發(fā)展及產(chǎn)業(yè)化論壇論文集[C];2012年

9 裘懿勇;徐斌;劉曉明;;并行計算作業(yè)調(diào)度系統(tǒng)的架構及應用[A];2012年MIS/S&A學術交流會議論文集[C];2012年

10 肖保國;楊順華;邢建文;趙慧勇;;當?shù)刈赃m應建表方法在煤油超燃發(fā)動機并行計算中的應用[A];第十四屆全國激波與激波管學術會議論文集(下冊)[C];2010年

相關重要報紙文章 前10條

1 軼嘉;英特爾全球首個并行計算中心落戶無錫[N];人民郵電;2009年

2 曙光信息產(chǎn)業(yè)有限公司研發(fā)中心 溫鑫;并行計算任重道遠[N];中國計算機報;2007年

3 英特爾并行計算實驗室研究員 TimothyMattson;并行計算:減少串行軟件[N];中國計算機報;2007年

4 曙光信息產(chǎn)業(yè)有限公司研發(fā)中心 溫鑫;并行計算軟件開發(fā)概述[N];中國計算機報;2007年

5 劉霞;計算能力的提升需要一場革命[N];科技日報;2010年

6 安世亞太 雷先華;ANSYS高性能并行計算[N];中國航空報;2005年

7 張云泉;并行計算:迎接多核時代的挑戰(zhàn)[N];計算機世界;2006年

8 本報記者 馬文方;英特爾為何要牽頭并行計算[N];中國計算機報;2009年

9 英特爾 趙軍(Jun Zhao);PC機并行計算革命尚未成功[N];中國計算機報;2009年

10 ;Linux下的網(wǎng)絡并行計算[N];計算機世界;2000年

相關博士學位論文 前10條

1 張雨新;改進的MPS方法及其三維并行計算研究[D];上海交通大學;2014年

2 孫安香;數(shù)值氣象預報變分同化的伴隨模式并行計算[D];中國人民解放軍國防科學技術大學;2002年

3 張理論;面向氣象預報數(shù)值模式的高效并行計算研究[D];中國人民解放軍國防科學技術大學;2002年

4 龍柏;并行計算平臺上的數(shù)據(jù)索引技術研究[D];中國科學技術大學;2011年

5 管建和;電磁場有限元法解釋分布式并行計算的研究[D];中國地質(zhì)大學(北京);2006年

6 劉耀儒;三維有限元并行計算及其在水利工程中的應用[D];清華大學;2003年

7 金晶;并行計算普適編程模型及系統(tǒng)架構研究[D];北京郵電大學;2012年

8 盛艷秀;多核異構環(huán)境下通用并行計算框架關鍵技術研究[D];中國海洋大學;2013年

9 張帆;過程系統(tǒng)優(yōu)化的分布式并行計算[D];浙江大學;2002年

10 劉壽生;虛擬現(xiàn)實仿真平臺異構并行計算關鍵技術研究[D];中國海洋大學;2014年

相關碩士學位論文 前10條

1 胡榮華;并行計算在臨近天氣預報系統(tǒng)中的應用研究[D];華南理工大學;2015年

2 嚴善楷;異構系統(tǒng)中并行計算的動態(tài)負載均衡技術研究[D];華南理工大學;2015年

3 劉健健;基于云平臺下嵌入GPU并行計算框架的人臉檢測系統(tǒng)研究[D];中國海洋大學;2015年

4 張玉潔;基于多GPGPU并行計算的虛擬化技術研究[D];南京航空航天大學;2015年

5 鄭偉;Spark下MPI/GPU并行計算處理機制的研究[D];中國海洋大學;2015年

6 程金龍;NCS成像算法的并行模型設計和優(yōu)化[D];南京大學;2014年

7 龍海;基于移動Agent的并行計算研究[D];電子科技大學;2005年

8 孫晗琦;并行計算在計算流體力學中的研究[D];大連理工大學;2005年

9 羅偉剛;網(wǎng)絡并行計算網(wǎng)格化平臺的構建研究[D];廣東工業(yè)大學;2006年

10 文劍;并行計算平臺的建立及性能分析[D];廣東工業(yè)大學;2007年

,

本文編號:1791640

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/1791640.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶03c43***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
好吊妞视频这里有精品| 久久国产成人精品国产成人亚洲| 日韩欧美国产精品自拍| 成人免费高清在线一区二区| 国产精品成人免费精品自在线观看| 欧美激情区一区二区三区| 沐浴偷拍一区二区视频| 我要看日本黄色小视频| 一本久道久久综合中文字幕| 日本午夜一本久久久综合| 九九热最新视频免费观看| 日韩欧美在线看一卡一卡| 初尝人妻少妇中文字幕在线| 国产综合欧美日韩在线精品| 日韩av生活片一区二区三区| 在线欧美精品二区三区| 国产又粗又猛又爽又黄的文字| 久久精品免费视看国产成人| 一区二区三区在线不卡免费| 亚洲精选91福利在线观看| 欧美日韩国内一区二区| 亚洲免费视频中文字幕在线观看| 国产一级内射麻豆91| 中文字幕一区久久综合| 激情少妇一区二区三区| 国产又粗又猛又长又黄视频| 精品人妻久久一品二品三品| 国产av精品一区二区| 91超精品碰国产在线观看| 日本熟妇熟女久久综合| 一区二区在线激情视频| 一区二区不卡免费观看免费| 欧美日韩精品久久第一页| 丰满人妻熟妇乱又伦精另类视频| 精品国产av一区二区三区不卡蜜 | 国产精品日韩欧美一区二区| 日韩丝袜诱惑一区二区| 久久91精品国产亚洲| 亚洲国产精品肉丝袜久久| 欧美熟妇喷浆一区二区| 亚洲av熟女国产一区二区三区站|