面向雷達(dá)應(yīng)用的粗粒度可重構(gòu)處理器中配置通路子系統(tǒng)的設(shè)計(jì)與優(yōu)化
本文選題:粗粒度可重構(gòu)處理器 + 雷達(dá)應(yīng)用 ; 參考:《東南大學(xué)》2015年碩士論文
【摘要】:兼具高性能與靈活性的粗粒度可重構(gòu)處理器,特別適于實(shí)現(xiàn)數(shù)據(jù)量大且計(jì)算密集的雷達(dá)信號(hào)處理過(guò)程。然而,隨著雷達(dá)性能需求的不斷增長(zhǎng),可重構(gòu)處理器的計(jì)算資源成倍增加,使得配置信息量隨之變大、配置傳輸時(shí)間急劇增長(zhǎng),重構(gòu)效率低最終導(dǎo)致可重構(gòu)處理器無(wú)法展現(xiàn)其計(jì)算性能優(yōu)勢(shì)。因此,建立高效的配置管理機(jī)制對(duì)于可重構(gòu)處理器十分重要。本文針對(duì)配置通路子系統(tǒng)中配置信息量大引起的配置傳輸時(shí)間長(zhǎng)的問(wèn)題,依次開(kāi)展了下述幾項(xiàng)工作以提高重構(gòu)效率:一、分析了雷達(dá)信號(hào)處理過(guò)程,提取了其中的核心算法,并結(jié)合可重構(gòu)處理器的硬件結(jié)構(gòu)特點(diǎn)為核心算法選擇了合適的實(shí)現(xiàn)方案、進(jìn)行了運(yùn)算過(guò)程優(yōu)化:二、基于層次化配置存儲(chǔ)結(jié)構(gòu),設(shè)計(jì)了RASP配置通路子系統(tǒng)的基本結(jié)構(gòu),說(shuō)明了其工作方式,并評(píng)估了它的配置緩存訪問(wèn)性能及配置傳輸性能;三、分析了雷達(dá)核心算法的配置流特性,挖掘了算法多個(gè)并行任務(wù)的配置信息冗余規(guī)律以及算法子任務(wù)的配置信息冗余規(guī)律,并根據(jù)前者提出了配置信息的分級(jí)組織策略:四、基于雷達(dá)核心算法一個(gè)子任務(wù)的配置信息冗余規(guī)律,設(shè)計(jì)了一種基于動(dòng)態(tài)模式匹配的配置壓縮方法,在配置壓縮時(shí)動(dòng)態(tài)提取算法數(shù)據(jù)流圖中重復(fù)出現(xiàn)的基本單元的配置信息,并在解壓縮時(shí)將其動(dòng)態(tài)匹配到陣列上以得到完整的初始配置信息,在有效控制動(dòng)態(tài)解壓縮時(shí)間的同時(shí),大幅縮減了配置信息量。實(shí)驗(yàn)結(jié)果表明,在SMIC 40nm工藝下,主頻為500MHz時(shí),針對(duì)雷達(dá)核心算法,本文的配置信息分級(jí)組織策略以及基于動(dòng)態(tài)模式匹配的壓縮方法,可將陣列配置信息量縮減到原來(lái)的40%以下且解壓縮時(shí)間僅需6 ns。在配置緩存開(kāi)銷減少25%的情況下,配置組緩存命中率提升了5%-8%,陣列配置緩存命中率提升了5%-16%,RASP的重構(gòu)性能提升到原來(lái)的2.60倍以上,高于SIMD和字典壓縮方法。對(duì)于同點(diǎn)數(shù)FFT運(yùn)算,優(yōu)化后RASP的性能是其他可重構(gòu)處理器的5倍以上,對(duì)于同階數(shù)矩陣求逆運(yùn)算,優(yōu)化后RASP的性能是其他可重構(gòu)處理器的3倍以上,且RASP在很大的參數(shù)范圍內(nèi)都能取得較好的性能,系統(tǒng)靈活性較好。
[Abstract]:Coarse-grained reconfigurable processors with high performance and flexibility are especially suitable for radar signal processing with large amount of data and dense computation. However, with the increasing demand for radar performance, the computing resources of the reconfigurable processor increase exponentially, resulting in the increase of configuration information and the rapid increase of configuration transmission time. The low reconfiguration efficiency ultimately leads to the inability of the reconfigurable processor to demonstrate its computing performance advantages. Therefore, it is very important to establish efficient configuration management mechanism for reconfigurable processors. Aiming at the problem of long configuration transmission time caused by the large amount of configuration information in the configuration passageway sub-system, this paper has carried out the following work in turn to improve the reconstruction efficiency: firstly, the radar signal processing process is analyzed, and the core algorithm is extracted. Combined with the hardware structure characteristics of the reconfigurable processor, this paper selects the appropriate implementation scheme for the core algorithm, and optimizes the operation process. Secondly, based on the hierarchical configuration storage structure, the basic structure of the RASP configuration pass-through sub-system is designed. Its working mode is explained, and its configuration cache access performance and configuration transmission performance are evaluated. Thirdly, the configuration flow characteristics of radar core algorithm are analyzed. The redundancy rule of configuration information of multiple parallel tasks and the redundancy rule of configuration information of algorithm sub-task are excavated. According to the former, the hierarchical organization strategy of configuration information is put forward: fourth, Based on the redundancy rule of configuration information of a sub-task of the radar core algorithm, a configuration compression method based on dynamic pattern matching is designed to dynamically extract the configuration information of the basic units repeated in the data flow diagram of the algorithm. The initial configuration information can be obtained by matching it to the array dynamically during decompression, which can effectively control the dynamic decompression time and greatly reduce the amount of configuration information. The experimental results show that when the main frequency is 500MHz in the SMIC 40nm process, the configuration information hierarchical organization strategy and the compression method based on dynamic pattern matching are proposed for the radar core algorithm. The array configuration information can be reduced to less than 40% and the decompression time is only 6 NS. Under the condition of 25% reduction of configuration cache overhead, the hit ratio of configuration group cache increases 5-8, and the hit rate of array configuration cache increases by more than 2.60 times than that of SIMD and dictionary compression method. For the same number of FFT operations, the performance of optimized RASP is more than 5 times that of other reconfigurable processors, and the performance of optimized RASP is more than 3 times that of other reconfigurable processors for the inverse operation of the same order matrix. RASP can achieve better performance in a wide range of parameters, and the system is flexible.
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN957.51
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 華才健;蔡勇;張典華;;基于圖像繪制場(chǎng)景的壓縮方法[J];兵工自動(dòng)化;2006年07期
2 王連城;最優(yōu)時(shí)間壓縮方法[J];系統(tǒng)工程與電子技術(shù);1981年08期
3 孔祥柏;一種數(shù)據(jù)代碼壓縮方法[J];中文信息學(xué)報(bào);1988年04期
4 李建中;常值壓縮方法的信息論模型[J];黑龍江大學(xué)自然科學(xué)學(xué)報(bào);1991年03期
5 李泓波;張健沛;楊靜;白勁波;初妍;張樂(lè)君;;基于社區(qū)節(jié)點(diǎn)重要性的社會(huì)網(wǎng)絡(luò)壓縮方法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年01期
6 徐慶旭;湯培京;;一種實(shí)時(shí)心電數(shù)據(jù)壓縮方法[J];中國(guó)醫(yī)療器械雜志;1988年04期
7 何紅生;數(shù)字化雷達(dá)回波資料的一種高效壓縮方法[J];氣象;1991年11期
8 楊浩秋;;斜率法——一種實(shí)時(shí)心電數(shù)據(jù)壓縮方法[J];國(guó)外醫(yī)學(xué).生物醫(yī)學(xué)工程分冊(cè);1992年02期
9 廖敬青;隆小光;毛寧;吳百海;龍建軍;;實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)管理系統(tǒng)中壓縮方法的研究[J];機(jī)床與液壓;2005年12期
10 陸軍;劉大昕;陳立巖;;基于排列組合的常數(shù)級(jí)壓縮方法[J];大連海事大學(xué)學(xué)報(bào);2008年04期
相關(guān)會(huì)議論文 前10條
1 陸軍;劉大昕;肖衛(wèi)平;張昊;陳方園;劉國(guó)現(xiàn);;常數(shù)級(jí)壓縮方法中隨機(jī)文件字節(jié)頻率統(tǒng)計(jì)研究[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
2 馮桂;林其偉;;基于區(qū)域二叉樹(shù)壓縮方法在井下圖像數(shù)據(jù)處理中的應(yīng)用[A];1997年中國(guó)地球物理學(xué)會(huì)第十三屆學(xué)術(shù)年會(huì)論文集[C];1997年
3 李慶杰;;流媒體文件壓縮方法的評(píng)價(jià)[A];華北地區(qū)高校圖協(xié)第二十四屆學(xué)術(shù)年會(huì)論文(文章)匯編[C];2010年
4 華鋼;閆軍華;胡忠建;;測(cè)控信源壓縮方法研究[A];第十四屆全國(guó)煤礦自動(dòng)化學(xué)術(shù)年會(huì)暨中國(guó)煤炭學(xué)會(huì)自動(dòng)化專業(yè)委員會(huì)學(xué)術(shù)會(huì)議論文集[C];2004年
5 張宏山;王人鵬;錢若軍;;有限元模型修正中的模型壓縮方法[A];結(jié)構(gòu)混凝土創(chuàng)新與可持續(xù)發(fā)展——第十三屆全國(guó)混凝土及預(yù)應(yīng)力混凝土學(xué)術(shù)交流會(huì)論文集[C];2005年
6 張宏山;王人鵬;錢若軍;;有限元模型修正中的模型壓縮方法[A];第六屆全國(guó)現(xiàn)代結(jié)構(gòu)工程學(xué)術(shù)研討會(huì)論文集[C];2006年
7 包小源;宋再生;唐世渭;楊冬青;王騰蛟;;QueXComp—一種支持查詢的XML壓縮方法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
8 高鴻遠(yuǎn);駱吉洲;褚濱生;;XSeq:一種支持復(fù)雜查詢的XML壓縮方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年
9 趙明;駱吉洲;李建中;高宏;;XCluster:基于聚類支持查詢的XML多文檔壓縮方法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
10 王昱;胡莘;牛瑞;;JPEG2000影像壓縮方法對(duì)航空影像自動(dòng)提取DTM精度影響的評(píng)估與分析[A];第八屆全國(guó)信號(hào)與信息處理聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2009年
相關(guān)重要報(bào)紙文章 前4條
1 四川 劉桄序 張剛;照片/圖片大小壓縮方法概覽[N];電子報(bào);2014年
2 ;WinZip 11.1簡(jiǎn)體中文版隆重上市[N];電子資訊時(shí)報(bào);2008年
3 湖北 章廣成;讓MP3變得更小[N];電腦報(bào);2002年
4 浙江 柴t,
本文編號(hào):1820820
本文鏈接:http://sikaile.net/kejilunwen/wltx/1820820.html