基于SIMD的媒體處理器的數(shù)據(jù)存儲(chǔ)與組織體系結(jié)構(gòu)優(yōu)化研究
發(fā)布時(shí)間:2020-06-08 09:22
【摘要】: 基于SIMD技術(shù)的媒體處理器在多媒體處理領(lǐng)域憑借著其良好的可編程性和高性能而備受關(guān)注。但是其性能的進(jìn)一步提高卻受制于一些非運(yùn)算的因素,也就是通常所說的數(shù)據(jù)存儲(chǔ)與組織。這主要是由多媒體處理的數(shù)據(jù)訪問的靈活性和SIMD技術(shù)對(duì)算法的規(guī)整性的高度依賴性所導(dǎo)致。為了進(jìn)一步的開發(fā)基于SIMD技術(shù)的媒體處理器的性能,本文分別從數(shù)據(jù)組織和存儲(chǔ)兩個(gè)方面來對(duì)其進(jìn)行體系結(jié)構(gòu)的優(yōu)化。 首先,在數(shù)據(jù)組織方面,本文提出了一種基于顯式數(shù)據(jù)置換的EDO-SIMD指令集體系結(jié)構(gòu)。它將數(shù)據(jù)置換信息顯式地聲明在了指令字當(dāng)中,同時(shí)將數(shù)據(jù)置換操作與數(shù)據(jù)計(jì)算和存儲(chǔ)操作結(jié)合起來,通過這樣的方法來降低由數(shù)據(jù)組織指令所帶來的非計(jì)算開銷。本文還給出了在一個(gè)baseline SIMD媒體處理器的基礎(chǔ)上實(shí)現(xiàn)EDO-SIMD指令集體系結(jié)構(gòu)的方法。基于H.264/AVC實(shí)時(shí)解碼器的Benchmark實(shí)驗(yàn)結(jié)果表明,在僅僅只在硬件面積上增加了0.49%的情況下,所提出的EDO-SIMD可以達(dá)到1.34~1.40的性能加速比以及減少17.7%的代碼長(zhǎng)度。 然后,本文分別從兩個(gè)方向上探討了SIMD媒體處理器的片上存儲(chǔ)系統(tǒng)的優(yōu)化方案。其一是研究如何能將流訪問與面向二維邏輯數(shù)據(jù)空間的并行存儲(chǔ)器結(jié)合起來,在這個(gè)方面,本文提出了一個(gè)基于地址交織的二維流存儲(chǔ)系統(tǒng)。該存儲(chǔ)系統(tǒng)完成了二維邏輯空間到物理空間上并行存儲(chǔ)器模塊的映射。數(shù)據(jù)在物理存儲(chǔ)器上進(jìn)行了交織存放以支持行陣列和列陣列的同時(shí)訪問。該交織算法在之前的交織算法基礎(chǔ)上做了面向流訪問的改進(jìn)。基于H.264/AVC實(shí)時(shí)解碼器的Benchmark實(shí)驗(yàn)結(jié)果表明,所述的二維流存儲(chǔ)系統(tǒng)可以減少平均約32.0%的存儲(chǔ)器訪問率以及25.4%的實(shí)時(shí)處理中所需的時(shí)鐘周期數(shù)。 在另一方面,本文致力于研究如何改進(jìn)傳統(tǒng)的基于線性偏差的地址 交織策略來解決其存儲(chǔ)器冗余和無法支持模尋址的問題。本文提出了一種優(yōu)化的基于線性偏差的交織策略,它采用了2pq(pq表示并行的數(shù)據(jù)通路路數(shù))個(gè)存儲(chǔ)器模塊。為了克服在這種情況下帶來的存儲(chǔ)器模塊沖突,所提出的交織策略在二維邏輯數(shù)據(jù)空間的水平方向上采用了線性的地址偏差,而在垂直方向上采用了非線性的地址偏差。實(shí)驗(yàn)結(jié)果表明,與之前的線性偏差交織策略相比,在pq=4或8的情況下,這里所提出的優(yōu)化交織策略可以減少平均13.6%的片上存儲(chǔ)器面積;在運(yùn)動(dòng)估計(jì)的Bechmark的測(cè)試下,可以減少平均35.5%的片外存儲(chǔ)器的帶寬。
【圖文】:
圖1一l視頻應(yīng)用數(shù)據(jù)類型和精度的分布對(duì)于傳統(tǒng)的通用處理器而言,它的片上存儲(chǔ)器通常只包含一個(gè)存儲(chǔ)器模塊,這個(gè)存儲(chǔ)器模塊的一個(gè)entry就是一個(gè)字,每個(gè)字又被分為若干個(gè)子字從而進(jìn)行子字的并行。其中地址是按字(word)對(duì)齊的。假如要訪問的數(shù)據(jù)也是嚴(yán)格的按照字進(jìn)行地址對(duì)齊的話,那么這種子字并行的體系結(jié)構(gòu)將工作的非常完美而且數(shù)據(jù)通路也將被充分利用。可是在多媒體處理中,事實(shí)往往并非如此,從而使得要想一個(gè)多媒體處理的應(yīng)用能夠完全利用所謂的子字并行變的非常復(fù)雜。尤其是視頻處理中的運(yùn)動(dòng)估計(jì),該算法中的大量一尋址都依賴于高效的非對(duì)齊的地址訪問,也就是說一個(gè)數(shù)據(jù)字可以從內(nèi)存中的任意一個(gè)位置開始。這種存儲(chǔ)器模式被成為按字節(jié)對(duì)齊的模式。當(dāng)前,地址按字節(jié)對(duì)齊的重要性已經(jīng)為一些高性能處理器所接受和支持。比如IntelPentiumMMx[61,TexasInstrumentsC62x{7],StarCore[81,和TriMedia[9]這一類處理
(x飛3飛4‘ 16.‘1巧)’(h2,hZ力2,h2)(沉jZ一13“飛4“15)’功3,h3力3,h3)圖2一 6FIR核心的土要數(shù)據(jù)操作因此這里新增加了一個(gè)數(shù)據(jù)置換網(wǎng)絡(luò)PNZ到了a中,這樣所實(shí)現(xiàn)的體系結(jié)構(gòu)就是load指令只能將數(shù)據(jù)按照存儲(chǔ)順序從存儲(chǔ)器中讀出,,但是運(yùn)算指令可以靈活地改變這些數(shù)據(jù)的組織順序并進(jìn)行計(jì)算。這樣對(duì)于上面這個(gè)例子來講,只需要一次性將xlZ到xlg從存儲(chǔ)器中l(wèi)oad到寄存器中,隨后的各個(gè)計(jì)算指令只需要根據(jù)自己的組織順序的需要從寄存器文件中讀出這些數(shù)據(jù)即可,而寄存器文件的讀寫速度要遠(yuǎn)高于存儲(chǔ)器,因此這樣就消除了可能帶來的新的讀寫瓶頸。圖2一7.b給出了數(shù)據(jù)置換網(wǎng)絡(luò)PNZ的微體系結(jié)構(gòu)。山于它是安插在了RF和EXO這兩級(jí)流水線之間,因此它必定會(huì)延長(zhǎng)這一段的時(shí)延。
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:TP37;TP333
本文編號(hào):2702867
【圖文】:
圖1一l視頻應(yīng)用數(shù)據(jù)類型和精度的分布對(duì)于傳統(tǒng)的通用處理器而言,它的片上存儲(chǔ)器通常只包含一個(gè)存儲(chǔ)器模塊,這個(gè)存儲(chǔ)器模塊的一個(gè)entry就是一個(gè)字,每個(gè)字又被分為若干個(gè)子字從而進(jìn)行子字的并行。其中地址是按字(word)對(duì)齊的。假如要訪問的數(shù)據(jù)也是嚴(yán)格的按照字進(jìn)行地址對(duì)齊的話,那么這種子字并行的體系結(jié)構(gòu)將工作的非常完美而且數(shù)據(jù)通路也將被充分利用。可是在多媒體處理中,事實(shí)往往并非如此,從而使得要想一個(gè)多媒體處理的應(yīng)用能夠完全利用所謂的子字并行變的非常復(fù)雜。尤其是視頻處理中的運(yùn)動(dòng)估計(jì),該算法中的大量一尋址都依賴于高效的非對(duì)齊的地址訪問,也就是說一個(gè)數(shù)據(jù)字可以從內(nèi)存中的任意一個(gè)位置開始。這種存儲(chǔ)器模式被成為按字節(jié)對(duì)齊的模式。當(dāng)前,地址按字節(jié)對(duì)齊的重要性已經(jīng)為一些高性能處理器所接受和支持。比如IntelPentiumMMx[61,TexasInstrumentsC62x{7],StarCore[81,和TriMedia[9]這一類處理
(x飛3飛4‘ 16.‘1巧)’(h2,hZ力2,h2)(沉jZ一13“飛4“15)’功3,h3力3,h3)圖2一 6FIR核心的土要數(shù)據(jù)操作因此這里新增加了一個(gè)數(shù)據(jù)置換網(wǎng)絡(luò)PNZ到了a中,這樣所實(shí)現(xiàn)的體系結(jié)構(gòu)就是load指令只能將數(shù)據(jù)按照存儲(chǔ)順序從存儲(chǔ)器中讀出,,但是運(yùn)算指令可以靈活地改變這些數(shù)據(jù)的組織順序并進(jìn)行計(jì)算。這樣對(duì)于上面這個(gè)例子來講,只需要一次性將xlZ到xlg從存儲(chǔ)器中l(wèi)oad到寄存器中,隨后的各個(gè)計(jì)算指令只需要根據(jù)自己的組織順序的需要從寄存器文件中讀出這些數(shù)據(jù)即可,而寄存器文件的讀寫速度要遠(yuǎn)高于存儲(chǔ)器,因此這樣就消除了可能帶來的新的讀寫瓶頸。圖2一7.b給出了數(shù)據(jù)置換網(wǎng)絡(luò)PNZ的微體系結(jié)構(gòu)。山于它是安插在了RF和EXO這兩級(jí)流水線之間,因此它必定會(huì)延長(zhǎng)這一段的時(shí)延。
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類號(hào)】:TP37;TP333
【引證文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 蘇和;基于形狀信息的醫(yī)學(xué)圖像配準(zhǔn)研究[D];上海交通大學(xué);2008年
本文編號(hào):2702867
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2702867.html
最近更新
教材專著