基于CPU+GPU異構(gòu)平臺(tái)的H.265/HEVC編碼器關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2021-07-30 06:35
近年來,隨著經(jīng)濟(jì)社會(huì)和技術(shù)的快速發(fā)展,4K超高清視頻正在逐步走入人們的生活。相比于目前普及的1080p高清視頻,4K超高清視頻達(dá)到了其8倍的數(shù)據(jù)量,但是傳輸帶寬并沒有顯著增加。盡管適用于超高清視頻壓縮的H.265/HEVC編碼標(biāo)準(zhǔn)發(fā)布己有5年之久,然而由于其較高的計(jì)算復(fù)雜度,還沒有在應(yīng)用中普及和推廣。目前對(duì)H.265/HEVC編碼器的優(yōu)化主要集中在模式快速選擇算法優(yōu)化和多線程并行方式設(shè)計(jì)方面,優(yōu)化性能還無法滿足廣電領(lǐng)域4K超高清視頻壓縮的實(shí)際應(yīng)用需求。為此,本文基于CPU+GPU的異構(gòu)平臺(tái)對(duì)H.265/HEVC編碼器耗時(shí)較多的幀內(nèi)預(yù)測(cè)和幀間預(yù)測(cè)模塊以及條帶級(jí)并行編碼的負(fù)載均衡問題進(jìn)行了研究,在保證編碼質(zhì)量的前提下,提高H.265/HEVC的編碼速度。本文主要工作如下:(1)針對(duì)GPU幀內(nèi)預(yù)測(cè)中重建像素不可獲取的問題,設(shè)計(jì)了分層的幀內(nèi)預(yù)測(cè)方法,其中每一層的預(yù)測(cè)都可以利用下一層所生成的重建像素。此外針對(duì)幀內(nèi)預(yù)測(cè)每個(gè)編碼塊的預(yù)測(cè)流程進(jìn)行了優(yōu)化,主要包括參考像素生成和參考像素濾波模塊的合并、基于梯度矩陣的幀內(nèi)預(yù)測(cè)模式預(yù)選、幀內(nèi)預(yù)測(cè)模式的像素預(yù)測(cè)和GPU端的編碼比特估計(jì)方法。(2)針對(duì)并行快速搜...
【文章來源】:山東科技大學(xué)山東省
【文章頁數(shù)】:77 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2?CPU與GPU晶體管分布圖??Fig.2.2?diagram?of?transistor?distribution?for?CPU?and?GPU??2.2.2?CUDA
?(1.1.0)? ̄??圖2.3CUDA編程模型圖??Fig.2.3?diagram?of?CUDA?programming?model??CUDA線程可以劃分為Grid和Block兩個(gè)層次,其中Grid和Block都可以??通過基于uint3定義的矢量類型指定,因此可以使用一維、二維或三維的索引來??標(biāo)識(shí)線程。由一個(gè)kernel啟動(dòng)的所有線程組成一個(gè)Grid,?—個(gè)Grid由許多Block??組成,每一個(gè)Block又由許多線程組成,而Block又會(huì)細(xì)分成更小的warp,?warp??是GPU調(diào)度的基本單元,它的大小通常包含32個(gè)線程。??除了定義grid、block和thread的多層編程模型外,CUDA也定義了自己的??內(nèi)存存儲(chǔ)模型。圖2.4展示了?CUDA的存儲(chǔ)模型圖。從圖中可以看出,在一個(gè)??CUDA編程模型中
當(dāng)GPU端數(shù)據(jù)處理完成并返回到CPU后,此時(shí)其余的線程獲取到??所需要的數(shù)據(jù),將繼續(xù)向下執(zhí)行,進(jìn)行CPU端的編碼流程。??其中,GPU端的數(shù)據(jù)處理流程如下圖2.6所示,GPU在接收到視頻幀像素??數(shù)據(jù)及其他編碼參數(shù)之后,首先判斷當(dāng)前幀是否是幀內(nèi)編碼幀,若當(dāng)前幀為幀??內(nèi)編碼幀,則進(jìn)行幀內(nèi)預(yù)測(cè);若當(dāng)前幀不是幀內(nèi)編碼幀,則需要分別進(jìn)行幀內(nèi)??和幀間的雙重預(yù)測(cè)。經(jīng)過預(yù)測(cè)之后,會(huì)得到CPU端所需要的數(shù)據(jù)一一四叉樹劃??分結(jié)構(gòu)和每一個(gè)葉子節(jié)點(diǎn)的最優(yōu)預(yù)測(cè)模式,最后將所得到的數(shù)據(jù)傳輸?shù)剑茫校丈稀??14??
【參考文獻(xiàn)】:
期刊論文
[1]低復(fù)雜度的HEVC幀內(nèi)編碼模式?jīng)Q策算法[J]. 朱威,張晗鈺,易瑤,張樺. 小型微型計(jì)算機(jī)系統(tǒng). 2017(12)
[2]利用運(yùn)動(dòng)信息及率失真代價(jià)的HEVC幀間快速算法[J]. 羅志偉,馮桂. 計(jì)算機(jī)工程與應(yīng)用. 2017(21)
[3]一種HEVC幀內(nèi)編碼的快速算法[J]. 唐浩漾,荊倩,程穎濤,郭娜. 計(jì)算機(jī)工程與應(yīng)用. 2017(18)
[4]Fast prediction unit selection method for HEVC intra prediction based on salient regions[J]. 馮磊,戴明,趙春蕾,熊晶瑩. Optoelectronics Letters. 2016(04)
[5]H.264中的整數(shù)DCT及其蝶形算法[J]. 孫少林,湯偉,任小青,申莉華. 信息技術(shù). 2013(10)
[6]H.264并行編碼中負(fù)載平衡方法[J]. 侯興松,劉大齊,盛凱,頓玉潔. 中國(guó)圖象圖形學(xué)報(bào). 2012(08)
碩士論文
[1]HEVC關(guān)鍵模塊并行算法的設(shè)計(jì)與基于GPU的實(shí)現(xiàn)[D]. 張維龍.大連理工大學(xué) 2016
[2]基于CUDA的HEVC/H.265環(huán)路濾波并行優(yōu)化[D]. 梅鴻雁.華中科技大學(xué) 2014
[3]HEVC編解碼算法的CUDA優(yōu)化[D]. 徐榮飛.北京郵電大學(xué) 2013
本文編號(hào):3310904
【文章來源】:山東科技大學(xué)山東省
【文章頁數(shù)】:77 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2?CPU與GPU晶體管分布圖??Fig.2.2?diagram?of?transistor?distribution?for?CPU?and?GPU??2.2.2?CUDA
?(1.1.0)? ̄??圖2.3CUDA編程模型圖??Fig.2.3?diagram?of?CUDA?programming?model??CUDA線程可以劃分為Grid和Block兩個(gè)層次,其中Grid和Block都可以??通過基于uint3定義的矢量類型指定,因此可以使用一維、二維或三維的索引來??標(biāo)識(shí)線程。由一個(gè)kernel啟動(dòng)的所有線程組成一個(gè)Grid,?—個(gè)Grid由許多Block??組成,每一個(gè)Block又由許多線程組成,而Block又會(huì)細(xì)分成更小的warp,?warp??是GPU調(diào)度的基本單元,它的大小通常包含32個(gè)線程。??除了定義grid、block和thread的多層編程模型外,CUDA也定義了自己的??內(nèi)存存儲(chǔ)模型。圖2.4展示了?CUDA的存儲(chǔ)模型圖。從圖中可以看出,在一個(gè)??CUDA編程模型中
當(dāng)GPU端數(shù)據(jù)處理完成并返回到CPU后,此時(shí)其余的線程獲取到??所需要的數(shù)據(jù),將繼續(xù)向下執(zhí)行,進(jìn)行CPU端的編碼流程。??其中,GPU端的數(shù)據(jù)處理流程如下圖2.6所示,GPU在接收到視頻幀像素??數(shù)據(jù)及其他編碼參數(shù)之后,首先判斷當(dāng)前幀是否是幀內(nèi)編碼幀,若當(dāng)前幀為幀??內(nèi)編碼幀,則進(jìn)行幀內(nèi)預(yù)測(cè);若當(dāng)前幀不是幀內(nèi)編碼幀,則需要分別進(jìn)行幀內(nèi)??和幀間的雙重預(yù)測(cè)。經(jīng)過預(yù)測(cè)之后,會(huì)得到CPU端所需要的數(shù)據(jù)一一四叉樹劃??分結(jié)構(gòu)和每一個(gè)葉子節(jié)點(diǎn)的最優(yōu)預(yù)測(cè)模式,最后將所得到的數(shù)據(jù)傳輸?shù)剑茫校丈稀??14??
【參考文獻(xiàn)】:
期刊論文
[1]低復(fù)雜度的HEVC幀內(nèi)編碼模式?jīng)Q策算法[J]. 朱威,張晗鈺,易瑤,張樺. 小型微型計(jì)算機(jī)系統(tǒng). 2017(12)
[2]利用運(yùn)動(dòng)信息及率失真代價(jià)的HEVC幀間快速算法[J]. 羅志偉,馮桂. 計(jì)算機(jī)工程與應(yīng)用. 2017(21)
[3]一種HEVC幀內(nèi)編碼的快速算法[J]. 唐浩漾,荊倩,程穎濤,郭娜. 計(jì)算機(jī)工程與應(yīng)用. 2017(18)
[4]Fast prediction unit selection method for HEVC intra prediction based on salient regions[J]. 馮磊,戴明,趙春蕾,熊晶瑩. Optoelectronics Letters. 2016(04)
[5]H.264中的整數(shù)DCT及其蝶形算法[J]. 孫少林,湯偉,任小青,申莉華. 信息技術(shù). 2013(10)
[6]H.264并行編碼中負(fù)載平衡方法[J]. 侯興松,劉大齊,盛凱,頓玉潔. 中國(guó)圖象圖形學(xué)報(bào). 2012(08)
碩士論文
[1]HEVC關(guān)鍵模塊并行算法的設(shè)計(jì)與基于GPU的實(shí)現(xiàn)[D]. 張維龍.大連理工大學(xué) 2016
[2]基于CUDA的HEVC/H.265環(huán)路濾波并行優(yōu)化[D]. 梅鴻雁.華中科技大學(xué) 2014
[3]HEVC編解碼算法的CUDA優(yōu)化[D]. 徐榮飛.北京郵電大學(xué) 2013
本文編號(hào):3310904
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/3310904.html
最近更新
教材專著