天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

HEVC關(guān)鍵模塊并行算法的設(shè)計(jì)與基于GPU的實(shí)現(xiàn)

發(fā)布時(shí)間:2018-05-03 03:37

  本文選題:HEVC + 幀間預(yù)測(cè)。 參考:《大連理工大學(xué)》2016年碩士論文


【摘要】:近年來(lái)隨著高清和超高清視頻的發(fā)展,視頻應(yīng)用的多樣性和高分辨率給以往的視頻編碼標(biāo)準(zhǔn)帶來(lái)了極大的挑戰(zhàn)。為了能夠滿足視頻應(yīng)用的需求,2013年國(guó)際電信聯(lián)盟(ITU-T)的視頻編碼專(zhuān)家組和國(guó)際標(biāo)準(zhǔn)化組織(ISO/IEC)的移動(dòng)視頻專(zhuān)家組通力合作,發(fā)布了最新一代的視頻編碼標(biāo)準(zhǔn)——HEVC。相對(duì)于H.264/AVC,在相同圖像質(zhì)量的前提下,平均可以減少50%的碼率。HEVC在獲得出色視頻壓縮性能的同時(shí)其超高的計(jì)算復(fù)雜度制約了HEVC的廣泛應(yīng)用。為此有必要提高HEVC的編碼效率。GPU大量的運(yùn)算單元非常適合通用并行計(jì)算。NVIDIA公司于2007年推出的全新通用并行計(jì)算架構(gòu)(CUDA)采用類(lèi)C語(yǔ)言為實(shí)現(xiàn)大規(guī)模可并行的數(shù)據(jù)任務(wù)提供了良好的計(jì)算平臺(tái)。利用GPU的眾核特性并行實(shí)現(xiàn)視頻編碼算法已經(jīng)成為加速視頻編碼的有效解決方式。本文重點(diǎn)針對(duì)HEVC幀間預(yù)測(cè)和環(huán)路濾波的關(guān)鍵模塊進(jìn)行并行算法的設(shè)計(jì),并在CUDA平臺(tái)上編程實(shí)現(xiàn)。針對(duì)分像素插值,本文設(shè)計(jì)了一種高效的分像素插值并行算法;針對(duì)運(yùn)動(dòng)估計(jì)環(huán)節(jié),本文分別設(shè)計(jì)了基于梯狀并行的整像素和分像素運(yùn)動(dòng)搜索算法;針對(duì)DCT變換和IDCT變換,本文設(shè)計(jì)了一種基于蝶形運(yùn)算的多層級(jí)并行算法;針對(duì)量化和反量化模塊進(jìn)行并行算法的設(shè)計(jì);本文設(shè)計(jì)了一種全并行的去方塊濾波算法;針對(duì)樣點(diǎn)自適應(yīng)補(bǔ)償模塊,對(duì)邊界補(bǔ)償和邊帶補(bǔ)償分別設(shè)計(jì)了像素分類(lèi)和信息統(tǒng)計(jì)、補(bǔ)償值求取的并行算法,設(shè)計(jì)了基于對(duì)角結(jié)構(gòu)的參數(shù)融合并行算法,設(shè)計(jì)了全并行的濾波補(bǔ)償算法。本文在CPU+GPU異構(gòu)平臺(tái)上用CUDA語(yǔ)言編程實(shí)現(xiàn)了所有設(shè)計(jì)的并行算法。實(shí)驗(yàn)結(jié)果表明,對(duì)于1080P的高清視頻序列,在保證圖像重構(gòu)質(zhì)量的前提下,與原始串行算法相比,本文設(shè)計(jì)的并行算法能夠取得20倍以上的加速比,能夠有效提高幀間回路的編碼效率。
[Abstract]:In recent years, with the development of high-definition and ultra-high-definition video, the diversity and high resolution of video applications have brought great challenges to the previous video coding standards. In order to meet the needs of video applications, the Video coding expert Group of the International Telecommunication Union (ITU) in 2013 and the Mobile Video expert Group of ISO / IEC of the International Organization for Standardization (ISO / IEC) jointly issued the latest generation of video coding standard, HEVC. Compared with H.264 / AVC, with the same image quality, the average bit rate can be reduced by 50%. HEVC can achieve excellent video compression performance and its high computational complexity restricts the wide application of HEVC. Therefore, it is necessary to improve the coding efficiency of HEVC. GPU with a large number of computing units is very suitable for general parallel computing. NVIDIA introduced a new universal parallel computing architecture in 2007. It provides a good computing platform. Parallel implementation of video coding algorithm based on GPU's multikernel characteristics has become an effective solution to accelerate video coding. This paper focuses on the design of parallel algorithms for the key modules of inter-frame prediction and loop filtering in HEVC, and implements them on the CUDA platform. For sub-pixel interpolation, this paper designs an efficient sub-pixel interpolation parallel algorithm; for motion estimation, this paper designs the whole pixel and sub-pixel motion search algorithm based on ladder parallel; for DCT transform and IDCT transform, In this paper, we design a multi-level parallel algorithm based on butterfly operation; design a parallel algorithm for quantization and inverse quantization module; design a fully parallel de-block filter algorithm; For boundary compensation and sideband compensation, the parallel algorithms of pixel classification and information statistics, compensation value calculation, parameter fusion parallel algorithm based on diagonal structure and full-parallel filtering compensation algorithm are designed respectively. In this paper, all the parallel algorithms are implemented on CPU GPU heterogeneous platform with CUDA programming language. The experimental results show that the parallel algorithm designed in this paper can achieve a speedup ratio of more than 20 times compared with the original serial algorithm under the premise of guaranteeing the image reconstruction quality for 1080P high-definition video sequences. It can effectively improve the coding efficiency of the inter-frame loop.
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN919.81

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 徐云;孫廣中;鄭啟龍;吳俊敏;陳國(guó)良;;“并行算法”課程的教學(xué)與探討[J];教育與現(xiàn)代化;2008年04期

2 陳國(guó)良;孫廣中;徐云;呂敏;;并行算法研究方法學(xué)[J];計(jì)算機(jī)學(xué)報(bào);2008年09期

3 羅貴章;陳忠偉;;并行算法綜述[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2013年15期

4 謝鐵柱;吳功廣;;多項(xiàng)式幾種并行算法的比較與優(yōu)化[J];計(jì)算機(jī)工程與科學(xué);1981年01期

5 李曉梅 ,胡慶豐;并行算法的發(fā)展與展望[J];計(jì)算機(jī)工程與科學(xué);1991年03期

6 童麗,王正明,曾泳泓;自變量選擇及其并行算法[J];數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用;2001年03期

7 陳國(guó)良;昔日王榭堂前燕,飛入尋常百姓家淺談并行算法[J];新電腦;2002年12期

8 李曉梅;《可擴(kuò)展并行算法的設(shè)計(jì)與分析》簡(jiǎn)介[J];裝備指揮技術(shù)學(xué)院學(xué)報(bào);2003年02期

9 吳磊,蘆東昕,方馬;并行算法中的指針轉(zhuǎn)移技術(shù)分析[J];計(jì)算機(jī)工程;2003年22期

10 雷英杰,霍紅衛(wèi);典型并行算法的實(shí)現(xiàn)性能分析[J];空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年05期

相關(guān)會(huì)議論文 前10條

1 姚向東;;并行算法到并行結(jié)構(gòu)的映射[A];中國(guó)工程物理研究院科技年報(bào)(2001)[C];2001年

2 高華;苗世光;;城市小區(qū)尺度模式并行算法研究[A];中國(guó)氣象學(xué)會(huì)2006年年會(huì)“中尺度天氣動(dòng)力學(xué)、數(shù)值模擬和預(yù)測(cè)”分會(huì)場(chǎng)論文集[C];2006年

3 王志成;吳頌平;;多塊結(jié)構(gòu)網(wǎng)格并行算法研究[A];北京力學(xué)會(huì)第20屆學(xué)術(shù)年會(huì)論文集[C];2014年

4 焦龍;郭亞紅;紀(jì)守領(lǐng);李金寶;;基于多核計(jì)算機(jī)的分子動(dòng)力學(xué)并行算法的實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年

5 張衡;張武;;三維拋物型初邊值問(wèn)題的塊三對(duì)角可擴(kuò)展并行算法[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 王雷章;張愛(ài)武;劉曉萌;;三維建模中平面分割并行算法的設(shè)計(jì)與實(shí)現(xiàn)[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年

7 毛韶陽(yáng);李肯立;;一種基因數(shù)據(jù)的聚類(lèi)并行算法研究[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

8 左墨;藺小林;;電力系統(tǒng)暫態(tài)穩(wěn)定并行算法的進(jìn)展[A];第二屆中國(guó)水利水電巖土力學(xué)與工程學(xué)術(shù)討論會(huì)論文集(二)[C];2008年

9 樊洪明;李先庭;趙彬;任鴻澤;;有限元分布式并行算法研究[A];全國(guó)暖通空調(diào)制冷2002年學(xué)術(shù)年會(huì)論文集[C];2002年

10 侯有政;張方;;基于CUDA的動(dòng)載荷頻域識(shí)別的并行算法研究[A];第十屆全國(guó)振動(dòng)理論及應(yīng)用學(xué)術(shù)會(huì)議論文集(2011)上冊(cè)[C];2011年

相關(guān)重要報(bào)紙文章 前4條

1 ;并行算法研究進(jìn)展[N];中國(guó)計(jì)算機(jī)報(bào);2004年

2 新華社記者 奚啟新 本報(bào)通訊員 李汛 記者 喻國(guó)英;精彩人生[N];光明日?qǐng)?bào);2005年

3 新華社記者 奚啟新 本報(bào)記者 廖文根;三次選擇 無(wú)怨無(wú)悔[N];人民日?qǐng)?bào);2005年

4 清華大學(xué)計(jì)算機(jī)系 薛巍;電網(wǎng)仿真考驗(yàn)高性能計(jì)算[N];計(jì)算機(jī)世界;2006年

相關(guān)博士學(xué)位論文 前10條

1 任立波;稠密顆粒兩相流的CFD-DEM耦合并行算法及數(shù)值模擬[D];山東大學(xué);2015年

2 李雪寶;太陽(yáng)望遠(yuǎn)鏡海量數(shù)據(jù)并行處理技術(shù)研究[D];中國(guó)科學(xué)院研究生院(云南天文臺(tái));2015年

3 馬欣榮;微分動(dòng)力學(xué)方程的快速與并行算法研究[D];西安電子科技大學(xué);2015年

4 張艷;分布并行算法設(shè)計(jì)、分析與實(shí)現(xiàn)[D];電子科技大學(xué);2001年

5 杜云飛;容錯(cuò)并行算法的研究與分析[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

6 潘斌;幾何定理機(jī)器證明并行算法研究[D];中國(guó)科學(xué)院研究生院(成都計(jì)算機(jī)應(yīng)用研究所);2006年

7 駱志剛;典型結(jié)構(gòu)大型線性方程組的分布式并行算法研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2000年

8 何霞輝;基于非穩(wěn)態(tài)不可壓縮流的可擴(kuò)張并行算法研究[D];湖南大學(xué);2013年

9 戚晶晶;熱物性反問(wèn)題高效并行算法研究[D];武漢理工大學(xué);2013年

10 張愛(ài)清;可擴(kuò)展數(shù)據(jù)驅(qū)動(dòng)并行算法研究及應(yīng)用[D];中國(guó)工程物理研究院;2009年

相關(guān)碩士學(xué)位論文 前10條

1 陳權(quán);基于分布式集群的多攝像頭的目標(biāo)檢測(cè)和跟蹤的并行算法[D];南京理工大學(xué);2015年

2 馬煥煥;一類(lèi)近場(chǎng)動(dòng)力學(xué)問(wèn)題的并行算法[D];山東大學(xué);2015年

3 朱曉丹;一種神經(jīng)動(dòng)力學(xué)優(yōu)化系統(tǒng)的并行算法設(shè)計(jì)[D];大連理工大學(xué);2015年

4 張?jiān)?新一代視頻編碼技術(shù)的并行算法設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2015年

5 董蕾;基于GPU的圖像壓縮感知算法并行化研究[D];電子科技大學(xué);2015年

6 蔣昭炎;基于圖像的大場(chǎng)景三維重建并行算法研究[D];東北大學(xué);2013年

7 馮杰;基于MIC架構(gòu)的遙感圖像增強(qiáng)類(lèi)算法并行化研究[D];電子科技大學(xué);2015年

8 鄭全剛;并行生物序列算法設(shè)計(jì)與優(yōu)化[D];山東大學(xué);2016年

9 周蘭花;基于異構(gòu)計(jì)算的電磁仿真并行算法研究[D];湖南大學(xué);2016年

10 李劍威;共形組合激發(fā)參數(shù)并行算法研究[D];西南石油大學(xué);2016年



本文編號(hào):1836831

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1836831.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)0877b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com