基于GPU的H.264視頻編碼實現(xiàn)
發(fā)布時間:2017-06-05 04:20
本文關(guān)鍵詞:基于GPU的H.264視頻編碼實現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,視頻應用越來越普及,并且隨著處理性能、顯示設(shè)備和網(wǎng)絡(luò)性能的提升,大分辨率視頻(如高清視頻、超高清視頻)逐漸成為視頻業(yè)務的主流。隨著圖像尺寸的增加,為了追求更高的視頻壓縮性能,視頻壓縮算法的復雜度也日益增長。從H.264到現(xiàn)在的HEVC標準,視頻壓縮的復雜度也成倍增長,在現(xiàn)有的處理平臺上已經(jīng)很難滿足高清/超高清視頻圖像的實時編碼,這制約了高清視頻業(yè)務的發(fā)展。因此,研究高分辨率視頻圖像的快速編碼技術(shù)成為視頻編碼領(lǐng)域的一個研究熱點。另一方面,隨著GPU的高速發(fā)展,利用GPU進行并行計算優(yōu)化具有研發(fā)成本低、編程靈活、并行處理能力強等優(yōu)點而成為一種通行做法。因此,研究基于GPU平臺的快速視頻編碼技術(shù)具有很大的市場應用前景。 本文選擇目前視頻壓縮標準中主流的H.264編碼器作為優(yōu)化對象,研究其在GPU平臺上的并行優(yōu)化問題,以提高高清視頻圖像的編碼速度。本文取得的主要成果有: 1.本文設(shè)計和改進了H.264編碼器的GPU+CPU異構(gòu)的編程模式。該模式可以有效的降低數(shù)據(jù)在GPU和CPU之間傳輸次數(shù),提高系統(tǒng)的運行效率。 2.本文改進并實現(xiàn)了一種基于GPU平臺的H.264幀內(nèi)編碼并行計算結(jié)構(gòu)。該結(jié)構(gòu)可以降低預測編碼的數(shù)據(jù)程度,提高了幀內(nèi)編碼計算的并行化程度。 3.本文改進和實現(xiàn)了熵編碼的并行計算結(jié)構(gòu)。該算法充分利用GPU的存儲和線程特性,對亮度直流分量和交流分量、色度直流分量和交流分量進行并行處理,提高熵編碼的效率。 實驗結(jié)果表明本文實現(xiàn)的編碼器比CPU下算法加速的x264編碼器速度提升4-5倍,大幅提高了高清視頻圖像的編碼速度。
【關(guān)鍵詞】:H.264 GPU CUDA 幀內(nèi)預測編碼 熵編碼
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN919.81
【目錄】:
- 摘要4-5
- abstract5-10
- 第一章 緒論10-16
- 1.1 研究背景和意義10-13
- 1.2 基于GPU的H.264視頻編碼并行優(yōu)化研究現(xiàn)狀13-14
- 1.3 論文研究的主要內(nèi)容14
- 1.4 論文章節(jié)安排14-16
- 第二章 H.264視頻編碼原理及CUDA架構(gòu)16-33
- 2.1 H.264視頻編碼原理16-25
- 2.1.1 幀內(nèi)預測編碼17-20
- 2.1.2 幀間預測編碼20-21
- 2.1.3 DCT變換與量化21-23
- 2.1.4 熵編碼23-25
- 2.2 CUDA架構(gòu)25-32
- 2.2.1 GPGPU概述25
- 2.2.2 CUDA簡介25
- 2.2.3 CUDA硬件模型25-27
- 2.2.4 CUDA編程模型27-29
- 2.2.5 CUDA存儲器模型29-31
- 2.2.6 基于CUDA的H.264并行優(yōu)化31-32
- 2.3 本章小結(jié)32-33
- 第三章 基于CUDA平臺的H.264視頻編碼結(jié)構(gòu)并行優(yōu)化33-52
- 3.1 H.264視頻編碼的CPU+GPU混合編程結(jié)構(gòu)33
- 3.2 幀內(nèi)預測算法的GPU并行優(yōu)化33-45
- 3.2.1 幀內(nèi)預測算法數(shù)據(jù)相關(guān)性分析33-35
- 3.2.2 幀內(nèi)預測并行算法——行波流水方法的設(shè)計與實現(xiàn)35-42
- 3.2.3 幀內(nèi)預測并行算法——整幀圖像并行的方法設(shè)計與實現(xiàn)42-44
- 3.2.4 兩種并行算法的對比44-45
- 3.3 熵編碼過程的并行化45-50
- 3.3.1 CAVLC熵編碼過程中的數(shù)據(jù)相關(guān)性分析45-47
- 3.3.2 CAVLC熵編碼并行化模型47-49
- 3.3.3 CAVLC熵編碼碼流合并的并行化實現(xiàn)49-50
- 3.4 本章小結(jié)50-52
- 第四章 H.264并行算法的程序優(yōu)化52-56
- 4.1 CUDA程序優(yōu)化概述52-53
- 4.1.1 內(nèi)存密集型52
- 4.1.2 指令密集型52-53
- 4.1.3 延遲密集型53
- 4.2 CUDA程序性能分析53-55
- 4.2.1 CUDA profiler的使用53-54
- 4.2.2 基于CUDA的編碼器的程序性能分析與優(yōu)化54-55
- 4.3 本章小結(jié)55-56
- 第五章 實驗結(jié)果及分析56-62
- 5.1 本文的軟硬件環(huán)境以及視頻序列信息56-57
- 5.2 評價指標57-58
- 5.3 基于CUDA的H.264視頻編碼器各個模塊的性能分析58-60
- 5.3.1 幀內(nèi)預測模塊并行性能58-59
- 5.3.2 熵編碼模塊并行性能59-60
- 5.4 基于CUDA的H.264視頻編碼器的整體性能60-61
- 5.5 本章小結(jié)61-62
- 第六章 總結(jié)與展望62-64
- 參考文獻64-67
- 致謝67
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 錢悅;;圖形處理器CUDA編程模型的應用研究[J];計算機與數(shù)字工程;2008年12期
2 李東江;唐義平;;H.264中CAVLC的分析與實現(xiàn)[J];網(wǎng)絡(luò)安全技術(shù)與應用;2008年01期
3 張志濤;梁光明;陳明生;劉東華;王立松;;基于紋理特征的H.264幀內(nèi)預測快速算法[J];中國圖象圖形學報;2011年08期
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 任巨;基于流計算模型的視頻編碼關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2010年
本文關(guān)鍵詞:基于GPU的H.264視頻編碼實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:422922
本文鏈接:http://sikaile.net/kejilunwen/wltx/422922.html
最近更新
教材專著