3D視頻編碼中深度信息優(yōu)化及場景背景編碼技術(shù)研究
發(fā)布時間:2017-08-11 12:17
本文關(guān)鍵詞:3D視頻編碼中深度信息優(yōu)化及場景背景編碼技術(shù)研究
更多相關(guān)文章: 3D視頻編碼 深度圖 多視點紋理加深度 視頻分割 背景合成
【摘要】:隨著科技的進步,網(wǎng)絡(luò)通信技術(shù)、數(shù)字多媒體技術(shù)以及計算機視覺技術(shù)都得到快速的發(fā)展,進而促進了圖像采集水平的不斷提高以及多媒體應(yīng)用中數(shù)字視頻業(yè)務(wù)的不斷擴大,F(xiàn)如今,多媒體應(yīng)用終端顯示的內(nèi)容也越來越豐富,基于國內(nèi)外各種標準的視頻應(yīng)用早已成為人們?nèi)粘I睢⒐ぷ、學習、娛樂、交際等方面不可缺少的東西,其中最為普遍的是三維(3D,3 Dimensional)視頻應(yīng)用。3D視頻因其恢弘的場景、逼真的視覺效果以及強烈的視覺沖擊而深受消費者喜愛。3D視頻主要是基于多視點視頻紋理加深度圖(Multi-view texture image plus depth map,MVD)的格式進行編碼的,因此,數(shù)據(jù)量非常龐大。而當前有限的網(wǎng)絡(luò)傳輸帶寬和硬件存儲資源都無法承受如此大的數(shù)據(jù)量,進而對3D視頻的存儲、傳輸以及播放造成很大的困難。因而采用多視點視頻紋理加深度圖信息編碼格式編碼的3D視頻序列的高效率壓縮,就成了當前3D視頻編碼的一個關(guān)鍵因素。因此本文針對3D視頻編碼,開展了兩項工作,意在提升3D視頻編碼效率。本文的主要研究工作是:1.提出了基于四叉樹劃分方式的深度-紋理間的運動矢量繼承當前3D-AVS 2.0編碼標準中對紋理圖和深度圖是分別進行獨立編碼的,但是,紋理圖和其相對應(yīng)的深度圖都是同一相機在同一時間同一位置同一角度對同一地點捕獲到的相同場景圖像,它們的運動特征是相似的。當前3D-AVS 2.0編碼平臺并沒有考慮它們之間的相關(guān)性,進而造成編碼比特的浪費。因此,針對3D-AVS 2.0編碼標準平臺的不足,本文提出了一種基于四叉樹劃分的方式用于實現(xiàn)深度圖紋理圖之間的運動矢量繼承,減少了信息存儲冗余,提升了視頻編碼效率。實踐表明,我們提出的方法加入平臺標準與未加入平臺標準相比,取得較好的編碼性能。2.提出了輔助視頻壓縮與分割的場景背景編碼方法現(xiàn)今,3D-HEVC編碼標準平臺HTM 10.0采用的是多視點紋理視頻加深度的編碼格式。但是,多視點紋理視頻加深度格式編碼的序列是通過多個不同位置的攝像機同時對同一場景物體進行拍攝得到的。因此,相鄰視點的紋理圖有大量重疊的背景信息,即存在嚴重的背景冗余。為了減少存在的背景冗余信息,本文提出基于3D-HEVC視頻編碼的輔助視頻壓縮和分割的場景背景合成編碼技術(shù)。也就是說,對每個視點進行視頻分割,分離前景和背景,根據(jù)相機參數(shù)以及各個視點相應(yīng)深度圖的關(guān)系,將所有視點的背景進行合成,消除了背景原有的冗余信息。合成的背景圖以及分離出來的三個前景圖替代多個視點本來的紋理圖進行編碼。與3D-HEVC原參考軟件HTM 10.0相比較,我們的方法可以在保證圖像視覺質(zhì)量的前提下,BD-rate平均編碼比特率提升了2.5%、0.73%、0.4%。分析原因,是編碼比特數(shù)降低近一半的同時,視點的PSNR也隨之降低2個d B左右。在后期研究工作,我們會在我們搭建的編碼框架中,應(yīng)用更多的視點(如10視點18視點)進行研究,希望進一步降低編碼比特數(shù),提升編碼效率。
【關(guān)鍵詞】:3D視頻編碼 深度圖 多視點紋理加深度 視頻分割 背景合成
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN919.81
【目錄】:
- 摘要4-6
- ABSTRACT6-10
- 第1章 緒論10-26
- 1.1 課題背景及研究的目的和意義10-11
- 1.2 視頻編碼標準11-13
- 1.2.1 視頻編碼的國際標準11-12
- 1.2.2 視頻編碼的國內(nèi)標準:AVS/3D-AVS12-13
- 1.3 基于 3D視頻編碼深度圖編碼的研究現(xiàn)狀13-18
- 1.4 基于 3D視頻編碼場景背景編碼的研究現(xiàn)狀18-23
- 1.4.1 基于幀的視頻編碼技術(shù)19-20
- 1.4.2 基于對象的視頻編碼20-23
- 1.5 本文的主要研究內(nèi)容以及組織結(jié)構(gòu)23-26
- 第2章 相關(guān)技術(shù)介紹26-34
- 2.1 視頻數(shù)據(jù)壓縮原理26-28
- 2.2 視頻編碼技術(shù)基本原理及核心概念28-33
- 2.2.1 預測編碼技術(shù)29-31
- 2.2.2 變換編碼技術(shù)31
- 2.2.3 量化技術(shù)31-32
- 2.2.4 熵編碼技術(shù)32-33
- 2.3 本章小結(jié)33-34
- 第3章 基于 3D-AVS 2.0 編碼標準平臺的深度信息編碼優(yōu)化技術(shù)研究34-42
- 3.1 引言34-35
- 3.2 3D-AVS 2.0 編碼標準平臺的不足35-37
- 3.3 基于四叉樹劃分的紋理-深度運動參數(shù)繼承37-39
- 3.4 實驗結(jié)果與分析39-40
- 3.5 本章小結(jié)40-42
- 第4章 基于 3D-HEVC的場景背景編碼技術(shù)研究42-53
- 4.1 引言42-43
- 4.2 輔助視頻壓縮和分割的場景背景編碼過程43-51
- 4.2.1 背景合成過程45-50
- 4.2.2 背景拆分過程50-51
- 4.3 實驗結(jié)果與分析51-52
- 4.4 本章小結(jié)52-53
- 結(jié)論53-55
- 參考文獻55-58
- 攻讀學位期間發(fā)表的論文及其它成果58-60
- 致謝60-61
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 高文,黃鐵軍;信源編碼標準AVS及其在數(shù)字電視中的應(yīng)用[J];電視技術(shù);2003年11期
,本文編號:656059
本文鏈接:http://sikaile.net/kejilunwen/wltx/656059.html
最近更新
教材專著