基于深度學(xué)習(xí)的幀內(nèi)預(yù)測(cè)編碼技術(shù)研究
發(fā)布時(shí)間:2023-09-17 06:16
最新一代視頻壓縮標(biāo)準(zhǔn)是高性能視頻編碼(High Efficiency Video Coding,HEVC)。相比于H.264,HEVC能夠在相同主觀質(zhì)量下實(shí)現(xiàn)近一半的碼率節(jié)省。然而,HEVC中包含的主要模塊仍是經(jīng)過(guò)手工設(shè)計(jì)和優(yōu)化得到。手工設(shè)計(jì)通常依賴于信號(hào)平穩(wěn)的假設(shè),而自然視頻特性十分復(fù)雜,因此HEVC中模塊的最優(yōu)性很難保證。深度學(xué)習(xí)可以從訓(xùn)練數(shù)據(jù)中自動(dòng)學(xué)習(xí)出特征提取器,適合于解決有監(jiān)督學(xué)習(xí)問題。目前深度學(xué)習(xí)在很多計(jì)算機(jī)視覺任務(wù)中取得了巨大的成功。受此啟發(fā),本文使用深度學(xué)習(xí)來(lái)解決視頻幀內(nèi)預(yù)測(cè)中的部分問題。本文的第一個(gè)貢獻(xiàn)點(diǎn)是提出了基于深度學(xué)習(xí)的塊上采樣編碼技術(shù)。變采樣編碼,即編碼之前下采樣編碼之后上采樣,是壓縮高清視頻的一種常見策略。傳統(tǒng)的變采樣編碼方案大多采用手工設(shè)計(jì)的上采樣濾波器,極大地限制了性能。因此本文的第一個(gè)工作包含以下創(chuàng)新點(diǎn)以提升編碼性能:本文設(shè)計(jì)了用于亮度和色度分量上采樣的卷積神經(jīng)網(wǎng)絡(luò);本文提出了將上采樣卷積神經(jīng)網(wǎng)絡(luò)高效集成到幀內(nèi)編碼框架的方案;本文提出了一個(gè)兩階段上采樣過(guò)程,其中第一階段在逐塊編碼循環(huán)內(nèi),第二階段在循環(huán)之外以改善編碼單元邊界處的重建;本文推導(dǎo)了下采樣塊的...
【文章頁(yè)數(shù)】:103 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究歷史和現(xiàn)狀
1.2.1 變采樣編碼以及下、上采樣技術(shù)的發(fā)展
1.2.2 色度幀內(nèi)預(yù)測(cè)以及圖像著色
1.3 研究?jī)?nèi)容和創(chuàng)新點(diǎn)
1.3.1 基于深度學(xué)習(xí)的塊上采樣編碼技術(shù)
1.3.2 基于深度學(xué)習(xí)的塊下采樣編碼技術(shù)
1.3.3 基于深度學(xué)習(xí)的交叉通道預(yù)測(cè)技術(shù)
1.4 論文內(nèi)容安排
第2章 基礎(chǔ)知識(shí)
2.1 HEVC簡(jiǎn)介
2.1.1 HEVC基本框架
2.1.2 圖片表達(dá)
2.1.3 塊劃分
2.1.4 預(yù)測(cè)
2.1.5 變換和量化
2.1.6 熵編碼
2.1.7 環(huán)路濾波
2.2 深度學(xué)習(xí)簡(jiǎn)介
2.2.1 前饋神經(jīng)網(wǎng)絡(luò)
2.2.2 卷積神經(jīng)網(wǎng)絡(luò)
第3章 基于深度學(xué)習(xí)的塊上采樣編碼技術(shù)
3.1 提出方法的框架
3.2 提出的基于CNN的上采樣
3.2.1 基于CNN的亮度上采樣
3.2.2 基于CNN的色度上采樣
3.3 提出的編碼參數(shù)設(shè)定
3.4 提出的兩階段上采樣
3.5 實(shí)驗(yàn)結(jié)果
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 結(jié)果和分析
3.6 本章小結(jié)
第4章 基于深度學(xué)習(xí)的塊下采樣編碼技術(shù)
4.1 提出的圖像CR框架以及CNN-CR
4.1.1 基于學(xué)習(xí)的圖像CR
4.1.2 提出的CNN-CR
4.2 提出的CNN-CR的訓(xùn)練
4.2.1 單獨(dú)訓(xùn)練CNN-CR
4.2.2 聯(lián)合訓(xùn)練CNN-CR和CNN-SR
4.3 提出的將CNN-CR用于圖像壓縮的方案
4.3.1 幀級(jí)下、上采樣方案
4.3.2 塊級(jí)自適應(yīng)下、上采樣方法
4.4 實(shí)驗(yàn)結(jié)果
4.4.1 單獨(dú)訓(xùn)練的CNN-CR
4.4.2 聯(lián)合訓(xùn)練的CNN-CR
4.4.3 CNN-CR用于圖像編碼的結(jié)果
4.5 本章小結(jié)
第5章 基于深度學(xué)習(xí)的交叉通道預(yù)測(cè)技術(shù)
5.1 提出的方法
5.1.1 交叉通道預(yù)測(cè)的網(wǎng)絡(luò)框架
5.1.2 損失函數(shù)
5.1.3 網(wǎng)絡(luò)超參數(shù)
5.1.4 嵌入HEVC
5.2 實(shí)驗(yàn)結(jié)果
5.2.1 實(shí)驗(yàn)設(shè)置
5.2.2 結(jié)果和分析
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
本文編號(hào):3847171
【文章頁(yè)數(shù)】:103 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究歷史和現(xiàn)狀
1.2.1 變采樣編碼以及下、上采樣技術(shù)的發(fā)展
1.2.2 色度幀內(nèi)預(yù)測(cè)以及圖像著色
1.3 研究?jī)?nèi)容和創(chuàng)新點(diǎn)
1.3.1 基于深度學(xué)習(xí)的塊上采樣編碼技術(shù)
1.3.2 基于深度學(xué)習(xí)的塊下采樣編碼技術(shù)
1.3.3 基于深度學(xué)習(xí)的交叉通道預(yù)測(cè)技術(shù)
1.4 論文內(nèi)容安排
第2章 基礎(chǔ)知識(shí)
2.1 HEVC簡(jiǎn)介
2.1.1 HEVC基本框架
2.1.2 圖片表達(dá)
2.1.3 塊劃分
2.1.4 預(yù)測(cè)
2.1.5 變換和量化
2.1.6 熵編碼
2.1.7 環(huán)路濾波
2.2 深度學(xué)習(xí)簡(jiǎn)介
2.2.1 前饋神經(jīng)網(wǎng)絡(luò)
2.2.2 卷積神經(jīng)網(wǎng)絡(luò)
第3章 基于深度學(xué)習(xí)的塊上采樣編碼技術(shù)
3.1 提出方法的框架
3.2 提出的基于CNN的上采樣
3.2.1 基于CNN的亮度上采樣
3.2.2 基于CNN的色度上采樣
3.3 提出的編碼參數(shù)設(shè)定
3.4 提出的兩階段上采樣
3.5 實(shí)驗(yàn)結(jié)果
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 結(jié)果和分析
3.6 本章小結(jié)
第4章 基于深度學(xué)習(xí)的塊下采樣編碼技術(shù)
4.1 提出的圖像CR框架以及CNN-CR
4.1.1 基于學(xué)習(xí)的圖像CR
4.1.2 提出的CNN-CR
4.2 提出的CNN-CR的訓(xùn)練
4.2.1 單獨(dú)訓(xùn)練CNN-CR
4.2.2 聯(lián)合訓(xùn)練CNN-CR和CNN-SR
4.3 提出的將CNN-CR用于圖像壓縮的方案
4.3.1 幀級(jí)下、上采樣方案
4.3.2 塊級(jí)自適應(yīng)下、上采樣方法
4.4 實(shí)驗(yàn)結(jié)果
4.4.1 單獨(dú)訓(xùn)練的CNN-CR
4.4.2 聯(lián)合訓(xùn)練的CNN-CR
4.4.3 CNN-CR用于圖像編碼的結(jié)果
4.5 本章小結(jié)
第5章 基于深度學(xué)習(xí)的交叉通道預(yù)測(cè)技術(shù)
5.1 提出的方法
5.1.1 交叉通道預(yù)測(cè)的網(wǎng)絡(luò)框架
5.1.2 損失函數(shù)
5.1.3 網(wǎng)絡(luò)超參數(shù)
5.1.4 嵌入HEVC
5.2 實(shí)驗(yàn)結(jié)果
5.2.1 實(shí)驗(yàn)設(shè)置
5.2.2 結(jié)果和分析
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
本文編號(hào):3847171
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3847171.html
最近更新
教材專著