視頻編碼中幀間預測技術研究
發(fā)布時間:2021-05-09 08:45
在信息化高度發(fā)展的當今社會,視頻數(shù)據(jù)成為了主要的多媒體數(shù)據(jù)形式。人們對寬色域、高清晰度、高分辨率的視頻需求日益高漲,這對視頻數(shù)據(jù)的存儲、傳輸造成極大的負擔。應用現(xiàn)狀對視頻壓縮提出了更高的要求,探索更高編碼效率的壓縮技術成為國內(nèi)外研究的重點問題。本文致力于提高視頻編解碼中幀間預測技術的編碼效率,并主要從提高運動矢量的預測準確度和提高預測塊的預測準確度兩個方面著手,主要工作和貢獻包括以下幾個方面:1.提出基于虛擬運動矢量的運動矢量預測機制,解決長期參考機制下運動矢量預測值候選項不足的問題。長時運動矢量和短時運動矢量相關性弱,在現(xiàn)有的視頻編碼技術中,兩者不能交叉預測,這將導致運動矢量預測值候選項不足。為此,我們利用重建像素在參考幀上進行運動搜索導出缺失類型的運動矢量,導出的運動矢量為虛擬運動矢量。這樣保證每個編碼塊重建完成后同時具有長時運動矢量和短時運動矢量。后續(xù)塊進行運動矢量預測編碼時,可從任一相鄰塊選擇同類型的MV進行預測。同時,由于真實運動矢量置信度高于虛擬運動矢量,我們提出了基于置信度的運動矢量預測值構(gòu)造機制,使得編碼性能提升1%。2.提出了基于空間相鄰像素的自適應雙向加權預測技術,...
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:116 頁
【學位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 視頻編碼綜述
1.1.1 視頻編碼的基礎
1.1.2 混合視頻編碼框架
1.2 幀間預測技術簡介
1.2.1 HEVC中幀間預測技術
1.2.2 VVC中幀間預測技術
1.3 基于深度學習的視頻編碼技術簡介
1.3.1 基于神經(jīng)網(wǎng)絡的新編碼框架
1.3.2 基于神經(jīng)網(wǎng)絡的預測技術
1.3.3 基于神經(jīng)網(wǎng)絡的量化及熵編碼技術
1.3.4 基于神經(jīng)網(wǎng)絡的環(huán)路濾波技術
1.4 本文研究問題與內(nèi)容組織
2 長期參考機制下運動矢量預測的研究
2.1 基于知識庫的長期參考技術概述
2.1.1 知識庫構(gòu)建
2.1.2 長期參考下運動矢量預測技術
2.2 基于虛擬運動矢量的運動信息預測
2.2.1 虛擬運動矢量構(gòu)造
2.2.2 運動矢量預測列表構(gòu)建
2.3 實驗結(jié)果及討論
2.3.1 基于知識庫的長期參考技術
2.3.2 基于虛擬運動矢量的運動矢量預測
2.4 本章小結(jié)
3 自適應雙向線性加權預測的研究
3.1 雙向加權預測概述
3.2 自適應雙向加權預測的分析
3.2.1 最佳權重分布
3.2.2 均勻加權預測準確度分析
3.3 基于模板相似度的雙向加權預測
3.3.1 模板相似度度量
3.3.2 基于相似度的權重因子導出
3.4 與先進幀間預測技術耦合
3.4.1 與LIC技術耦合
3.4.2 與DMVR技術耦合
3.4.3 與BDOF技術耦合
3.5 實驗分析
3.5.1 模板相似度SAD和SATD對編碼性能的影響
3.5.2 亞像素插值對編碼性能的影響
3.5.3 空間相鄰像素步長對編碼性能的影響
3.5.4 自適應雙向加權預測的編碼性能
3.6 本章小結(jié)
4 利用空間信息的基于卷積神經(jīng)網(wǎng)絡的雙向預測
4.1 研究背景
4.1.1 幀內(nèi)幀間聯(lián)合預測
4.1.2 基于神經(jīng)網(wǎng)絡的幀間預測技術
4.2 利用空間相鄰像素的雙向預測
4.2.1 網(wǎng)絡結(jié)構(gòu)
4.2.2 HEVC中SICNN的使用
4.3 實驗分析
4.3.1 空間相鄰像素步長的影響
4.3.2 不同塊大小下編碼性能
4.3.3 兩種幀間模式的有效性分析
4.3.4 與現(xiàn)有工作進行對比
4.3.5 分析與討論
4.4 本章小結(jié)
5 利用時空信息的基于卷積神經(jīng)網(wǎng)絡的雙假設預測
5.1 問題分析
5.2 利用空間相鄰像素及時域距離的雙假設預測
5.2.1 輸入信息重要性
5.2.2 網(wǎng)絡結(jié)構(gòu)
5.2.3 集成到編解碼過程
5.3 實驗分析
5.3.1 不同幀間模式下STCNN的使用
5.3.2 時空信息有效性分析
5.3.3 與現(xiàn)有技術對比
5.3.4 與先進幀間預測技術耦合
5.3.5 編解碼性能
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 對本文的總結(jié)
6.2 對本文的展望
參考文獻
攻讀博士學位期間主要的學術成果
本文編號:3176996
【文章來源】:浙江大學浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:116 頁
【學位級別】:博士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 視頻編碼綜述
1.1.1 視頻編碼的基礎
1.1.2 混合視頻編碼框架
1.2 幀間預測技術簡介
1.2.1 HEVC中幀間預測技術
1.2.2 VVC中幀間預測技術
1.3 基于深度學習的視頻編碼技術簡介
1.3.1 基于神經(jīng)網(wǎng)絡的新編碼框架
1.3.2 基于神經(jīng)網(wǎng)絡的預測技術
1.3.3 基于神經(jīng)網(wǎng)絡的量化及熵編碼技術
1.3.4 基于神經(jīng)網(wǎng)絡的環(huán)路濾波技術
1.4 本文研究問題與內(nèi)容組織
2 長期參考機制下運動矢量預測的研究
2.1 基于知識庫的長期參考技術概述
2.1.1 知識庫構(gòu)建
2.1.2 長期參考下運動矢量預測技術
2.2 基于虛擬運動矢量的運動信息預測
2.2.1 虛擬運動矢量構(gòu)造
2.2.2 運動矢量預測列表構(gòu)建
2.3 實驗結(jié)果及討論
2.3.1 基于知識庫的長期參考技術
2.3.2 基于虛擬運動矢量的運動矢量預測
2.4 本章小結(jié)
3 自適應雙向線性加權預測的研究
3.1 雙向加權預測概述
3.2 自適應雙向加權預測的分析
3.2.1 最佳權重分布
3.2.2 均勻加權預測準確度分析
3.3 基于模板相似度的雙向加權預測
3.3.1 模板相似度度量
3.3.2 基于相似度的權重因子導出
3.4 與先進幀間預測技術耦合
3.4.1 與LIC技術耦合
3.4.2 與DMVR技術耦合
3.4.3 與BDOF技術耦合
3.5 實驗分析
3.5.1 模板相似度SAD和SATD對編碼性能的影響
3.5.2 亞像素插值對編碼性能的影響
3.5.3 空間相鄰像素步長對編碼性能的影響
3.5.4 自適應雙向加權預測的編碼性能
3.6 本章小結(jié)
4 利用空間信息的基于卷積神經(jīng)網(wǎng)絡的雙向預測
4.1 研究背景
4.1.1 幀內(nèi)幀間聯(lián)合預測
4.1.2 基于神經(jīng)網(wǎng)絡的幀間預測技術
4.2 利用空間相鄰像素的雙向預測
4.2.1 網(wǎng)絡結(jié)構(gòu)
4.2.2 HEVC中SICNN的使用
4.3 實驗分析
4.3.1 空間相鄰像素步長的影響
4.3.2 不同塊大小下編碼性能
4.3.3 兩種幀間模式的有效性分析
4.3.4 與現(xiàn)有工作進行對比
4.3.5 分析與討論
4.4 本章小結(jié)
5 利用時空信息的基于卷積神經(jīng)網(wǎng)絡的雙假設預測
5.1 問題分析
5.2 利用空間相鄰像素及時域距離的雙假設預測
5.2.1 輸入信息重要性
5.2.2 網(wǎng)絡結(jié)構(gòu)
5.2.3 集成到編解碼過程
5.3 實驗分析
5.3.1 不同幀間模式下STCNN的使用
5.3.2 時空信息有效性分析
5.3.3 與現(xiàn)有技術對比
5.3.4 與先進幀間預測技術耦合
5.3.5 編解碼性能
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 對本文的總結(jié)
6.2 對本文的展望
參考文獻
攻讀博士學位期間主要的學術成果
本文編號:3176996
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3176996.html
最近更新
教材專著