基于深度學習的視頻壓縮方法研究與實現(xiàn)

發(fā)布時間：2021-10-29 22:19

　　自20世紀90年代以來,隨著數(shù)字高清電視、數(shù)字立體電視、網(wǎng)絡流媒體、無線移動視頻通信、高清視頻監(jiān)控等視頻應用的廣泛普及,海量視頻數(shù)據(jù)的存儲和傳輸成為亟需解決的兩大難題。深度學習已經(jīng)在人臉識別、目標檢測及追蹤、動作識別、視頻內(nèi)容審核等多個視頻領域取得了重要突破,然而深度學習在視頻壓縮領域并未被充分研究。本文將利用深度學習在視頻處理方面的優(yōu)勢,使用深度學習來提升視頻壓縮的性能。視頻壓縮方法有兩種思路,一種是通過壓縮單張視頻圖像以去除視頻圖像中的空間冗余,另一種是通過視頻插幀以去除視頻幀間的時間冗余�；谶@兩種思路,本文主要研究以下內(nèi)容:（1）為了去除視頻圖像中的空間冗余,本文首先設計了基于顯著性圖的自編碼網(wǎng)絡。編碼時,將待壓縮的視頻圖像幀輸入網(wǎng)絡,然后通過卷積層逐步減少圖像的特征圖數(shù)目和空間尺度,將圖像從像素空間映射到新的特征空間。然后通過量化、CABAC熵編碼去除特征空間內(nèi)的統(tǒng)計冗余,通過顯著性圖指導像素分配,最后輸出碼流得到編碼結(jié)果。實驗結(jié)果表明,在標準kodak測試集上,本文提出的自編碼網(wǎng)絡在同等低碼率情況下壓縮效果優(yōu)于JPEG,同時優(yōu)于近期發(fā)表的一種基于長短時記憶網(wǎng)絡的壓縮方法以及...

【文章來源】：哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】：76 頁

【學位級別】：碩士

【部分圖文】：

生成對抗網(wǎng)絡模型示意圖

示意圖,自編碼,網(wǎng)絡結(jié)構(gòu),示意圖

圖 3-4 自編碼器網(wǎng)絡結(jié)構(gòu)示意圖3.2.2 自編碼網(wǎng)絡結(jié)構(gòu)類似于圖 3-4 中的 Autoencoder 結(jié)構(gòu)，本文設計了一種基于顯著性圖的自編碼網(wǎng)絡。網(wǎng)絡的整體流程圖如圖 3-5 所示。其中網(wǎng)絡的輸入是從訓練集圖像中隨機截圖的 128 128 的圖像片。在圓角矩形中，Conv 表示卷積層，Conv 下方的“NK K/S”表示該層的卷積參數(shù)是：N 個大小為 K K 的卷積核、步長為 S。箭頭旁邊的數(shù)字代表經(jīng)箭頭起始處所示操作后該層數(shù)據(jù)量的變化，例如編碼器中第一個卷積下的128 64 64代表經(jīng)過該卷積層后數(shù)據(jù)量為128個64 64大小的特征圖。Residual Block 表示殘差結(jié)構(gòu)，Round 表示量化結(jié)構(gòu)，Salient map 表示利用圖像顯著性圖來指導像素分配的模塊，Subpixel 表示圖像的像素超分辨結(jié)構(gòu)。最后，兩個虛線框分別表示自編碼器的編碼結(jié)構(gòu)和解碼結(jié)構(gòu)。

數(shù)據(jù)集

哈爾濱工業(yè)大學工程碩士學位論文AC 解碼器以及自編碼網(wǎng)絡的解碼部分得到還原圖像'MX ，并根據(jù)輸還原圖像'MX 的均方誤差計算失真損失。失真損失和率損失的加權和失函數(shù)，最小化該損失即可得到模型中的參數(shù)�；陲@著性圖的圖像壓縮算法的實現(xiàn)文選取了 Raise 和 ImageNet 數(shù)據(jù)集作為自編碼網(wǎng)絡的訓練集。對于，使用全部4000張訓練圖片。由于Raise數(shù)據(jù)集的圖像大小約4000 集圖片的大小為 768 512，因此考慮將 Raise 數(shù)據(jù)集中的圖像先縮機截取 128 128 大小的圖像片作為網(wǎng)絡的輸入。對于 ImageNet 數(shù)機選取 50 個類別，然后在這些類別中再隨機地選取 200 張圖片，即張 Imagenet 數(shù)據(jù)集的圖像。隨機選擇圖像時過濾掉過曝光、尺寸過圖 3-9 展示了選取的 Raise 數(shù)據(jù)集和 ImageNet 數(shù)據(jù)集中的部分圖片

【參考文獻】：
期刊論文
[1]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang.  IEEE/CAA Journal of Automatica Sinica. 2016(02)
[2]深度學習研究進展[J]. 劉建偉,劉媛,羅雄麟.  計算機應用研究. 2014(07)
[3]數(shù)字視頻壓縮編碼技術標準現(xiàn)狀與展望[J]. 阮若林,胡瑞敏.  電視技術. 2014(03)

博士論文
[1]視頻圖像壓縮中熵編碼技術研究[D]. 高敏.哈爾濱工業(yè)大學 2016

碩士論文
[1]基于小波變換的圖像壓縮編碼技術的研究[D]. 路敬祎.大慶石油學院 2005

本文編號：3465485

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3465485.html

上一篇：基于硅溶膠凝膠分子印跡的新型傳感器研究
下一篇：基于神經(jīng)網(wǎng)絡的旗袍結(jié)構(gòu)設計研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的視頻壓縮方法研究與實現(xiàn)