天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的視頻壓縮方法研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-10-29 22:19
  自20世紀(jì)90年代以來(lái),隨著數(shù)字高清電視、數(shù)字立體電視、網(wǎng)絡(luò)流媒體、無(wú)線移動(dòng)視頻通信、高清視頻監(jiān)控等視頻應(yīng)用的廣泛普及,海量視頻數(shù)據(jù)的存儲(chǔ)和傳輸成為亟需解決的兩大難題。深度學(xué)習(xí)已經(jīng)在人臉識(shí)別、目標(biāo)檢測(cè)及追蹤、動(dòng)作識(shí)別、視頻內(nèi)容審核等多個(gè)視頻領(lǐng)域取得了重要突破,然而深度學(xué)習(xí)在視頻壓縮領(lǐng)域并未被充分研究。本文將利用深度學(xué)習(xí)在視頻處理方面的優(yōu)勢(shì),使用深度學(xué)習(xí)來(lái)提升視頻壓縮的性能。視頻壓縮方法有兩種思路,一種是通過(guò)壓縮單張視頻圖像以去除視頻圖像中的空間冗余,另一種是通過(guò)視頻插幀以去除視頻幀間的時(shí)間冗余。基于這兩種思路,本文主要研究以下內(nèi)容:(1)為了去除視頻圖像中的空間冗余,本文首先設(shè)計(jì)了基于顯著性圖的自編碼網(wǎng)絡(luò)。編碼時(shí),將待壓縮的視頻圖像幀輸入網(wǎng)絡(luò),然后通過(guò)卷積層逐步減少圖像的特征圖數(shù)目和空間尺度,將圖像從像素空間映射到新的特征空間。然后通過(guò)量化、CABAC熵編碼去除特征空間內(nèi)的統(tǒng)計(jì)冗余,通過(guò)顯著性圖指導(dǎo)像素分配,最后輸出碼流得到編碼結(jié)果。實(shí)驗(yàn)結(jié)果表明,在標(biāo)準(zhǔn)kodak測(cè)試集上,本文提出的自編碼網(wǎng)絡(luò)在同等低碼率情況下壓縮效果優(yōu)于JPEG,同時(shí)優(yōu)于近期發(fā)表的一種基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的壓縮方法以及... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:76 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的視頻壓縮方法研究與實(shí)現(xiàn)


生成對(duì)抗網(wǎng)絡(luò)模型示意圖

示意圖,自編碼,網(wǎng)絡(luò)結(jié)構(gòu),示意圖


圖 3-4 自編碼器網(wǎng)絡(luò)結(jié)構(gòu)示意圖3.2.2 自編碼網(wǎng)絡(luò)結(jié)構(gòu)類(lèi)似于圖 3-4 中的 Autoencoder 結(jié)構(gòu),本文設(shè)計(jì)了一種基于顯著性圖的自編碼網(wǎng)絡(luò)。網(wǎng)絡(luò)的整體流程圖如圖 3-5 所示。其中網(wǎng)絡(luò)的輸入是從訓(xùn)練集圖像中隨機(jī)截圖的 128 128 的圖像片。在圓角矩形中,Conv 表示卷積層,Conv 下方的“NK K/S”表示該層的卷積參數(shù)是:N 個(gè)大小為 K K 的卷積核、步長(zhǎng)為 S。箭頭旁邊的數(shù)字代表經(jīng)箭頭起始處所示操作后該層數(shù)據(jù)量的變化,例如編碼器中第一個(gè)卷積下的128 64 64代表經(jīng)過(guò)該卷積層后數(shù)據(jù)量為128個(gè)64 64大小的特征圖。Residual Block 表示殘差結(jié)構(gòu),Round 表示量化結(jié)構(gòu),Salient map 表示利用圖像顯著性圖來(lái)指導(dǎo)像素分配的模塊,Subpixel 表示圖像的像素超分辨結(jié)構(gòu)。最后,兩個(gè)虛線框分別表示自編碼器的編碼結(jié)構(gòu)和解碼結(jié)構(gòu)。

數(shù)據(jù)集


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文AC 解碼器以及自編碼網(wǎng)絡(luò)的解碼部分得到還原圖像'MX ,并根據(jù)輸還原圖像'MX 的均方誤差計(jì)算失真損失。失真損失和率損失的加權(quán)和失函數(shù),最小化該損失即可得到模型中的參數(shù)。基于顯著性圖的圖像壓縮算法的實(shí)現(xiàn)文選取了 Raise 和 ImageNet 數(shù)據(jù)集作為自編碼網(wǎng)絡(luò)的訓(xùn)練集。對(duì)于,使用全部4000張訓(xùn)練圖片。由于Raise數(shù)據(jù)集的圖像大小約4000 集圖片的大小為 768 512,因此考慮將 Raise 數(shù)據(jù)集中的圖像先縮機(jī)截取 128 128 大小的圖像片作為網(wǎng)絡(luò)的輸入。對(duì)于 ImageNet 數(shù)機(jī)選取 50 個(gè)類(lèi)別,然后在這些類(lèi)別中再隨機(jī)地選取 200 張圖片,即 張 Imagenet 數(shù)據(jù)集的圖像。隨機(jī)選擇圖像時(shí)過(guò)濾掉過(guò)曝光、尺寸過(guò)圖 3-9 展示了選取的 Raise 數(shù)據(jù)集和 ImageNet 數(shù)據(jù)集中的部分圖片

【參考文獻(xiàn)】:
期刊論文
[1]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang.  IEEE/CAA Journal of Automatica Sinica. 2016(02)
[2]深度學(xué)習(xí)研究進(jìn)展[J]. 劉建偉,劉媛,羅雄麟.  計(jì)算機(jī)應(yīng)用研究. 2014(07)
[3]數(shù)字視頻壓縮編碼技術(shù)標(biāo)準(zhǔn)現(xiàn)狀與展望[J]. 阮若林,胡瑞敏.  電視技術(shù). 2014(03)

博士論文
[1]視頻圖像壓縮中熵編碼技術(shù)研究[D]. 高敏.哈爾濱工業(yè)大學(xué) 2016

碩士論文
[1]基于小波變換的圖像壓縮編碼技術(shù)的研究[D]. 路敬祎.大慶石油學(xué)院 2005



本文編號(hào):3465485

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3465485.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d7e22***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com