基于深度學習的視頻圖像質量增強技術研究與應用
發(fā)布時間:2021-12-31 03:40
在傳輸帶寬或存儲受限時,視頻壓縮所帶來的壓縮噪聲明顯地影響了用戶的主觀體驗。針對這種低質量的壓縮視頻,本文利用卷積神經網絡,分別從空域,聯合時空域提出解決方法。本文的主要研究工作包括:1.從超分辨的角度提高壓縮視頻的質量。提出一種充分融合網絡多階特征的圖像超分辨率算法,充分利用神經網絡各層卷積所提取的分層特征信息。實驗結果表明所提出的網絡模型在通用4個測試集上,與深層超分辨率網絡VDSR相比,平均獲得0.22 dB增益。2.在空域利用幀內像素相關性提高壓縮視頻的質量。提出一種基于殘差塊的空域單幀圖像質量增強方法。利用局部殘差和全局殘差,設計了基于殘差塊的單幀網絡結構。結果表明,所提出的網絡模型相對于H.265/HEVC,平均獲得了0.22dB的性能增益。3.聯合時空域信息提高壓縮視頻的質量。結合視頻的時域信息,提出兩種多幀質量增強方法,一種是基于光流信息的LMVE,另一種是基于預測的STMVE。實驗結果表明,所提出的LMVE相對于H.265/HEVC,平均獲得0.38 dB的性能增益;所提出的STMVE平均獲得0.39 dB的性能增益。4.設計了一套應用于交通監(jiān)控視頻的質量增強方法。首...
【文章來源】:杭州師范大學浙江省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
基于Set5數據集,針對分辨率放大2倍,D=7,9,13,20所對應的網絡在200epoch內的收斂速度與性能對比
圖 2-4 各方法所獲得的高分辨圖像的主觀質量對比 圖 2-5 給出了各種方法的性能與參數對比,盡管 RDN 達到了所列舉方法中的最優(yōu)性能,但其參數數量高達 1500 萬,是 MFRN 的 8.8 倍。由于 SRDenseNet并未給出基于 Urban100 數據集,針對分辨率放大 2 倍的性能,因此在圖中未繪制。但經過統計,SRDenseNet 的參數數目達 430 萬,是 MFRN 的 2.4 倍。借助于遞歸網絡的優(yōu)勢,MFRN 實現了參數共享,參數數目為 170 萬,在同等規(guī)模參數的網絡中,獲得了最優(yōu)性能。
杭州師范大學碩士學位論文利用多幀的視頻圖像質量增強算法研究27圖4-2典型的時空域卷積神經網絡結構訓練策略:如[14]所述,在壓縮視頻幀之間存在非常明顯的質量波動,通常兩個HFs之間有幾個LFs。以前的工作使用這兩個HFs來幫助增強LFs,如圖4-3所示,紅色幀為HFs,藍色幀為待增強的LFs。在第一組圖像(GOP)中,圖像播放順序(POC)的序號為1到8,利用POC=0和POC=8的HFs來增強從POC=1到POC=7的LFs是很自然的,然而我們發(fā)現一個LF與其相鄰的兩個HF之間的幀距通常是不對稱的,這表明LF與其中一個HF的時間相關性較低。訓練集訓練集POC:0123456781stGOP(GOPsize=8)HFLFLFMFHFLFLFLFLF89101112131415162ndGOP(GOPsize=8)HFLFLFHFMFLFLFLFLFPOC:圖4-3所提出的訓練和測試策略為了在幀距和幀質量之間進行權衡,我們使用一對HF和MF來增強中間剩余的LFs。為了增加魯棒性,HF和MF先后順序需要定期交換。如圖4-3所示,在第一個GOP中,選取的訓練數據為:POC=0(HF),POC=2(LF),POC=4(MF),在第二個GOP,選取的訓練數據為:POC=12(MF),POC=14(LF),POC=16(HF)。通過選取HF和MF先后順序不同的GOPs,訓練后的網絡表現出更強的魯棒性。
本文編號:3559551
【文章來源】:杭州師范大學浙江省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
基于Set5數據集,針對分辨率放大2倍,D=7,9,13,20所對應的網絡在200epoch內的收斂速度與性能對比
圖 2-4 各方法所獲得的高分辨圖像的主觀質量對比 圖 2-5 給出了各種方法的性能與參數對比,盡管 RDN 達到了所列舉方法中的最優(yōu)性能,但其參數數量高達 1500 萬,是 MFRN 的 8.8 倍。由于 SRDenseNet并未給出基于 Urban100 數據集,針對分辨率放大 2 倍的性能,因此在圖中未繪制。但經過統計,SRDenseNet 的參數數目達 430 萬,是 MFRN 的 2.4 倍。借助于遞歸網絡的優(yōu)勢,MFRN 實現了參數共享,參數數目為 170 萬,在同等規(guī)模參數的網絡中,獲得了最優(yōu)性能。
杭州師范大學碩士學位論文利用多幀的視頻圖像質量增強算法研究27圖4-2典型的時空域卷積神經網絡結構訓練策略:如[14]所述,在壓縮視頻幀之間存在非常明顯的質量波動,通常兩個HFs之間有幾個LFs。以前的工作使用這兩個HFs來幫助增強LFs,如圖4-3所示,紅色幀為HFs,藍色幀為待增強的LFs。在第一組圖像(GOP)中,圖像播放順序(POC)的序號為1到8,利用POC=0和POC=8的HFs來增強從POC=1到POC=7的LFs是很自然的,然而我們發(fā)現一個LF與其相鄰的兩個HF之間的幀距通常是不對稱的,這表明LF與其中一個HF的時間相關性較低。訓練集訓練集POC:0123456781stGOP(GOPsize=8)HFLFLFMFHFLFLFLFLF89101112131415162ndGOP(GOPsize=8)HFLFLFHFMFLFLFLFLFPOC:圖4-3所提出的訓練和測試策略為了在幀距和幀質量之間進行權衡,我們使用一對HF和MF來增強中間剩余的LFs。為了增加魯棒性,HF和MF先后順序需要定期交換。如圖4-3所示,在第一個GOP中,選取的訓練數據為:POC=0(HF),POC=2(LF),POC=4(MF),在第二個GOP,選取的訓練數據為:POC=12(MF),POC=14(LF),POC=16(HF)。通過選取HF和MF先后順序不同的GOPs,訓練后的網絡表現出更強的魯棒性。
本文編號:3559551
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3559551.html
最近更新
教材專著