基于深度學習的圖像壓縮方法研究
發(fā)布時間:2021-11-02 12:17
近年來,隨著拍照設備的不斷升級,存儲圖片所需的內存空間飛速增長,然而硬盤、U盤等存儲設備的容量卻增長緩慢。不斷增長的圖片數據量與有限的存儲容量之間的矛盾給圖像壓縮帶來了巨大的挑戰(zhàn)。深度學習已經在處理目標檢測、跟蹤、分類等諸多圖像問題中取得了巨大突破,然而深度學習在圖像壓縮領域目前還并沒有被充分研究。本文將利用深度學習在圖像處理方面的優(yōu)勢,使用深度學習來提升圖像壓縮性能。本文首先設計了基于卷積神經網絡的自編碼器,包含圖像編碼網絡和解碼網絡。編碼時,將待壓縮的圖像輸入網絡,然后逐步降低圖像的空間尺度和特征圖數目,并通過量化將對于圖像質量影響小的信息去除,從而達到數據壓縮的目的。解碼時,通過卷積和像素重排結構逐步將圖像的尺度恢復,最終重構輸入圖像。本文在實驗中詳細對比了量化層、子像素卷積層等結構對壓縮效果的影響,對深度網絡在圖像壓縮領域的應用有重要指導意義。然后本文設計了卷積神經網絡與JPEG結合的編解碼框架。首先將待壓縮的圖片送入空域冗余去除結構,初步去除因圖像局部相似而產生的信息冗余,然后使用JPEG編碼,將圖片變換到DCT域,通過量化去除對于圖像質量影響較小的高頻信息。當需要解碼時,使...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題的研究目的和意義
1.1.1 圖像壓縮的必要性
1.1.2 深度學習在圖像處理方面的潛力
1.2 國內外研究背景及現狀
1.2.1 傳統(tǒng)圖像壓縮技術的發(fā)展
1.2.2 深度學習的發(fā)展
1.2.3 圖像壓縮與深度學習的結合
1.3 論文內容及結構
第2章 圖像壓縮及深度學習理論基礎
2.1 圖像信息理論
2.1.1 圖像的信息量
2.1.2 圖像信息的頻域統(tǒng)計特性
2.2 圖像壓縮理論基礎
2.2.1 DCT變換
2.2.2 量化
2.2.3 熵編碼
2.2.4 圖像質量評價方法
2.3 深度學習理論基礎
2.3.1 神經網絡的反向傳播過程
2.3.2 深度學習的基礎模型
2.3.3 卷積神經網絡
2.4 本章小結
第3章 基于卷積神經網絡的圖像壓縮技術
3.1 卷積神經網絡
3.1.1 卷積層參數
3.1.2 多層卷積的感受野
3.2 基于卷積神經網絡的自編碼器
3.2.1 自編碼器
3.2.2 網絡結構
3.2.3 網絡結構實現細節(jié)
3.2.4 數據集預處理
3.2.5 實驗結果與分析
3.3 基于卷積神經網絡和JPEG結合的壓縮框架
3.3.1 網絡結構
3.3.2 實現細節(jié)
3.3.3 實驗結果與分析
3.4 本章小結
第4章 面向手勢分類問題的圖像壓縮技術
4.1 面向手勢分類問題的圖像壓縮框架
4.1.1 網絡整體結構
4.1.2 分類網絡的設計
4.2 壓縮網絡和分類網絡的聯合訓練方式
4.2.1 有監(jiān)督的交替訓練
4.2.2 有監(jiān)督的串聯訓練
4.2.3 無監(jiān)督的對抗網絡訓練
4.3 實驗結果與分析
4.4 本章小結
結論
參考文獻
攻讀學位期間發(fā)表的論文及研究成果
致謝
【參考文獻】:
期刊論文
[1]基于DCT圖像壓縮算法的研究與仿真[J]. 吳曉云,侯茹,湯引生. 商洛學院學報. 2016(06)
[2]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
[3]基于BM神經網絡編碼的生理信號情感識別[J]. 潘聞特,申麗萍. 計算機工程與設計. 2012(03)
碩士論文
[1]基于DCT和APBT的JPEG圖像編碼算法優(yōu)化[D]. 傅齊鳴.山東大學 2016
[2]多視點編碼標準3D-AVS2中視間預測相關技術研究[D]. 馬冀.哈爾濱工業(yè)大學 2015
[3]基于小波變換的圖像壓縮感知方法研究[D]. 謝小紅.湖南大學 2012
[4]基于小波變換的圖像壓縮編碼技術的研究[D]. 路敬祎.大慶石油學院 2005
本文編號:3471969
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題的研究目的和意義
1.1.1 圖像壓縮的必要性
1.1.2 深度學習在圖像處理方面的潛力
1.2 國內外研究背景及現狀
1.2.1 傳統(tǒng)圖像壓縮技術的發(fā)展
1.2.2 深度學習的發(fā)展
1.2.3 圖像壓縮與深度學習的結合
1.3 論文內容及結構
第2章 圖像壓縮及深度學習理論基礎
2.1 圖像信息理論
2.1.1 圖像的信息量
2.1.2 圖像信息的頻域統(tǒng)計特性
2.2 圖像壓縮理論基礎
2.2.1 DCT變換
2.2.2 量化
2.2.3 熵編碼
2.2.4 圖像質量評價方法
2.3 深度學習理論基礎
2.3.1 神經網絡的反向傳播過程
2.3.2 深度學習的基礎模型
2.3.3 卷積神經網絡
2.4 本章小結
第3章 基于卷積神經網絡的圖像壓縮技術
3.1 卷積神經網絡
3.1.1 卷積層參數
3.1.2 多層卷積的感受野
3.2 基于卷積神經網絡的自編碼器
3.2.1 自編碼器
3.2.2 網絡結構
3.2.3 網絡結構實現細節(jié)
3.2.4 數據集預處理
3.2.5 實驗結果與分析
3.3 基于卷積神經網絡和JPEG結合的壓縮框架
3.3.1 網絡結構
3.3.2 實現細節(jié)
3.3.3 實驗結果與分析
3.4 本章小結
第4章 面向手勢分類問題的圖像壓縮技術
4.1 面向手勢分類問題的圖像壓縮框架
4.1.1 網絡整體結構
4.1.2 分類網絡的設計
4.2 壓縮網絡和分類網絡的聯合訓練方式
4.2.1 有監(jiān)督的交替訓練
4.2.2 有監(jiān)督的串聯訓練
4.2.3 無監(jiān)督的對抗網絡訓練
4.3 實驗結果與分析
4.4 本章小結
結論
參考文獻
攻讀學位期間發(fā)表的論文及研究成果
致謝
【參考文獻】:
期刊論文
[1]基于DCT圖像壓縮算法的研究與仿真[J]. 吳曉云,侯茹,湯引生. 商洛學院學報. 2016(06)
[2]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
[3]基于BM神經網絡編碼的生理信號情感識別[J]. 潘聞特,申麗萍. 計算機工程與設計. 2012(03)
碩士論文
[1]基于DCT和APBT的JPEG圖像編碼算法優(yōu)化[D]. 傅齊鳴.山東大學 2016
[2]多視點編碼標準3D-AVS2中視間預測相關技術研究[D]. 馬冀.哈爾濱工業(yè)大學 2015
[3]基于小波變換的圖像壓縮感知方法研究[D]. 謝小紅.湖南大學 2012
[4]基于小波變換的圖像壓縮編碼技術的研究[D]. 路敬祎.大慶石油學院 2005
本文編號:3471969
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3471969.html