基于優(yōu)化學(xué)習(xí)的圖像編碼與增強(qiáng)
發(fā)布時(shí)間:2021-02-04 02:56
利用人工智能技術(shù)對(duì)圖像進(jìn)行表示、壓縮和增強(qiáng)已經(jīng)成為圖像處理、模式識(shí)別和計(jì)算機(jī)視覺等領(lǐng)域的一項(xiàng)非常重要的研究課題。本論文以數(shù)字圖像的壓縮和增強(qiáng)為研究對(duì)象,深入地研究面向圖像壓縮的圖像表示、兼容標(biāo)準(zhǔn)的多描述圖像編碼、基于深度學(xué)習(xí)的多描述圖像編碼、圖像增強(qiáng)等幾個(gè)關(guān)鍵技術(shù)。研究工作主要包括以下幾個(gè)部分:(1)提出一種虛擬編碼器監(jiān)督的圖像重采樣壓縮方法,用于解決硬量化函數(shù)的不可導(dǎo)問題。還將該方法擴(kuò)展到多描述圖像編碼,提出一種兼容JPEG標(biāo)準(zhǔn)的多描述圖像編碼方法,其中,將生成的多描述圖像互相作為對(duì)方的圖像標(biāo)簽并使用多描述距離損失有效地約束多描述生成網(wǎng)絡(luò)的學(xué)習(xí)。大量的實(shí)驗(yàn)結(jié)果驗(yàn)證了所提方法的有效性。(2)提出一種基于深度學(xué)習(xí)的多描述圖像編碼框架,該框架能夠很好地避免多描述量化器的復(fù)雜索引分配問題。首先,所提的框架構(gòu)建于自編碼器,該框架包含多描述多尺度空洞卷積編碼網(wǎng)絡(luò)和多描述殘差卷積解碼網(wǎng)絡(luò)。其次,通過一種端對(duì)端的自監(jiān)督學(xué)習(xí)得到一對(duì)標(biāo)量量化器及其重要性指示圖。在多個(gè)通用的標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果表明:所提方法的編碼性能優(yōu)于多個(gè)現(xiàn)有的多描述編碼方法,特別是在低碼率的情況下。(3)由于下采樣可以大幅...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:167 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.3?VGG網(wǎng)絡(luò)和ResNet網(wǎng)絡(luò)結(jié)構(gòu)示意圖??Fig?1.3?The?structure?diagram?of?VGG?and?ResNet?network??
實(shí)際圖像壓縮測(cè)試中TNG壓縮后圖像的多尺度結(jié)構(gòu)不相似指標(biāo)測(cè)量一直保持領(lǐng)??先地位,TNG壓縮效率比BPG提升了?100%,同時(shí)遠(yuǎn)遠(yuǎn)超過JPEG和JPEG2000,如??圖1.4所示。由此可見,我們還需要對(duì)于基于深度學(xué)習(xí)的圖像壓縮進(jìn)行深入的研??宂,特別是深度地挖掘大數(shù)據(jù)數(shù)據(jù)分布的差異性,很好地利用深度學(xué)習(xí)的相關(guān)技??術(shù)對(duì)數(shù)據(jù)進(jìn)行更高效的表示,即充分挖掘數(shù)據(jù)之間相似性、關(guān)聯(lián)性、差異性等。??①?https://bdlard.org/bpg/??②?http://www.tuccxiec.com/news/??6??
??1.5本論文的研究?jī)?nèi)容及貢獻(xiàn)??如圖1.6所示,本文主要包含三個(gè)部分內(nèi)容。首先,為了解決圖像的高效壓縮??問題,提出兼容標(biāo)準(zhǔn)的圖像編碼方法,還將其擴(kuò)展到多描述圖像編碼。與此同時(shí),??還研宄了圖像的增強(qiáng)技術(shù),我們可以使用圖像增強(qiáng)技術(shù)提升圖像編碼方法和多描??15??
【參考文獻(xiàn)】:
期刊論文
[1]基于復(fù)原理論的小波域壓縮圖像后處理算法[J]. 肖志云,文偉,彭思龍. 計(jì)算機(jī)工程與應(yīng)用. 2007(29)
[2]一種穩(wěn)健的自適應(yīng)圖像平滑算法[J]. 芮杰,吳冰,秦志遠(yuǎn),山海濤. 中國圖象圖形學(xué)報(bào). 2005(01)
[3]圖像信號(hào)的多描述編碼方法[J]. 張煒,蔣剛毅,汪增福,郁梅. 中國圖象圖形學(xué)報(bào). 2004(03)
博士論文
[1]率失真優(yōu)化的多描述編碼及其在圖像視頻通信中的應(yīng)用[D]. 范鈺華.上海交通大學(xué) 2012
[2]多描述圖像/視頻編碼的研究[D]. 白慧慧.北京交通大學(xué) 2008
[3]視頻編碼傳輸?shù)娜蒎e(cuò)糾錯(cuò)優(yōu)化方法[D]. 陳云鵬.中國科學(xué)技術(shù)大學(xué) 2006
本文編號(hào):3017603
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:167 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.3?VGG網(wǎng)絡(luò)和ResNet網(wǎng)絡(luò)結(jié)構(gòu)示意圖??Fig?1.3?The?structure?diagram?of?VGG?and?ResNet?network??
實(shí)際圖像壓縮測(cè)試中TNG壓縮后圖像的多尺度結(jié)構(gòu)不相似指標(biāo)測(cè)量一直保持領(lǐng)??先地位,TNG壓縮效率比BPG提升了?100%,同時(shí)遠(yuǎn)遠(yuǎn)超過JPEG和JPEG2000,如??圖1.4所示。由此可見,我們還需要對(duì)于基于深度學(xué)習(xí)的圖像壓縮進(jìn)行深入的研??宂,特別是深度地挖掘大數(shù)據(jù)數(shù)據(jù)分布的差異性,很好地利用深度學(xué)習(xí)的相關(guān)技??術(shù)對(duì)數(shù)據(jù)進(jìn)行更高效的表示,即充分挖掘數(shù)據(jù)之間相似性、關(guān)聯(lián)性、差異性等。??①?https://bdlard.org/bpg/??②?http://www.tuccxiec.com/news/??6??
??1.5本論文的研究?jī)?nèi)容及貢獻(xiàn)??如圖1.6所示,本文主要包含三個(gè)部分內(nèi)容。首先,為了解決圖像的高效壓縮??問題,提出兼容標(biāo)準(zhǔn)的圖像編碼方法,還將其擴(kuò)展到多描述圖像編碼。與此同時(shí),??還研宄了圖像的增強(qiáng)技術(shù),我們可以使用圖像增強(qiáng)技術(shù)提升圖像編碼方法和多描??15??
【參考文獻(xiàn)】:
期刊論文
[1]基于復(fù)原理論的小波域壓縮圖像后處理算法[J]. 肖志云,文偉,彭思龍. 計(jì)算機(jī)工程與應(yīng)用. 2007(29)
[2]一種穩(wěn)健的自適應(yīng)圖像平滑算法[J]. 芮杰,吳冰,秦志遠(yuǎn),山海濤. 中國圖象圖形學(xué)報(bào). 2005(01)
[3]圖像信號(hào)的多描述編碼方法[J]. 張煒,蔣剛毅,汪增福,郁梅. 中國圖象圖形學(xué)報(bào). 2004(03)
博士論文
[1]率失真優(yōu)化的多描述編碼及其在圖像視頻通信中的應(yīng)用[D]. 范鈺華.上海交通大學(xué) 2012
[2]多描述圖像/視頻編碼的研究[D]. 白慧慧.北京交通大學(xué) 2008
[3]視頻編碼傳輸?shù)娜蒎e(cuò)糾錯(cuò)優(yōu)化方法[D]. 陳云鵬.中國科學(xué)技術(shù)大學(xué) 2006
本文編號(hào):3017603
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3017603.html
最近更新
教材專著