基于深度學(xué)習(xí)的水下圖像增強(qiáng)算法研究
發(fā)布時(shí)間:2021-06-06 01:05
水下圖像在水下機(jī)器人智能捕撈、水下導(dǎo)航以及水下工程探測等領(lǐng)域有舉足輕重的地位,清晰的水下圖像能為水下目標(biāo)檢測分類、水下礦物勘探等大型水下工程提供強(qiáng)有力的幫助和支撐。但是在實(shí)際水下工程中,水下場景拍攝難度較大,水下成像環(huán)境和光照條件較為復(fù)雜,導(dǎo)致水下圖像出現(xiàn)非常嚴(yán)重的紋理模糊、對比度低以及色彩失衡等現(xiàn)象,嚴(yán)重限制著水下圖像在海洋地理以及海洋軍事等領(lǐng)域的應(yīng)用。因此,對水下圖像質(zhì)量提升的深入研究,具有非常寶貴的理論意義和重要的實(shí)際應(yīng)用價(jià)值。所以,本文針對水下圖像存在的局部或整體模糊、色彩飽和度低等問題,提出一種基于深度學(xué)習(xí)的水下圖像增強(qiáng)算法。首先,采用一種殘差遞歸對抗網(wǎng)絡(luò)模型對水下圖像進(jìn)行去模糊處理。該模型采用多尺度體系結(jié)構(gòu),每個(gè)尺度上網(wǎng)絡(luò)模型保持一致,均采用包含四個(gè)殘差塊的遞歸塊結(jié)構(gòu)和卷積長短時(shí)記憶網(wǎng)絡(luò)單元構(gòu)成。由于模型中使用遞歸結(jié)構(gòu),使得該模型在去模糊過程的運(yùn)行時(shí)間大幅降低。本文還構(gòu)建內(nèi)容損失和對抗損失相結(jié)合的損失函數(shù),降低模型在訓(xùn)練過程中的收斂難度。而且該模型在每個(gè)尺度網(wǎng)絡(luò)中引入卷積長短時(shí)記憶網(wǎng)絡(luò)單元,采用跳躍連接的方式,實(shí)現(xiàn)水下圖像“端到端”的信息傳遞。該模型相較于其他場景去模糊模型...
【文章來源】:蘭州交通大學(xué)甘肅省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【部分圖文】:
長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
蘭州交通大學(xué)工程碩士學(xué)位論文-7-遺忘門之后保留在tc中的成分是tt1fc。3.輸出門該門的目的是利用控制單元tc確定輸出to中有多少成分輸出到隱藏層ts中;首先,經(jīng)過輸入門與遺忘門之后的狀態(tài)C,即tc實(shí)現(xiàn)公式為:1tttttcicfc(2.3)其中前一項(xiàng)為輸入門后保留在tc中的成分,后一項(xiàng)是遺忘門后保留在tc中的成分。其次,為了確定tc有多少成分保留在ts中,先給出輸出的實(shí)現(xiàn)公式為:1+totototoUxWsVc(2.4)式中的to為t時(shí)刻的輸出層的狀態(tài),最后,經(jīng)過輸出門,保留在隱藏層的成分為:tanhttthoc(2.5)雖然長短期記憶神經(jīng)網(wǎng)絡(luò)單元能夠有效處理時(shí)序數(shù)據(jù),并且被廣泛應(yīng)用于語音識別[36]、機(jī)器翻譯[37-38]、視頻識別[39]等機(jī)器學(xué)習(xí)的諸多任務(wù)中。但是當(dāng)時(shí)序數(shù)據(jù)的維度較高且空間信息較為豐富,數(shù)據(jù)特征之間具有較強(qiáng)的空間相關(guān)性時(shí),長短期記憶神經(jīng)網(wǎng)絡(luò)單元表現(xiàn)不佳。所以,文獻(xiàn)[40]中提出卷積長短期記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM),該網(wǎng)絡(luò)模型延續(xù)長短期記憶神經(jīng)網(wǎng)絡(luò)單元中“端到端”的思想,但它將原始網(wǎng)絡(luò)中“端到端”的全連接形式改變?yōu)榫矸e形式。該網(wǎng)絡(luò)模型可以最大程度地利用時(shí)序數(shù)據(jù)的空間相關(guān)性,對于捕捉和提取圖像、視頻的空間特征更加有效。卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的狀態(tài)更新圖和其內(nèi)部結(jié)構(gòu)如圖所示:圖2.2長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)狀態(tài)更新
蘭州交通大學(xué)工程碩士學(xué)位論文-8-圖2.3長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)根據(jù)上圖可以得出卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)在t時(shí)刻的狀態(tài)更新方程為:111111(**)(**)tanh(**)(**)tanh(**)tanh()txithitcititxfthftcftfttttxcthctctxothotcototxcthctctttiWXWHWCbfWXWHWCbcfCiWXWHboWXWHWCbgWXWHbhoc(2.6)式中1()(1)xxe將輸入值壓縮至[0,1]范圍;tanh()2(2)1xxxxeexxee,它同樣是將輸入值壓縮至[0,1]范圍內(nèi)。2.2生成對抗網(wǎng)絡(luò)2.2.1基本概念生成式對抗網(wǎng)絡(luò)是一種生成模型,其核心思想是從訓(xùn)練樣本中學(xué)習(xí)所對應(yīng)的概率分布,以期根據(jù)概率分布函數(shù)獲取更多的“生成”樣本來實(shí)現(xiàn)數(shù)據(jù)的擴(kuò)張。另外,它包括兩個(gè)子網(wǎng)絡(luò)模型,一個(gè)是生成模型(使得生成的“偽”圖像盡可能與“自然”圖像的分布一致),一個(gè)是判別模型(在生成的“偽”圖像與“自然”圖像之間做出正確判斷,即二分類器),實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)訓(xùn)練的方法便是讓這兩個(gè)網(wǎng)絡(luò)相互競爭,最終生成模型通過學(xué)習(xí)“自然”數(shù)據(jù)的本質(zhì)特性,從而刻畫出“自然”樣本的分布模型,生成與“自然”樣本相似的新數(shù)據(jù)。其基本原理圖如下:圖2.4生成對抗網(wǎng)絡(luò)基本原理圖
【參考文獻(xiàn)】:
期刊論文
[1]基于優(yōu)勢特征圖像融合的水下光學(xué)圖像增強(qiáng)[J]. 林森,遲凱晨,李文濤,唐延?xùn)|. 光子學(xué)報(bào). 2020(03)
[2]基于雙透射率水下成像模型的圖像顏色校正[J]. 王國霖,田建東,李鵬越. 光學(xué)學(xué)報(bào). 2019(09)
[3]基于多特征融合的單幅水下圖像清晰化[J]. 楊愛萍,田鑫,楊炳旺,王建. 天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版). 2018(10)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的水下圖像增強(qiáng)方法[J]. 徐巖,孫美雙. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2018(06)
[5]基于深度反卷積神經(jīng)網(wǎng)絡(luò)的圖像超分辨率算法[J]. 彭亞麗,張魯,張鈺,劉侍剛,郭敏. 軟件學(xué)報(bào). 2018(04)
[6]序列圖像特征提取與匹配算法的改進(jìn)[J]. 林汀,婁小平,劉鋒,李偉仙. 計(jì)算機(jī)工程與應(yīng)用. 2017(09)
[7]基于三次樣條插值的圖像放大的離散算法[J]. 王忠謙,朱寧. 蘇州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(02)
碩士論文
[1]基于多特征多尺度字典學(xué)習(xí)的超分辨率重構(gòu)算法[D]. 黎劍暉.華南理工大學(xué) 2014
本文編號:3213273
【文章來源】:蘭州交通大學(xué)甘肅省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【部分圖文】:
長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
蘭州交通大學(xué)工程碩士學(xué)位論文-7-遺忘門之后保留在tc中的成分是tt1fc。3.輸出門該門的目的是利用控制單元tc確定輸出to中有多少成分輸出到隱藏層ts中;首先,經(jīng)過輸入門與遺忘門之后的狀態(tài)C,即tc實(shí)現(xiàn)公式為:1tttttcicfc(2.3)其中前一項(xiàng)為輸入門后保留在tc中的成分,后一項(xiàng)是遺忘門后保留在tc中的成分。其次,為了確定tc有多少成分保留在ts中,先給出輸出的實(shí)現(xiàn)公式為:1+totototoUxWsVc(2.4)式中的to為t時(shí)刻的輸出層的狀態(tài),最后,經(jīng)過輸出門,保留在隱藏層的成分為:tanhttthoc(2.5)雖然長短期記憶神經(jīng)網(wǎng)絡(luò)單元能夠有效處理時(shí)序數(shù)據(jù),并且被廣泛應(yīng)用于語音識別[36]、機(jī)器翻譯[37-38]、視頻識別[39]等機(jī)器學(xué)習(xí)的諸多任務(wù)中。但是當(dāng)時(shí)序數(shù)據(jù)的維度較高且空間信息較為豐富,數(shù)據(jù)特征之間具有較強(qiáng)的空間相關(guān)性時(shí),長短期記憶神經(jīng)網(wǎng)絡(luò)單元表現(xiàn)不佳。所以,文獻(xiàn)[40]中提出卷積長短期記憶神經(jīng)網(wǎng)絡(luò)(ConvLSTM),該網(wǎng)絡(luò)模型延續(xù)長短期記憶神經(jīng)網(wǎng)絡(luò)單元中“端到端”的思想,但它將原始網(wǎng)絡(luò)中“端到端”的全連接形式改變?yōu)榫矸e形式。該網(wǎng)絡(luò)模型可以最大程度地利用時(shí)序數(shù)據(jù)的空間相關(guān)性,對于捕捉和提取圖像、視頻的空間特征更加有效。卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的狀態(tài)更新圖和其內(nèi)部結(jié)構(gòu)如圖所示:圖2.2長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)狀態(tài)更新
蘭州交通大學(xué)工程碩士學(xué)位論文-8-圖2.3長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)根據(jù)上圖可以得出卷積長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)在t時(shí)刻的狀態(tài)更新方程為:111111(**)(**)tanh(**)(**)tanh(**)tanh()txithitcititxfthftcftfttttxcthctctxothotcototxcthctctttiWXWHWCbfWXWHWCbcfCiWXWHboWXWHWCbgWXWHbhoc(2.6)式中1()(1)xxe將輸入值壓縮至[0,1]范圍;tanh()2(2)1xxxxeexxee,它同樣是將輸入值壓縮至[0,1]范圍內(nèi)。2.2生成對抗網(wǎng)絡(luò)2.2.1基本概念生成式對抗網(wǎng)絡(luò)是一種生成模型,其核心思想是從訓(xùn)練樣本中學(xué)習(xí)所對應(yīng)的概率分布,以期根據(jù)概率分布函數(shù)獲取更多的“生成”樣本來實(shí)現(xiàn)數(shù)據(jù)的擴(kuò)張。另外,它包括兩個(gè)子網(wǎng)絡(luò)模型,一個(gè)是生成模型(使得生成的“偽”圖像盡可能與“自然”圖像的分布一致),一個(gè)是判別模型(在生成的“偽”圖像與“自然”圖像之間做出正確判斷,即二分類器),實(shí)現(xiàn)整個(gè)網(wǎng)絡(luò)訓(xùn)練的方法便是讓這兩個(gè)網(wǎng)絡(luò)相互競爭,最終生成模型通過學(xué)習(xí)“自然”數(shù)據(jù)的本質(zhì)特性,從而刻畫出“自然”樣本的分布模型,生成與“自然”樣本相似的新數(shù)據(jù)。其基本原理圖如下:圖2.4生成對抗網(wǎng)絡(luò)基本原理圖
【參考文獻(xiàn)】:
期刊論文
[1]基于優(yōu)勢特征圖像融合的水下光學(xué)圖像增強(qiáng)[J]. 林森,遲凱晨,李文濤,唐延?xùn)|. 光子學(xué)報(bào). 2020(03)
[2]基于雙透射率水下成像模型的圖像顏色校正[J]. 王國霖,田建東,李鵬越. 光學(xué)學(xué)報(bào). 2019(09)
[3]基于多特征融合的單幅水下圖像清晰化[J]. 楊愛萍,田鑫,楊炳旺,王建. 天津大學(xué)學(xué)報(bào)(自然科學(xué)與工程技術(shù)版). 2018(10)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的水下圖像增強(qiáng)方法[J]. 徐巖,孫美雙. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2018(06)
[5]基于深度反卷積神經(jīng)網(wǎng)絡(luò)的圖像超分辨率算法[J]. 彭亞麗,張魯,張鈺,劉侍剛,郭敏. 軟件學(xué)報(bào). 2018(04)
[6]序列圖像特征提取與匹配算法的改進(jìn)[J]. 林汀,婁小平,劉鋒,李偉仙. 計(jì)算機(jī)工程與應(yīng)用. 2017(09)
[7]基于三次樣條插值的圖像放大的離散算法[J]. 王忠謙,朱寧. 蘇州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(02)
碩士論文
[1]基于多特征多尺度字典學(xué)習(xí)的超分辨率重構(gòu)算法[D]. 黎劍暉.華南理工大學(xué) 2014
本文編號:3213273
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3213273.html
最近更新
教材專著