基于深度學(xué)習(xí)的多聚焦圖像融合方法研究
發(fā)布時(shí)間:2021-01-29 18:43
多聚焦圖像融合是當(dāng)前圖像融合領(lǐng)域研究的熱點(diǎn)問題,它能夠克服成像設(shè)備的景深限制,將多個(gè)聚焦在不同區(qū)域的圖像融合成一張完全清晰的全聚焦圖像,有效提高原始圖像信息的利用率。多聚焦圖像融合是一個(gè)涉及到多個(gè)學(xué)科知識(shí)的課題,該技術(shù)已被廣泛運(yùn)用到醫(yī)學(xué)、軍事、公共安全等領(lǐng)域。根據(jù)對(duì)圖像處理的方式不同,可將圖像融合分為三個(gè)層次:像素級(jí)、特征級(jí)和決策級(jí)。與后兩種層次的圖像融合方法相比,像素級(jí)圖像融合方法能夠有效減少信息的損失,更多地保留待融合圖像中的信息。然而,大部分基于像素級(jí)的融合方法需要經(jīng)驗(yàn)依賴的特征提取方法來計(jì)算聚焦度,即像素點(diǎn)的活躍度,因此本文提出了基于深度學(xué)習(xí)的融合方法來自動(dòng)提取特征。對(duì)于像素級(jí)圖像融合方法,如何更加準(zhǔn)確地檢測(cè)出聚焦區(qū)域并且獲得更豐富的邊緣信息也是這類方法的關(guān)鍵所在。本文旨在提高待融合圖像聚焦識(shí)別的能力,較好地提取圖像清晰部分以及邊緣細(xì)節(jié),并針對(duì)深度學(xué)習(xí)在多聚焦圖像融合算法中存在的問題進(jìn)行研究,提出了相應(yīng)的改進(jìn)算法。論文的主要?jiǎng)?chuàng)新性工作如下,1.針對(duì)基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的多聚焦圖像融合方法需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練,提出...
【文章來源】:江西財(cái)經(jīng)大學(xué)江西省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
可見光圖
基于深度學(xué)習(xí)的多聚焦圖像融合方法研究2人機(jī)整機(jī)會(huì)配備各種傳感器件,包括重力、紅外、Lidar、可見光等傳感器,這些都是為無人機(jī)可以在復(fù)雜的作戰(zhàn)環(huán)境下利用盡可能多的信息來更好地執(zhí)行任務(wù)所配備的,而如何將各種傳感器所捕獲的信息進(jìn)行綜合地利用則需要一項(xiàng)關(guān)鍵的技術(shù)——圖像融合技術(shù)。圖1-1給出了一組可見光與紅外圖像,在可見光圖像中,由于人與背景的顏色很相似,因此很難一眼識(shí)別出人的所在,但是場(chǎng)景信息十分地清晰;相比之下,紅外圖像中的人物信息十分顯著,但是場(chǎng)景信息確很模糊;將可見光圖像和紅外圖像進(jìn)行信息的融合以利用它們各自的顯著信息,這對(duì)無人機(jī)開展精確的目標(biāo)查找、識(shí)別等任務(wù)時(shí)有很大的幫助。近年來,像美國(guó)、日本、法國(guó)、俄羅斯等這些大國(guó)已經(jīng)發(fā)射了多顆軍用衛(wèi)星,這些衛(wèi)星早已更新?lián)Q代,配備了多種成像器件來采集圖像信息,為了能無誤地執(zhí)行任務(wù)需要對(duì)不同數(shù)據(jù)進(jìn)行綜合。在民用方面,多光譜圖像和全色圖像都只有單一功能,要么提供光譜信息,要么提供高分辨率細(xì)節(jié)信息,因此僅僅使用單一的傳感器采集到的信息并不能精確地分類地物或是對(duì)場(chǎng)景進(jìn)行理解。如圖1-2所示的是由衛(wèi)星所采集到的多光譜圖和全色圖像,一個(gè)提供了豐富的光譜信息,一個(gè)提供了豐富的細(xì)節(jié)信息。在醫(yī)學(xué)上,醫(yī)生在對(duì)病人的病情進(jìn)行評(píng)估時(shí),通常需要結(jié)合人體單個(gè)部位的多幅不同類型的影像信息來判斷病情,因?yàn)椴煌愋偷尼t(yī)學(xué)傳感器對(duì)人體組織所呈現(xiàn)的感知信息不同。如圖1-3所示的MRI圖像與人腦CT圖像,這兩張圖是對(duì)人腦同一個(gè)部位的信息采集,但是反應(yīng)的是不同的組織結(jié)構(gòu)信息,因此對(duì)這兩幅醫(yī)學(xué)影像圖進(jìn)行融合后便能夠得到一幅能夠完整描繪大腦結(jié)構(gòu)的圖像,這將有利于醫(yī)生對(duì)(a)多光譜圖像(b)全色圖像圖1-2多光譜圖像與全色圖像
第1章緒論3病人進(jìn)行全面的病情診斷。多聚焦圖像融合是圖像融合另一個(gè)子分支,其主要解決的是輸入圖像為多個(gè)不同聚焦點(diǎn)的圖像。由于成像設(shè)備本身的景深限制,在某個(gè)場(chǎng)景中,不是所有的圖像都能夠被清晰的成像。根據(jù)光學(xué)成像原理,當(dāng)場(chǎng)景中的目標(biāo)靠近鏡頭焦平面時(shí),該目標(biāo)可以在像平面上清晰地顯示,即其是聚焦的;而距離焦平面較遠(yuǎn)的目標(biāo),在像平面上將呈現(xiàn)出模糊,即目標(biāo)非聚焦。換句話就是說,只有當(dāng)目標(biāo)處在成像設(shè)備的焦平面上,該目標(biāo)才能被清晰成像[4]。圖1-4給出了一組多聚焦圖像融合的過程,通過抽取圖1-4(a)的聚焦信息和圖1-4(b)的聚焦信息,融合為一張全聚焦的清晰圖像圖1-4(c)。由于全聚焦圖像相比于初始圖像,其包含更加豐富的內(nèi)容,在實(shí)際生活中,多聚焦圖像融合技術(shù)具有以下幾個(gè)有點(diǎn):(1)減少目標(biāo)識(shí)別等各種圖像處理任務(wù)的后續(xù)工作量;(2)減少了信息的傳輸。因此,研究多聚焦圖像融合技術(shù)具有很大的現(xiàn)實(shí)意義。(a)CT圖像(b)MRI圖像圖1-3CT圖像和MRI圖像(a)左聚焦(b)右聚焦(c)融合圖像圖1-4多聚焦源圖像融合
【參考文獻(xiàn)】:
期刊論文
[1]快速離散Curvelet變換域的圖像融合[J]. 楊勇,童松,黃淑英. 中國(guó)圖象圖形學(xué)報(bào). 2015(02)
[2]基于視覺特性的多聚焦圖像融合[J]. 李樹濤,王耀南,張昌凡. 電子學(xué)報(bào). 2001(12)
本文編號(hào):3007401
【文章來源】:江西財(cái)經(jīng)大學(xué)江西省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
可見光圖
基于深度學(xué)習(xí)的多聚焦圖像融合方法研究2人機(jī)整機(jī)會(huì)配備各種傳感器件,包括重力、紅外、Lidar、可見光等傳感器,這些都是為無人機(jī)可以在復(fù)雜的作戰(zhàn)環(huán)境下利用盡可能多的信息來更好地執(zhí)行任務(wù)所配備的,而如何將各種傳感器所捕獲的信息進(jìn)行綜合地利用則需要一項(xiàng)關(guān)鍵的技術(shù)——圖像融合技術(shù)。圖1-1給出了一組可見光與紅外圖像,在可見光圖像中,由于人與背景的顏色很相似,因此很難一眼識(shí)別出人的所在,但是場(chǎng)景信息十分地清晰;相比之下,紅外圖像中的人物信息十分顯著,但是場(chǎng)景信息確很模糊;將可見光圖像和紅外圖像進(jìn)行信息的融合以利用它們各自的顯著信息,這對(duì)無人機(jī)開展精確的目標(biāo)查找、識(shí)別等任務(wù)時(shí)有很大的幫助。近年來,像美國(guó)、日本、法國(guó)、俄羅斯等這些大國(guó)已經(jīng)發(fā)射了多顆軍用衛(wèi)星,這些衛(wèi)星早已更新?lián)Q代,配備了多種成像器件來采集圖像信息,為了能無誤地執(zhí)行任務(wù)需要對(duì)不同數(shù)據(jù)進(jìn)行綜合。在民用方面,多光譜圖像和全色圖像都只有單一功能,要么提供光譜信息,要么提供高分辨率細(xì)節(jié)信息,因此僅僅使用單一的傳感器采集到的信息并不能精確地分類地物或是對(duì)場(chǎng)景進(jìn)行理解。如圖1-2所示的是由衛(wèi)星所采集到的多光譜圖和全色圖像,一個(gè)提供了豐富的光譜信息,一個(gè)提供了豐富的細(xì)節(jié)信息。在醫(yī)學(xué)上,醫(yī)生在對(duì)病人的病情進(jìn)行評(píng)估時(shí),通常需要結(jié)合人體單個(gè)部位的多幅不同類型的影像信息來判斷病情,因?yàn)椴煌愋偷尼t(yī)學(xué)傳感器對(duì)人體組織所呈現(xiàn)的感知信息不同。如圖1-3所示的MRI圖像與人腦CT圖像,這兩張圖是對(duì)人腦同一個(gè)部位的信息采集,但是反應(yīng)的是不同的組織結(jié)構(gòu)信息,因此對(duì)這兩幅醫(yī)學(xué)影像圖進(jìn)行融合后便能夠得到一幅能夠完整描繪大腦結(jié)構(gòu)的圖像,這將有利于醫(yī)生對(duì)(a)多光譜圖像(b)全色圖像圖1-2多光譜圖像與全色圖像
第1章緒論3病人進(jìn)行全面的病情診斷。多聚焦圖像融合是圖像融合另一個(gè)子分支,其主要解決的是輸入圖像為多個(gè)不同聚焦點(diǎn)的圖像。由于成像設(shè)備本身的景深限制,在某個(gè)場(chǎng)景中,不是所有的圖像都能夠被清晰的成像。根據(jù)光學(xué)成像原理,當(dāng)場(chǎng)景中的目標(biāo)靠近鏡頭焦平面時(shí),該目標(biāo)可以在像平面上清晰地顯示,即其是聚焦的;而距離焦平面較遠(yuǎn)的目標(biāo),在像平面上將呈現(xiàn)出模糊,即目標(biāo)非聚焦。換句話就是說,只有當(dāng)目標(biāo)處在成像設(shè)備的焦平面上,該目標(biāo)才能被清晰成像[4]。圖1-4給出了一組多聚焦圖像融合的過程,通過抽取圖1-4(a)的聚焦信息和圖1-4(b)的聚焦信息,融合為一張全聚焦的清晰圖像圖1-4(c)。由于全聚焦圖像相比于初始圖像,其包含更加豐富的內(nèi)容,在實(shí)際生活中,多聚焦圖像融合技術(shù)具有以下幾個(gè)有點(diǎn):(1)減少目標(biāo)識(shí)別等各種圖像處理任務(wù)的后續(xù)工作量;(2)減少了信息的傳輸。因此,研究多聚焦圖像融合技術(shù)具有很大的現(xiàn)實(shí)意義。(a)CT圖像(b)MRI圖像圖1-3CT圖像和MRI圖像(a)左聚焦(b)右聚焦(c)融合圖像圖1-4多聚焦源圖像融合
【參考文獻(xiàn)】:
期刊論文
[1]快速離散Curvelet變換域的圖像融合[J]. 楊勇,童松,黃淑英. 中國(guó)圖象圖形學(xué)報(bào). 2015(02)
[2]基于視覺特性的多聚焦圖像融合[J]. 李樹濤,王耀南,張昌凡. 電子學(xué)報(bào). 2001(12)
本文編號(hào):3007401
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3007401.html
最近更新
教材專著