基于多特征融合與深度先驗(yàn)信息的圖像顯著性檢測(cè)算法研究
發(fā)布時(shí)間:2021-07-09 00:54
圖像顯著性檢測(cè)是圖像處理中最重要的技術(shù)之一,廣泛應(yīng)用于圖像壓縮、圖像分割等任務(wù)中。自底向上的檢測(cè)算法在某些復(fù)雜圖像上難以獲得接近人眼注意范圍的顯著區(qū)域,自頂向下的檢測(cè)算法可利用的真實(shí)先驗(yàn)信息較少,因此本文提出了一種基于多特征融合與深度先驗(yàn)信息的圖像顯著性檢測(cè)算法,具體工作如下:(1)提出一種基于FLIC融合顏色與紋理特征的圖像顯著性檢測(cè)算法,分別在顏色通道和紋理通道中獲得基于FLIC的顏色特征顯著圖和紋理特征顯著圖,再進(jìn)行線性融合獲得最終顯著圖。在四個(gè)公開(kāi)數(shù)據(jù)集上與7種自底向上的顯著性檢測(cè)算法比較,繪制了PR-Curve、MAE以及F?三個(gè)指標(biāo)圖,實(shí)驗(yàn)結(jié)果表明,基于多特征融合的檢測(cè)算法性能較好,但在某些具體場(chǎng)景下仍有提升空間。(2)為了提升多特征融合顯著性檢測(cè)算法的性能,提出一種基于深度先驗(yàn)信息輔助的圖像顯著性提升模型,更加充分地利用圖像信息。該模型采用修改的VGG16提取圖像像素點(diǎn)與圖像區(qū)域的特征向量,在特征空間內(nèi)訓(xùn)練一個(gè)最鄰近分類器判斷像素點(diǎn)與圖像區(qū)域之間的歸屬關(guān)系。原始圖像和真值作為輸入進(jìn)行訓(xùn)練,通過(guò)網(wǎng)絡(luò)學(xué)習(xí)到圖像真值區(qū)域特征和像素特征之間的聯(lián)系。把原始圖像...
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖像及其顯著區(qū)域示例
傳播算法仍然是很多神經(jīng)網(wǎng)絡(luò)任務(wù)的基礎(chǔ)算法。1986 年之后,神經(jīng)網(wǎng)絡(luò)在各領(lǐng)域的應(yīng)用就蓬勃發(fā)展起來(lái)了,特別是近幾年,呈現(xiàn)一種爆發(fā)趨勢(shì)。圖2.2 受限玻爾茲曼機(jī)結(jié)構(gòu)示意圖2.1.2 神經(jīng)網(wǎng)絡(luò)的特性現(xiàn)有的各種神經(jīng)網(wǎng)絡(luò)模型都是對(duì)高等生物神經(jīng)系統(tǒng)的簡(jiǎn)化抽象與模擬,可以看作由許多并行互聯(lián)的簡(jiǎn)單神經(jīng)元構(gòu)成。在神經(jīng)元上進(jìn)行信息處理,神經(jīng)元之間進(jìn)行信息存儲(chǔ),一個(gè)包含多個(gè)神經(jīng)元的多層神經(jīng)網(wǎng)絡(luò)模型描述了一個(gè)神經(jīng)網(wǎng)絡(luò)如何將輸入轉(zhuǎn)化為輸出的過(guò)程,這一過(guò)程可以通過(guò)數(shù)學(xué)公式模擬出來(lái)。神經(jīng)元主要包含以下三個(gè)基本要素:(1)連接權(quán)值:連接權(quán)值指的是神經(jīng)網(wǎng)絡(luò)中相互連接的兩個(gè)神經(jīng)元之間的連接關(guān)系,該值可正可負(fù)。在實(shí)際訓(xùn)練中,在每一次反向傳播前后連接權(quán)值可能是不一樣的。(2)加法器:神經(jīng)元的輸入變量(可能不唯一)與神經(jīng)元的連接權(quán)值對(duì)應(yīng)相乘之后和偏置一起通過(guò)加法器求和,實(shí)際上就是對(duì)輸入信號(hào)進(jìn)行線性加權(quán)組合
圖2.8 UCF 總體框架該方法的第二個(gè)亮點(diǎn)是推導(dǎo)出了一種新的上采樣方法來(lái)減少生成顯著圖中的虛影。首先限制卷積核的大小,確保卷積核的大小k 是卷積步幅s 的整倍數(shù),如式(2-35)所示;其次將上采樣與卷積分開(kāi)執(zhí)行,即先通過(guò)插值調(diào)整特征圖的大小,然后再執(zhí)行卷積操作,雖然這種做法可能破壞網(wǎng)絡(luò)學(xué)習(xí)到的特征,但是通過(guò)堆疊多個(gè)這種特征圖能夠構(gòu)造出虛影較少的輸出圖像。k s N(2-35)2.2.4 仿真分析前三小節(jié)總共研究了 HC、RC、SF、MR、MDF、UCF 共 6 個(gè)顯著性檢測(cè)算法,本文在閱讀提出上述幾種方法論文的基礎(chǔ)上,對(duì)他們的工作進(jìn)行了復(fù)現(xiàn),示例如圖 2.9所示,發(fā)現(xiàn)這 5 種算法(其中 HC 和 RC 算一種)是分別用到了圖像直方圖、圖像超像素分割、高斯濾波、圖論、神經(jīng)網(wǎng)絡(luò)等經(jīng)典的圖像處理方法,其中圖像的超像素作為一種圖像預(yù)處理辦法,除了 HC 外其他幾個(gè)方法都用到了。由此可見(jiàn),超像素分割
本文編號(hào):3272677
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖像及其顯著區(qū)域示例
傳播算法仍然是很多神經(jīng)網(wǎng)絡(luò)任務(wù)的基礎(chǔ)算法。1986 年之后,神經(jīng)網(wǎng)絡(luò)在各領(lǐng)域的應(yīng)用就蓬勃發(fā)展起來(lái)了,特別是近幾年,呈現(xiàn)一種爆發(fā)趨勢(shì)。圖2.2 受限玻爾茲曼機(jī)結(jié)構(gòu)示意圖2.1.2 神經(jīng)網(wǎng)絡(luò)的特性現(xiàn)有的各種神經(jīng)網(wǎng)絡(luò)模型都是對(duì)高等生物神經(jīng)系統(tǒng)的簡(jiǎn)化抽象與模擬,可以看作由許多并行互聯(lián)的簡(jiǎn)單神經(jīng)元構(gòu)成。在神經(jīng)元上進(jìn)行信息處理,神經(jīng)元之間進(jìn)行信息存儲(chǔ),一個(gè)包含多個(gè)神經(jīng)元的多層神經(jīng)網(wǎng)絡(luò)模型描述了一個(gè)神經(jīng)網(wǎng)絡(luò)如何將輸入轉(zhuǎn)化為輸出的過(guò)程,這一過(guò)程可以通過(guò)數(shù)學(xué)公式模擬出來(lái)。神經(jīng)元主要包含以下三個(gè)基本要素:(1)連接權(quán)值:連接權(quán)值指的是神經(jīng)網(wǎng)絡(luò)中相互連接的兩個(gè)神經(jīng)元之間的連接關(guān)系,該值可正可負(fù)。在實(shí)際訓(xùn)練中,在每一次反向傳播前后連接權(quán)值可能是不一樣的。(2)加法器:神經(jīng)元的輸入變量(可能不唯一)與神經(jīng)元的連接權(quán)值對(duì)應(yīng)相乘之后和偏置一起通過(guò)加法器求和,實(shí)際上就是對(duì)輸入信號(hào)進(jìn)行線性加權(quán)組合
圖2.8 UCF 總體框架該方法的第二個(gè)亮點(diǎn)是推導(dǎo)出了一種新的上采樣方法來(lái)減少生成顯著圖中的虛影。首先限制卷積核的大小,確保卷積核的大小k 是卷積步幅s 的整倍數(shù),如式(2-35)所示;其次將上采樣與卷積分開(kāi)執(zhí)行,即先通過(guò)插值調(diào)整特征圖的大小,然后再執(zhí)行卷積操作,雖然這種做法可能破壞網(wǎng)絡(luò)學(xué)習(xí)到的特征,但是通過(guò)堆疊多個(gè)這種特征圖能夠構(gòu)造出虛影較少的輸出圖像。k s N(2-35)2.2.4 仿真分析前三小節(jié)總共研究了 HC、RC、SF、MR、MDF、UCF 共 6 個(gè)顯著性檢測(cè)算法,本文在閱讀提出上述幾種方法論文的基礎(chǔ)上,對(duì)他們的工作進(jìn)行了復(fù)現(xiàn),示例如圖 2.9所示,發(fā)現(xiàn)這 5 種算法(其中 HC 和 RC 算一種)是分別用到了圖像直方圖、圖像超像素分割、高斯濾波、圖論、神經(jīng)網(wǎng)絡(luò)等經(jīng)典的圖像處理方法,其中圖像的超像素作為一種圖像預(yù)處理辦法,除了 HC 外其他幾個(gè)方法都用到了。由此可見(jiàn),超像素分割
本文編號(hào):3272677
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3272677.html
最近更新
教材專著