融合全局與局部信息的顯著性目標檢測
發(fā)布時間:2021-08-24 03:01
視覺顯著性目標檢測是利用計算機技術模仿人類的視覺注意力機制,提取復雜圖像中感興趣的信息并優(yōu)先處理,從而有助于提高圖像處理的效率,目前已經(jīng)被廣泛應用到視頻壓縮、圖像識別和檢索等各個領域。顯著性目標檢測算法包括傳統(tǒng)的檢測算法與基于深度學習的檢測算法,傳統(tǒng)的檢測算法僅僅依賴底層特征從而導致顯著圖自信度不高,基于深度學習的檢測算法提高了顯著目標的自信度,但大量池化操作會導致顯著對象輪廓模糊。本文研究了一種融合全局與局部信息的顯著性檢測模型,能夠有效獲取復雜場景中的顯著目標,提高顯著性檢測模型的魯棒性。本文的主要工作包括:(1)針對全卷積網(wǎng)絡中大量池化操作導致低層信息被忽略,引起顯著目標邊緣模糊的問題,研究了一種融合多尺度特征圖細化顯著對象邊緣的檢測模型,通過提取低層卷積組下不同尺度的特征圖,并基于低層特征信息與高層抽象語義特征的互補關系,將不同尺度的特征圖與全卷積網(wǎng)絡檢測的顯著圖進行加權融合獲得全局性顯著圖,從而優(yōu)化顯著目標邊界。在標準數(shù)據(jù)集上與其他檢測算法對比實驗,結果驗證了該模型能夠有效克服全卷積網(wǎng)絡模型檢測邊緣模糊的問題。(1)為了進一步優(yōu)化全局性顯著圖的邊界,研究了一種融合全局與局部信...
【文章來源】:西安理工大學陜西省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
注意焦點示例圖
?泳踝樵?014年提出,與其他卷積網(wǎng)絡模型最明顯的不同之處在于卷積層采用了3*3的小卷積核,從而增加了網(wǎng)絡的層次影響網(wǎng)絡的性能,同時導致參數(shù)量減少,能夠提取一些更加高級抽象的語義特征,有利于提高對顯著對象的分析理解,對于更復雜的模式能夠更好的進行訓練;池化層采用2*2大小的池化核。整個網(wǎng)絡隨著網(wǎng)絡層數(shù)的增加,網(wǎng)絡通道由原始圖像的3通道逐漸變?yōu)?4通道、128通道、256通道、512通道。經(jīng)典VGG網(wǎng)絡模型主要包括VGG16和VGG19兩種模型,其中VGG16網(wǎng)絡模型主要包括了5組卷積組和3層全連接層。網(wǎng)絡結構如圖2-2所示。圖2-2VGG16網(wǎng)絡模型結構圖Fig.2-2ThearchitectureofVGG16networkmodel
理論基礎11與VGG16網(wǎng)絡模型相比較,VGG19網(wǎng)絡在后三組卷積組增加了3層卷積層,提高了網(wǎng)絡的深度,如圖2-3所示。圖2-3VGG19網(wǎng)絡模型結構圖Fig.2-3ThearchitectureofVGG19networkmodel在網(wǎng)絡模型中卷積層[31]是最主要的部分,通過圖像局部相似的特點進行特征的自主學習,模擬人類視覺系統(tǒng)的局部感受野,卷積層中每層的神經(jīng)元節(jié)點與上一層神經(jīng)元節(jié)點部分連接,利用局部連接的方式很好地減少網(wǎng)絡模型訓練過程中的參數(shù)計算復雜度。每層卷積層的參數(shù)由一系列的濾波器組成,通過對輸入圖像進行卷積學習從而提取到顯著對象的特征,獲取每層卷積層的特征映射圖,同時隨著深度增加,能夠提取圖像高層次的語義特征,每層的節(jié)點輸出定義如下:inniinininbkxfx,1(2-1)其中,n代表第n卷積核;i代表第i層卷積層;inx為目前的特征映射圖;i1-nx為上一層的特征映射圖;iink,為當前層的第n個卷積核;f為激活函數(shù);inb為偏置。池化層也叫下采樣層,主要用來刪除冗余信息減小參數(shù)數(shù)據(jù)量,選出最具有代表性的特征的像素,防止訓練過程中的過擬合問題。每層節(jié)點輸出定義如下:inssinininbxsskfx11(2-2)其中,n代表第n池化核;i代表第i層池化層;S為下采樣模板的長度;ink為模板的權值;i1-nx為上一層的特征映射圖;inb為偏置。通常多采用最大池化層(MaxPooling)和均值池化層(AveragePooling),在區(qū)域內獲取特征值的最大值或者平均值提取特征,從而過濾冗余信息,實現(xiàn)降維。全連接層是將經(jīng)過一系列卷積層與池化層的特征映射進行連接作為最后的輸出,將連
本文編號:3359145
【文章來源】:西安理工大學陜西省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
注意焦點示例圖
?泳踝樵?014年提出,與其他卷積網(wǎng)絡模型最明顯的不同之處在于卷積層采用了3*3的小卷積核,從而增加了網(wǎng)絡的層次影響網(wǎng)絡的性能,同時導致參數(shù)量減少,能夠提取一些更加高級抽象的語義特征,有利于提高對顯著對象的分析理解,對于更復雜的模式能夠更好的進行訓練;池化層采用2*2大小的池化核。整個網(wǎng)絡隨著網(wǎng)絡層數(shù)的增加,網(wǎng)絡通道由原始圖像的3通道逐漸變?yōu)?4通道、128通道、256通道、512通道。經(jīng)典VGG網(wǎng)絡模型主要包括VGG16和VGG19兩種模型,其中VGG16網(wǎng)絡模型主要包括了5組卷積組和3層全連接層。網(wǎng)絡結構如圖2-2所示。圖2-2VGG16網(wǎng)絡模型結構圖Fig.2-2ThearchitectureofVGG16networkmodel
理論基礎11與VGG16網(wǎng)絡模型相比較,VGG19網(wǎng)絡在后三組卷積組增加了3層卷積層,提高了網(wǎng)絡的深度,如圖2-3所示。圖2-3VGG19網(wǎng)絡模型結構圖Fig.2-3ThearchitectureofVGG19networkmodel在網(wǎng)絡模型中卷積層[31]是最主要的部分,通過圖像局部相似的特點進行特征的自主學習,模擬人類視覺系統(tǒng)的局部感受野,卷積層中每層的神經(jīng)元節(jié)點與上一層神經(jīng)元節(jié)點部分連接,利用局部連接的方式很好地減少網(wǎng)絡模型訓練過程中的參數(shù)計算復雜度。每層卷積層的參數(shù)由一系列的濾波器組成,通過對輸入圖像進行卷積學習從而提取到顯著對象的特征,獲取每層卷積層的特征映射圖,同時隨著深度增加,能夠提取圖像高層次的語義特征,每層的節(jié)點輸出定義如下:inniinininbkxfx,1(2-1)其中,n代表第n卷積核;i代表第i層卷積層;inx為目前的特征映射圖;i1-nx為上一層的特征映射圖;iink,為當前層的第n個卷積核;f為激活函數(shù);inb為偏置。池化層也叫下采樣層,主要用來刪除冗余信息減小參數(shù)數(shù)據(jù)量,選出最具有代表性的特征的像素,防止訓練過程中的過擬合問題。每層節(jié)點輸出定義如下:inssinininbxsskfx11(2-2)其中,n代表第n池化核;i代表第i層池化層;S為下采樣模板的長度;ink為模板的權值;i1-nx為上一層的特征映射圖;inb為偏置。通常多采用最大池化層(MaxPooling)和均值池化層(AveragePooling),在區(qū)域內獲取特征值的最大值或者平均值提取特征,從而過濾冗余信息,實現(xiàn)降維。全連接層是將經(jīng)過一系列卷積層與池化層的特征映射進行連接作為最后的輸出,將連
本文編號:3359145
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3359145.html
最近更新
教材專著