天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向圖像的有效目標(biāo)區(qū)域提取方法

發(fā)布時間:2021-06-07 04:40
  針對圖像標(biāo)注、目標(biāo)識別等實(shí)際應(yīng)用中圖像的前景目標(biāo)定位不夠準(zhǔn)確的問題,提出了一種圖像中的有效目標(biāo)區(qū)域提取方法。該方法以提取圖像的前景目標(biāo)為目的,將目標(biāo)區(qū)域提取問題轉(zhuǎn)化為二分類問題,實(shí)現(xiàn)了對圖像中有效目標(biāo)區(qū)域的提取,主要包括4個步驟:利用選擇性搜索算法生成圖像中的候選目標(biāo)區(qū)域;通過對像素值的差值化處理來進(jìn)行圖像區(qū)域的特征增強(qiáng);基于深度學(xué)習(xí)實(shí)現(xiàn)對候選目標(biāo)區(qū)域進(jìn)行分類;區(qū)域選擇與融合。在MSCOCO數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明,該方法在保證較高召回率的基礎(chǔ)上,達(dá)到了比現(xiàn)有多種算法更加準(zhǔn)確的目標(biāo)區(qū)域定位結(jié)果。 

【文章來源】:西安交通大學(xué)學(xué)報. 2019,53(05)北大核心EICSCD

【文章頁數(shù)】:6 頁

【部分圖文】:

面向圖像的有效目標(biāo)區(qū)域提取方法


有效目標(biāo)區(qū)域提取框架

目標(biāo)區(qū)域,全連接,像素點(diǎn)


增強(qiáng)過程可以看作將目標(biāo)區(qū)域差值化,即p′ij=pij-1K∑Kk=1^pk(1)式中:pij為區(qū)域中任一像素點(diǎn)的值;p′ij為特征增強(qiáng)后的像素值;^pk為目標(biāo)區(qū)域中的代表性像素點(diǎn)。本文選擇矩形目標(biāo)區(qū)域的水平和豎直兩條中線上的1/4、1/2和3/4位置上共5個像素點(diǎn)作為代表性像素點(diǎn),即K=5,并對于R、G、B這3個通道分別進(jìn)行計(jì)算。在實(shí)際的圖像中,目標(biāo)區(qū)域特征增強(qiáng)前后的對比結(jié)果如圖2所示。由圖2可知,對目標(biāo)區(qū)域進(jìn)行特征增強(qiáng)之后,使得目標(biāo)之間的差異程度更小,同時該操作依舊保留了目標(biāo)的形狀信息,有利于區(qū)分生成的有效目標(biāo)區(qū)域和其他區(qū)域。(a)特征增強(qiáng)前(b)特征增強(qiáng)后圖2目標(biāo)區(qū)域特征增強(qiáng)前后比較2.3基于深度網(wǎng)絡(luò)的目標(biāo)區(qū)域檢測本文采用的網(wǎng)絡(luò)結(jié)構(gòu)基于VGG-16深度網(wǎng)絡(luò)[7],保留了該網(wǎng)絡(luò)的前13層結(jié)構(gòu)作為提取圖片特征的部分,在此基礎(chǔ)上添加了3個全連接層作為分類網(wǎng)絡(luò),最終輸出一個2維向量,以此判斷輸入圖像區(qū)域是有效目標(biāo)區(qū)域還是背景區(qū)域(非有效目標(biāo))。其中對輸入到網(wǎng)絡(luò)中的圖像區(qū)域(imagepatch)要首先進(jìn)行縮放處理,調(diào)整至224×224大小,其目的是對于不同輸入都可以保證在進(jìn)入到全連接層之前,網(wǎng)絡(luò)所產(chǎn)生的向量長度是一致的。另外,在具體的網(wǎng)絡(luò)結(jié)構(gòu)中,卷積層所使用的激活函數(shù)是ReLU函數(shù);池化層所采用的池化方式為最大池化;3個全連接層的神經(jīng)元個數(shù)則分別設(shè)置為1024、256和

分布目標(biāo),像素,目標(biāo)區(qū)域,區(qū)域


訓(xùn)練網(wǎng)絡(luò),其中涵蓋了所有的80類目標(biāo)概念,為了保證訓(xùn)練樣本平衡性與學(xué)習(xí)性能,本文基于這些圖像共生成10萬個正樣本和10萬個負(fù)樣本用于訓(xùn)練深度網(wǎng)絡(luò)。由于本工作不涉及不同目標(biāo)類別的判別,因此在使用標(biāo)注結(jié)果時,利用了圖像中目標(biāo)的位置信息而忽略了其類別信息。在測試過程中,為了評估本文方法,采用了具有標(biāo)注結(jié)果的驗(yàn)證集。從驗(yàn)證集中選取涵蓋所有的80類目標(biāo)概念的1000張圖像來評估最終的實(shí)驗(yàn)結(jié)果。3.2目標(biāo)區(qū)域特征增強(qiáng)的結(jié)果圖3展示了進(jìn)行特征增強(qiáng)前后,目標(biāo)區(qū)域中所有像素值在特征空間中的分布變化,本文隨機(jī)選取了20個目標(biāo)區(qū)域并對其增強(qiáng)前后像素值的分布在RGB空間進(jìn)行了展示,圖3中x、y、z分別表示R、G、B空間。由圖3可知:在特征增強(qiáng)前,目標(biāo)區(qū)域的多樣性導(dǎo)致了像素值分布非常分散;對目標(biāo)區(qū)域進(jìn)行特征增強(qiáng)之后,目標(biāo)區(qū)域在特征空間中的分布更加集中,且分布在原點(diǎn)附近的較小范圍內(nèi),這對于提高目標(biāo)區(qū)域分類的性能有很大幫助。(a)特征增強(qiáng)前(b)特征增強(qiáng)后圖3特征增強(qiáng)前后區(qū)域像素值在空間中的分布3.3目標(biāo)區(qū)域的融合結(jié)果針對深度網(wǎng)絡(luò)輸出的候選目標(biāo)區(qū)域,基于目標(biāo)響應(yīng)方法,將提取結(jié)果進(jìn)行進(jìn)一步融合,得到最終的目標(biāo)區(qū)域,目標(biāo)區(qū)域的融合過程如圖4所示。由圖4可知,通過基于目標(biāo)響應(yīng)的區(qū)域融合過程,最終得到的目標(biāo)區(qū)域不僅保留了網(wǎng)絡(luò)輸出結(jié)果中置信度高的區(qū)域,保證了有效目標(biāo)可以達(dá)到較高的召回率,同時也過濾掉了大量對應(yīng)于同一目標(biāo)的重疊區(qū)域,在一定程度上提


本文編號:3215883

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3215883.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f6f9d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com