基于感知哈希和自適應(yīng)搜索的通用對(duì)象檢測(cè)
發(fā)布時(shí)間:2019-10-01 23:23
【摘要】:針對(duì)數(shù)字圖像中對(duì)象檢測(cè)問(wèn)題,提出一種基于感知哈希和搜索策略的通用對(duì)象檢測(cè)算法,提取圖像中有可能包含對(duì)象的子區(qū)域并以矩形的形式輸出。算法首先對(duì)輸入圖像進(jìn)行分割,并計(jì)算該圖像的顯著度信息;其次根據(jù)圖像每個(gè)子區(qū)域顯著度信息,自適應(yīng)地確定搜索策略的起始子區(qū)域;最終利用選擇性搜索策略,實(shí)現(xiàn)圖像中通用對(duì)象檢測(cè)。利用選擇性搜索策略檢測(cè)通用對(duì)象時(shí),引入感知哈希算法實(shí)現(xiàn)相鄰子區(qū)域的相似度計(jì)算,在保證準(zhǔn)確度的基礎(chǔ)上簡(jiǎn)化算法復(fù)雜度。實(shí)驗(yàn)結(jié)果顯示,本文算法具有良好的圖像對(duì)象檢測(cè)準(zhǔn)確度。
【圖文】:
計(jì)算非常簡(jiǎn)單快速,同時(shí)又保持一定的準(zhǔn)確率。因此,引入感知哈希計(jì)算圖像不同子區(qū)域間的相似度。一般來(lái)說(shuō),感知哈希算法包含平均哈希和基于離散余弦變換(DCT)的哈希兩種方法。所謂平均哈希指的是一個(gè)區(qū)域內(nèi)的所有像素值與像素均值相比較的結(jié)果確定像素的哈希值:當(dāng)像素值大于均值時(shí),像素的哈希值設(shè)置為1,否則設(shè)置為0。該算法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,缺點(diǎn)是易受噪聲等因素影響。相比于平均哈希算法,基于DCT的哈希算法利用DCT代替像素均值,這使得算法更具魯棒性。該算法的基本流程如圖3所示。圖像子區(qū)域經(jīng)過(guò)DCT處理后會(huì)得到一個(gè)二維系數(shù)矩陣圖如圖4所示,系數(shù)矩陣從左上角到右下角頻率由低到高。由圖可以發(fā)現(xiàn),經(jīng)過(guò)DCT處理后的系數(shù)矩陣絕大多數(shù)數(shù)據(jù)都集中在左上角。換句話說(shuō),圖像中絕大部分能量都集中于左上角低頻區(qū)域。因此,只需利用該系數(shù)矩陣左上角的局部信息來(lái)進(jìn)行二值化處理;冢模茫缘墓K惴ň唧w如下:1)輸入圖像子區(qū)域,并轉(zhuǎn)換為灰度信息;2)調(diào)用DCT對(duì)圖像子區(qū)域進(jìn)行處理,計(jì)算得到系數(shù)矩陣;3)選取系數(shù)矩陣左上角子區(qū)域(左上角8×8的子矩陣),并計(jì)算該矩陣的均值;4)比較DCT系數(shù)矩陣8×8子矩陣與其均值,大于等于均值的被賦值為1,否則為0;5)輸出64維的哈希值。一旦計(jì)算得到了不同圖像子區(qū)域的64維哈希值,下一步就是如何根據(jù)哈希值確定它們之間的相似度。采用漢明距離(Hammingdistance)計(jì)算不同圖像子區(qū)域間哈希值的相似度為d(H1,H2)=∑ni=1(h1鄽h2)(1)其中:H1和H2分別
圖4基于DCT的感知哈希計(jì)算示意圖:(a)原始圖像;(b)待計(jì)算的子區(qū)域;(c)子區(qū)域的DCT矩陣;(d)DCT矩陣左上角8×8子集Fig.4SchematicdiagramsofDCTbasedperceptualhashingalgorithm:(a)Inputimage;(b)Asub-regionwithintheinputimage;(c)DCTmatrixofthesub-region;(d)Upper-left8×8subsetoftheDCTmatrix4性能測(cè)試4.1室驗(yàn)設(shè)計(jì)采用VOC2007圖像數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含20個(gè)類別共4952幅不同背景下獲取的圖像,如圖5所示。較常見(jiàn)的衡量通用對(duì)象檢測(cè)的性能指標(biāo)是召回率(recall)。然而,如圖6所示,檢測(cè)的輸出結(jié)果盡管覆蓋了幾乎全部的人工標(biāo)注區(qū)域,召回率高達(dá)96.6%,但包含了過(guò)多的非標(biāo)注區(qū)域,很明顯召回率無(wú)法準(zhǔn)確說(shuō)明通用對(duì)象檢測(cè)結(jié)果。因此,,采用(M-ABO,meanaveragebestoverlap)[2]測(cè)試通用對(duì)象檢測(cè)的性能。M-ABO中,ABO為ABO=1|Gc|∑gc
本文編號(hào):2544625
【圖文】:
計(jì)算非常簡(jiǎn)單快速,同時(shí)又保持一定的準(zhǔn)確率。因此,引入感知哈希計(jì)算圖像不同子區(qū)域間的相似度。一般來(lái)說(shuō),感知哈希算法包含平均哈希和基于離散余弦變換(DCT)的哈希兩種方法。所謂平均哈希指的是一個(gè)區(qū)域內(nèi)的所有像素值與像素均值相比較的結(jié)果確定像素的哈希值:當(dāng)像素值大于均值時(shí),像素的哈希值設(shè)置為1,否則設(shè)置為0。該算法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,缺點(diǎn)是易受噪聲等因素影響。相比于平均哈希算法,基于DCT的哈希算法利用DCT代替像素均值,這使得算法更具魯棒性。該算法的基本流程如圖3所示。圖像子區(qū)域經(jīng)過(guò)DCT處理后會(huì)得到一個(gè)二維系數(shù)矩陣圖如圖4所示,系數(shù)矩陣從左上角到右下角頻率由低到高。由圖可以發(fā)現(xiàn),經(jīng)過(guò)DCT處理后的系數(shù)矩陣絕大多數(shù)數(shù)據(jù)都集中在左上角。換句話說(shuō),圖像中絕大部分能量都集中于左上角低頻區(qū)域。因此,只需利用該系數(shù)矩陣左上角的局部信息來(lái)進(jìn)行二值化處理;冢模茫缘墓K惴ň唧w如下:1)輸入圖像子區(qū)域,并轉(zhuǎn)換為灰度信息;2)調(diào)用DCT對(duì)圖像子區(qū)域進(jìn)行處理,計(jì)算得到系數(shù)矩陣;3)選取系數(shù)矩陣左上角子區(qū)域(左上角8×8的子矩陣),并計(jì)算該矩陣的均值;4)比較DCT系數(shù)矩陣8×8子矩陣與其均值,大于等于均值的被賦值為1,否則為0;5)輸出64維的哈希值。一旦計(jì)算得到了不同圖像子區(qū)域的64維哈希值,下一步就是如何根據(jù)哈希值確定它們之間的相似度。采用漢明距離(Hammingdistance)計(jì)算不同圖像子區(qū)域間哈希值的相似度為d(H1,H2)=∑ni=1(h1鄽h2)(1)其中:H1和H2分別
圖4基于DCT的感知哈希計(jì)算示意圖:(a)原始圖像;(b)待計(jì)算的子區(qū)域;(c)子區(qū)域的DCT矩陣;(d)DCT矩陣左上角8×8子集Fig.4SchematicdiagramsofDCTbasedperceptualhashingalgorithm:(a)Inputimage;(b)Asub-regionwithintheinputimage;(c)DCTmatrixofthesub-region;(d)Upper-left8×8subsetoftheDCTmatrix4性能測(cè)試4.1室驗(yàn)設(shè)計(jì)采用VOC2007圖像數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)包含20個(gè)類別共4952幅不同背景下獲取的圖像,如圖5所示。較常見(jiàn)的衡量通用對(duì)象檢測(cè)的性能指標(biāo)是召回率(recall)。然而,如圖6所示,檢測(cè)的輸出結(jié)果盡管覆蓋了幾乎全部的人工標(biāo)注區(qū)域,召回率高達(dá)96.6%,但包含了過(guò)多的非標(biāo)注區(qū)域,很明顯召回率無(wú)法準(zhǔn)確說(shuō)明通用對(duì)象檢測(cè)結(jié)果。因此,,采用(M-ABO,meanaveragebestoverlap)[2]測(cè)試通用對(duì)象檢測(cè)的性能。M-ABO中,ABO為ABO=1|Gc|∑gc
本文編號(hào):2544625
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2544625.html
最近更新
教材專著