基于特征性能增強(qiáng)和目標(biāo)定位的圖像檢索研究
發(fā)布時(shí)間:2021-04-03 01:12
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展以及手機(jī)、相機(jī)等數(shù)碼產(chǎn)品的普及,互聯(lián)網(wǎng)上流傳的圖像數(shù)量越來(lái)越龐大,且圖像中的內(nèi)容也越來(lái)越復(fù)雜多樣。在海量圖像中快速準(zhǔn)確的檢索出需要的圖像已成為熱門的研究課題。如何提取具有強(qiáng)表征性能的圖像特征以及如何精確定位出圖像中的感興趣區(qū)域是近年來(lái)圖像檢索領(lǐng)域的重點(diǎn)研究方向;诖吮尘,本文運(yùn)用深度卷積神經(jīng)網(wǎng)絡(luò),提出了基于特征性能增強(qiáng)和目標(biāo)定位的圖像檢索方法。本文主要有兩個(gè)創(chuàng)新點(diǎn):一是改進(jìn)CroW特征加權(quán)方法,提出新的卷積特征性能增強(qiáng)方法。在通道加權(quán)和平面加權(quán)后,使用多尺度的池化窗口在圖像卷積特征上滑動(dòng)得到多個(gè)局部特征向量,然后整合成全局特征向量,實(shí)驗(yàn)表明該特征向量具有很強(qiáng)的圖像表征性。二是本文將基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法與圖像檢索方法相結(jié)合,提出了基于目標(biāo)定位的圖像檢索方法。使用重新訓(xùn)練的SSD目標(biāo)檢測(cè)模型定位出圖像中需要的目標(biāo)區(qū)域,根據(jù)目標(biāo)區(qū)域提取區(qū)域特征進(jìn)行圖像檢索。該方法對(duì)圖像的特定區(qū)域進(jìn)行針對(duì)性的特征提取,可以最大限度的過(guò)濾掉圖像干擾因素,極大提高檢索精度。本文的主要貢獻(xiàn)有三個(gè):一是使用手工標(biāo)注的建筑物數(shù)據(jù)集訓(xùn)練SSD模型,得到能準(zhǔn)確檢測(cè)出圖像建筑物區(qū)域的目標(biāo)檢測(cè)器...
【文章來(lái)源】:西安理工大學(xué)陜西省
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
卷積特征加權(quán)示意圖
計(jì)算通道權(quán)重:對(duì)特征上每個(gè)通道k都分配一個(gè)權(quán)值 。特征整合:每個(gè)特征圖進(jìn)行和池化處理,將三維特征整合成單維全局特征向量向量歸一化:將得到的向量歸一化和再轉(zhuǎn)換,這里可以使用各種方法。降維:降低了歸一化向量的維數(shù)?梢赃x擇典型的 PCA 降維,也可以選擇白化度縮放方法。用 CroW 方法得到的特征向量有兩個(gè)特點(diǎn):一是緊湊的表達(dá),整個(gè)特征向量從最三維卷積特征壓縮成單維的向量,從數(shù)據(jù)量來(lái)說(shuō)縮小了幾十倍;二是放大原卷積區(qū)域的影響力,即,特征圖上更可能存在物體的區(qū)域加大了權(quán)重,梯度差異大的了權(quán)重。-MAC 區(qū)域整合方法-MAC 特征處理方法的方法和 MOP[37]方法類似,都采用一種變窗口的方式在平處理。差別是 MOP 設(shè)計(jì)的窗口是在圖像上滑動(dòng),而 R-MAC 的窗口在特征圖上者大大加快了特征處理的速度。另外,MOP 采用的是 VLAD 的方式進(jìn)行合并法則是直接將局部特征向量相加得到最終的全局特征向量,更簡(jiǎn)單快捷。
西安理工大學(xué)工程碩士專業(yè)學(xué)位論文難度。該方法將目標(biāo)檢測(cè)框架看作回歸問(wèn)題,在單個(gè)神經(jīng)網(wǎng)絡(luò)中直接輸出預(yù)測(cè)邊界框和類別概率。其檢測(cè)精度上提升到了 63.4%,在檢測(cè)速度上也遠(yuǎn)遠(yuǎn)快于 R-CNN。隨著研究的深入,后來(lái)又提出了 SSD 方法,該方法在 VOC2007 上的檢測(cè)精度一直處于領(lǐng)先地位,達(dá)到了 72.1%。
本文編號(hào):3116318
【文章來(lái)源】:西安理工大學(xué)陜西省
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
卷積特征加權(quán)示意圖
計(jì)算通道權(quán)重:對(duì)特征上每個(gè)通道k都分配一個(gè)權(quán)值 。特征整合:每個(gè)特征圖進(jìn)行和池化處理,將三維特征整合成單維全局特征向量向量歸一化:將得到的向量歸一化和再轉(zhuǎn)換,這里可以使用各種方法。降維:降低了歸一化向量的維數(shù)?梢赃x擇典型的 PCA 降維,也可以選擇白化度縮放方法。用 CroW 方法得到的特征向量有兩個(gè)特點(diǎn):一是緊湊的表達(dá),整個(gè)特征向量從最三維卷積特征壓縮成單維的向量,從數(shù)據(jù)量來(lái)說(shuō)縮小了幾十倍;二是放大原卷積區(qū)域的影響力,即,特征圖上更可能存在物體的區(qū)域加大了權(quán)重,梯度差異大的了權(quán)重。-MAC 區(qū)域整合方法-MAC 特征處理方法的方法和 MOP[37]方法類似,都采用一種變窗口的方式在平處理。差別是 MOP 設(shè)計(jì)的窗口是在圖像上滑動(dòng),而 R-MAC 的窗口在特征圖上者大大加快了特征處理的速度。另外,MOP 采用的是 VLAD 的方式進(jìn)行合并法則是直接將局部特征向量相加得到最終的全局特征向量,更簡(jiǎn)單快捷。
西安理工大學(xué)工程碩士專業(yè)學(xué)位論文難度。該方法將目標(biāo)檢測(cè)框架看作回歸問(wèn)題,在單個(gè)神經(jīng)網(wǎng)絡(luò)中直接輸出預(yù)測(cè)邊界框和類別概率。其檢測(cè)精度上提升到了 63.4%,在檢測(cè)速度上也遠(yuǎn)遠(yuǎn)快于 R-CNN。隨著研究的深入,后來(lái)又提出了 SSD 方法,該方法在 VOC2007 上的檢測(cè)精度一直處于領(lǐng)先地位,達(dá)到了 72.1%。
本文編號(hào):3116318
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3116318.html
最近更新
教材專著