物體檢索與定位技術(shù)研究
發(fā)布時(shí)間:2019-10-08 08:34
【摘要】:物體檢索與定位,是指給定查詢目標(biāo)在某種模態(tài)下的信息,在大規(guī)模圖像視頻數(shù)據(jù)集中定位該目標(biāo)的技術(shù)。物體檢索與定位具有廣泛且重要的應(yīng)用價(jià)值,是計(jì)算機(jī)視覺技術(shù)最核心的課題之一。然而,由于光照、視角、遮擋等外部因素和物體本身的形變、類別多樣性等內(nèi)部因素的共同影響,圖像在不同層次上存在復(fù)雜的表象變化。除此之外,示例、圖像和標(biāo)簽之間的層次關(guān)聯(lián)繁雜多樣。這些都給物體檢索與定位帶來了很大的困難。本文從實(shí)際應(yīng)用的角度出發(fā),針對(duì)示例檢索、標(biāo)簽檢索和物體定位三個(gè)相關(guān)問題展開研究。以視覺詞袋模型和深度卷積網(wǎng)絡(luò)模型為基礎(chǔ),從模型表示、模型學(xué)習(xí)和關(guān)聯(lián)匹配幾個(gè)方面進(jìn)行擴(kuò)展和完善。具體的研究工作包括:1.針對(duì)基于視覺詞組的示例檢索模型進(jìn)行了研究。首先,優(yōu)化了視覺詞組的定義方式,提高了視覺詞組的區(qū)分性。其次,分析了一類容易被忽視的現(xiàn)象,即視覺詞組的突爆匹配。接著,基于概率模型,提出了一種新穎的貝葉斯池化模型用于消除突爆匹配,從而優(yōu)化了圖像之間的相似性度量,提高了示例檢索的準(zhǔn)確性。2.針對(duì)基于深度卷積網(wǎng)絡(luò)的示例檢索模型進(jìn)行了研究。針對(duì)示例檢索的查詢敏感的空間位置關(guān)聯(lián)性問題,提出了一種空間位置對(duì)齊的模型框架。更進(jìn)一步,提出了一種基于排序的深度卷積網(wǎng)絡(luò),用于建模物體的類內(nèi)和類間差異性。為了訓(xùn)練這個(gè)網(wǎng)絡(luò),設(shè)計(jì)了一種半監(jiān)督的訓(xùn)練樣本收集策略。該策略不需要任何對(duì)查詢物體的先驗(yàn)知識(shí),并且極大地減少了人工收集訓(xùn)練樣本所需的成本。實(shí)驗(yàn)結(jié)果表明這一方法顯著地提高了深度模型下示例檢索的準(zhǔn)確性。3.針對(duì)前背景的模糊性,從特征學(xué)習(xí)的角度,提出了一種多示例在線學(xué)習(xí)模型解決弱監(jiān)督條件下的圖像標(biāo)注和物體定位問題。首先,在現(xiàn)有的多示例學(xué)習(xí)模型的基礎(chǔ)上,改進(jìn)了訓(xùn)練樣本的選擇和更新策略。改進(jìn)后的策略能夠收集準(zhǔn)確多樣的正樣本以及有區(qū)分性的負(fù)樣本,從而提高前背景的區(qū)分性。其次,設(shè)計(jì)了一個(gè)端到端的模型同時(shí)進(jìn)行訓(xùn)練樣本的選擇和物體檢測(cè)器的訓(xùn)練。最后,通過對(duì)示例標(biāo)注和圖像標(biāo)注進(jìn)行關(guān)聯(lián),從而通過一個(gè)模型聯(lián)合學(xué)習(xí)圖像標(biāo)注和物體檢測(cè)算法。實(shí)驗(yàn)結(jié)果表明,這一模型有效地提高了圖像標(biāo)注和物體定位的性能。4.從特征表示的角度對(duì)標(biāo)簽檢索和物體定位問題進(jìn)行了研究。具體地,本文提出了一種基于顯著性的深度特征模型,改善基于矩形框的物體特征表示。顯著性模型使得矩形框內(nèi)背景區(qū)域的特征響應(yīng)被抑制,而前景中重要的視覺區(qū)域的特征激活得到增強(qiáng)。這樣的特征表示模型使得前景區(qū)域和背景區(qū)域的類內(nèi)差異變小,類間差異變大,從而減少了前背景的模糊性。這一顯著性特征模型可以與當(dāng)前最好的弱監(jiān)督物體檢測(cè)模型融合,從而進(jìn)行端到端的聯(lián)合訓(xùn)練。這一方法在多個(gè)數(shù)據(jù)集上驗(yàn)證了其可靠性。
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.41
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張學(xué)軍;郭建;;圖像紋理分析的方法與應(yīng)用[J];黑龍江科技信息;2009年16期
2 孟勇,洪丹輝,毛丹;測(cè)度熵在圖像紋理分析中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2000年08期
3 吳濤;秦昆;;圖像紋理特征數(shù)據(jù)挖掘的理論與方法探討[J];計(jì)算機(jī)時(shí)代;2006年08期
4 方玲玲;王相海;;圖像挖掘研究[J];計(jì)算機(jī)科學(xué);2009年08期
5 高振宇;楊曉梅;龔劍明;金海;;圖像復(fù)雜度描述方法研究[J];中國圖象圖形學(xué)報(bào);2010年01期
6 劉勇,施萬昌,徐玉蘭;圖像差異的分析與識(shí)別[J];復(fù)旦學(xué)報(bào)(自然科學(xué)版);2000年05期
7 羅l,
本文編號(hào):2546220
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2546220.html
最近更新
教材專著