基于深度特征的地標(biāo)圖像識(shí)別
發(fā)布時(shí)間:2024-01-23 18:21
地標(biāo)圖像識(shí)別有著廣泛的應(yīng)用前景,當(dāng)前最有效的方法是使用圖像檢索的方式查詢相似圖像位置。當(dāng)前這些深度特征檢索方法中依然存在以下幾個(gè)問(wèn)題:(1)模型多數(shù)使用單一特征,在卷積神經(jīng)網(wǎng)絡(luò)方法中僅使用全局特征或者局部特征,如何有效融合兩種特征在當(dāng)今是一個(gè)難題。(2)地標(biāo)識(shí)別受限于數(shù)據(jù)集標(biāo)注問(wèn)題,依然無(wú)法完成先檢測(cè)后識(shí)別分類這樣的分段流程,準(zhǔn)確性必然降低許多。(3)分類訓(xùn)練中標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù)在類別數(shù)量遠(yuǎn)大于嵌入特征維度時(shí)表現(xiàn)欠佳,度量學(xué)習(xí)中三元組損失則因?yàn)槿M挖掘的效率使模型訓(xùn)練難以快速收斂。針對(duì)以上問(wèn)題,本課題完成了以下工作:(1)探索GeM池化、注意力機(jī)制等模型結(jié)構(gòu)。(2)研究對(duì)比損失的特性與其適用條件,給出科學(xué)的訓(xùn)練參數(shù)選取范圍,結(jié)合模型結(jié)構(gòu)和策略訓(xùn)練全局特征提取模型。(3)研究當(dāng)前人臉識(shí)別中結(jié)果較優(yōu)的增量角度域損失(Additive Angular Margin Loss,ArcFace損失),分析角度域參數(shù)選取條件,闡述該損失的特性并進(jìn)行對(duì)比實(shí)驗(yàn)分析。在全局特征提取模型的基礎(chǔ)上,提出一種高效并融合多特征且使用弱監(jiān)督訓(xùn)練的地標(biāo)識(shí)別模型(ArcMF)。本課題中,實(shí)驗(yàn)表明ArcFace損失能...
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
本文編號(hào):3883145
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
圖3-7非地標(biāo)圖像
圖5-1南京街景無(wú)效圖像
圖5-2Recall@N效果圖
本文編號(hào):3883145
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3883145.html
最近更新
教材專著