基于深度特征的地標圖像識別
發(fā)布時間:2024-01-23 18:21
地標圖像識別有著廣泛的應用前景,當前最有效的方法是使用圖像檢索的方式查詢相似圖像位置。當前這些深度特征檢索方法中依然存在以下幾個問題:(1)模型多數使用單一特征,在卷積神經網絡方法中僅使用全局特征或者局部特征,如何有效融合兩種特征在當今是一個難題。(2)地標識別受限于數據集標注問題,依然無法完成先檢測后識別分類這樣的分段流程,準確性必然降低許多。(3)分類訓練中標準交叉熵損失函數在類別數量遠大于嵌入特征維度時表現欠佳,度量學習中三元組損失則因為三元組挖掘的效率使模型訓練難以快速收斂。針對以上問題,本課題完成了以下工作:(1)探索GeM池化、注意力機制等模型結構。(2)研究對比損失的特性與其適用條件,給出科學的訓練參數選取范圍,結合模型結構和策略訓練全局特征提取模型。(3)研究當前人臉識別中結果較優(yōu)的增量角度域損失(Additive Angular Margin Loss,ArcFace損失),分析角度域參數選取條件,闡述該損失的特性并進行對比實驗分析。在全局特征提取模型的基礎上,提出一種高效并融合多特征且使用弱監(jiān)督訓練的地標識別模型(ArcMF)。本課題中,實驗表明ArcFace損失能...
【文章頁數】:64 頁
【學位級別】:碩士
本文編號:3883145
【文章頁數】:64 頁
【學位級別】:碩士
圖3-7非地標圖像
圖5-1南京街景無效圖像
圖5-2Recall@N效果圖
本文編號:3883145
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3883145.html
最近更新
教材專著