天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于難例挖掘和域自適應(yīng)的視覺位置識別

發(fā)布時間:2022-01-15 10:58
  隨著計算機視覺相關(guān)技術(shù)的不斷發(fā)展,即時定位與地圖構(gòu)建(SLAM)技術(shù)在人類生活中的應(yīng)用越來越廣泛,如自主導(dǎo)航機器人、自動駕駛、無人機、虛擬現(xiàn)實等。但在SLAM中,我們依然面臨著不少需要解決的難題,比如回環(huán)檢測。回環(huán)檢測的任務(wù)是判斷當前位置是否為之前訪問過的某個位置,目的是為構(gòu)建地圖任務(wù)添加新的約束,從而消去地圖構(gòu)建過程中產(chǎn)生的累計誤差。回環(huán)檢測的本質(zhì)是位置識別。傳統(tǒng)的位置識別算法如視覺詞袋模型等依賴于手工設(shè)計的圖像特征,這些特征在變化場景(場景中行人和車輛等可移動對象發(fā)生變化)、視點改變以及晝夜光照差異的情況下會發(fā)生改變,從而影響位置識別的性能。另一方面,近年來深度學(xué)習在計算機視覺領(lǐng)域取得了巨大的進步,其實現(xiàn)了特征表達與分類識別的聯(lián)合學(xué)習,從而可以自動提取更加魯棒的圖像特征。為此有學(xué)者提出了基于深度卷積神經(jīng)網(wǎng)絡(luò)的視覺位置識別算法。本文研究也是圍繞基于深度卷積神經(jīng)網(wǎng)絡(luò)的視覺位置識別展開的,與傳統(tǒng)的算法相比可以解決在變化場景以及視角改變的情況下低識別率的問題。但是,已有的基于深度卷積神經(jīng)網(wǎng)絡(luò)的算法沒有充分考慮到與待識別目標圖像相似的負樣本的干擾的問題。這些負樣本為對于深度卷積神經(jīng)網(wǎng)絡(luò)而言難... 

【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:74 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于難例挖掘和域自適應(yīng)的視覺位置識別


視覺位置識別的基本框架

網(wǎng)絡(luò)結(jié)構(gòu)圖,網(wǎng)絡(luò)結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò),卷積


華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文最后三層為全連接層。因為我們只利用 VGG16 提取圖像特征,并且有學(xué)者已經(jīng)證明神經(jīng)網(wǎng)絡(luò)的中層特征在位置識別任務(wù)中性能更好[30]。所以本文去掉了 VGG16 網(wǎng)絡(luò)中的最后三層全連接層。VGG16 深度神經(jīng)網(wǎng)絡(luò)包含十三層卷積層,屬于較深的神經(jīng)網(wǎng)絡(luò),能夠有效地提取到圖像的豐富特征,去掉了其最后三層全連接層的結(jié)構(gòu)如圖 2-1 所示,其中第一大層卷積層 Conv1 包含兩層卷積層,每一層卷積層之后包含一層激活層如圖 2-1 中的灰色部分,激活函數(shù)使用線性整流函數(shù)(Relu),對深度神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元的活躍度進行調(diào)節(jié),并且該激活函數(shù)可以有效避免深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中出現(xiàn)梯度消失,使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中利用梯度下降最小化損失更加有效。

網(wǎng)絡(luò)結(jié)構(gòu)圖,網(wǎng)絡(luò)結(jié)構(gòu),聚類中心,權(quán)重


如果將 VLAD 算法看做硬 VLAD 算法,NetVLAD 算法則是基于深度神經(jīng) VLAD 算法。從式 2-1 中可以看出,每一個局部特征與離自己最近聚類中權(quán)重為1,與其他聚類中心的差的權(quán)重為 0。而在NetVLAD中的表達如下所j 1( ), (1, 2,... ), 1iInj ij i jFeat sif urejfea a f c j C a (ija 為第 i 個特征與第 j 個聚類中心的向量差的權(quán)重,第 i 個特征到所有聚向量差的權(quán)重和為 1。所以,我們可以看出 NetVLAD 為軟 VLAD,向量差一個概率,該概率的大小與特征和聚類中心的距離有關(guān)。到最近的聚類中大,到最遠的聚類中心的權(quán)重小,對于每一個特征向量,到所有聚類中心為 1。這樣相比于 VLAD 算法,NetVLAD 算法用到了更多的聚類中心的D 算法中權(quán)重只為 1 和 0,只用了離自己最近的聚類中心的信息。特征聚etVALD 的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2-2 所示。

【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的視覺位置識別方法[J]. 仇曉松,鄒旭東,王金戈,展揚.  計算機工程與設(shè)計. 2019(01)
[2]基于深度卷積神經(jīng)網(wǎng)絡(luò)的位置識別方法[J]. 黃于峰,劉建國.  計算機與數(shù)字工程. 2018(04)



本文編號:3590496

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3590496.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶49a51***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com