基于難例挖掘和域自適應(yīng)的視覺(jué)位置識(shí)別
發(fā)布時(shí)間:2022-01-15 10:58
隨著計(jì)算機(jī)視覺(jué)相關(guān)技術(shù)的不斷發(fā)展,即時(shí)定位與地圖構(gòu)建(SLAM)技術(shù)在人類生活中的應(yīng)用越來(lái)越廣泛,如自主導(dǎo)航機(jī)器人、自動(dòng)駕駛、無(wú)人機(jī)、虛擬現(xiàn)實(shí)等。但在SLAM中,我們依然面臨著不少需要解決的難題,比如回環(huán)檢測(cè)。回環(huán)檢測(cè)的任務(wù)是判斷當(dāng)前位置是否為之前訪問(wèn)過(guò)的某個(gè)位置,目的是為構(gòu)建地圖任務(wù)添加新的約束,從而消去地圖構(gòu)建過(guò)程中產(chǎn)生的累計(jì)誤差;丨h(huán)檢測(cè)的本質(zhì)是位置識(shí)別。傳統(tǒng)的位置識(shí)別算法如視覺(jué)詞袋模型等依賴于手工設(shè)計(jì)的圖像特征,這些特征在變化場(chǎng)景(場(chǎng)景中行人和車輛等可移動(dòng)對(duì)象發(fā)生變化)、視點(diǎn)改變以及晝夜光照差異的情況下會(huì)發(fā)生改變,從而影響位置識(shí)別的性能。另一方面,近年來(lái)深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域取得了巨大的進(jìn)步,其實(shí)現(xiàn)了特征表達(dá)與分類識(shí)別的聯(lián)合學(xué)習(xí),從而可以自動(dòng)提取更加魯棒的圖像特征。為此有學(xué)者提出了基于深度卷積神經(jīng)網(wǎng)絡(luò)的視覺(jué)位置識(shí)別算法。本文研究也是圍繞基于深度卷積神經(jīng)網(wǎng)絡(luò)的視覺(jué)位置識(shí)別展開(kāi)的,與傳統(tǒng)的算法相比可以解決在變化場(chǎng)景以及視角改變的情況下低識(shí)別率的問(wèn)題。但是,已有的基于深度卷積神經(jīng)網(wǎng)絡(luò)的算法沒(méi)有充分考慮到與待識(shí)別目標(biāo)圖像相似的負(fù)樣本的干擾的問(wèn)題。這些負(fù)樣本為對(duì)于深度卷積神經(jīng)網(wǎng)絡(luò)而言難...
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
視覺(jué)位置識(shí)別的基本框架
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文最后三層為全連接層。因?yàn)槲覀冎焕?VGG16 提取圖像特征,并且有學(xué)者已經(jīng)證明神經(jīng)網(wǎng)絡(luò)的中層特征在位置識(shí)別任務(wù)中性能更好[30]。所以本文去掉了 VGG16 網(wǎng)絡(luò)中的最后三層全連接層。VGG16 深度神經(jīng)網(wǎng)絡(luò)包含十三層卷積層,屬于較深的神經(jīng)網(wǎng)絡(luò),能夠有效地提取到圖像的豐富特征,去掉了其最后三層全連接層的結(jié)構(gòu)如圖 2-1 所示,其中第一大層卷積層 Conv1 包含兩層卷積層,每一層卷積層之后包含一層激活層如圖 2-1 中的灰色部分,激活函數(shù)使用線性整流函數(shù)(Relu),對(duì)深度神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元的活躍度進(jìn)行調(diào)節(jié),并且該激活函數(shù)可以有效避免深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中出現(xiàn)梯度消失,使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中利用梯度下降最小化損失更加有效。
如果將 VLAD 算法看做硬 VLAD 算法,NetVLAD 算法則是基于深度神經(jīng) VLAD 算法。從式 2-1 中可以看出,每一個(gè)局部特征與離自己最近聚類中權(quán)重為1,與其他聚類中心的差的權(quán)重為 0。而在NetVLAD中的表達(dá)如下所j 1( ), (1, 2,... ), 1iInj ij i jFeat sif urejfea a f c j C a (ija 為第 i 個(gè)特征與第 j 個(gè)聚類中心的向量差的權(quán)重,第 i 個(gè)特征到所有聚向量差的權(quán)重和為 1。所以,我們可以看出 NetVLAD 為軟 VLAD,向量差一個(gè)概率,該概率的大小與特征和聚類中心的距離有關(guān)。到最近的聚類中大,到最遠(yuǎn)的聚類中心的權(quán)重小,對(duì)于每一個(gè)特征向量,到所有聚類中心為 1。這樣相比于 VLAD 算法,NetVLAD 算法用到了更多的聚類中心的D 算法中權(quán)重只為 1 和 0,只用了離自己最近的聚類中心的信息。特征聚etVALD 的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2-2 所示。
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的視覺(jué)位置識(shí)別方法[J]. 仇曉松,鄒旭東,王金戈,展揚(yáng). 計(jì)算機(jī)工程與設(shè)計(jì). 2019(01)
[2]基于深度卷積神經(jīng)網(wǎng)絡(luò)的位置識(shí)別方法[J]. 黃于峰,劉建國(guó). 計(jì)算機(jī)與數(shù)字工程. 2018(04)
本文編號(hào):3590496
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
視覺(jué)位置識(shí)別的基本框架
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文最后三層為全連接層。因?yàn)槲覀冎焕?VGG16 提取圖像特征,并且有學(xué)者已經(jīng)證明神經(jīng)網(wǎng)絡(luò)的中層特征在位置識(shí)別任務(wù)中性能更好[30]。所以本文去掉了 VGG16 網(wǎng)絡(luò)中的最后三層全連接層。VGG16 深度神經(jīng)網(wǎng)絡(luò)包含十三層卷積層,屬于較深的神經(jīng)網(wǎng)絡(luò),能夠有效地提取到圖像的豐富特征,去掉了其最后三層全連接層的結(jié)構(gòu)如圖 2-1 所示,其中第一大層卷積層 Conv1 包含兩層卷積層,每一層卷積層之后包含一層激活層如圖 2-1 中的灰色部分,激活函數(shù)使用線性整流函數(shù)(Relu),對(duì)深度神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元的活躍度進(jìn)行調(diào)節(jié),并且該激活函數(shù)可以有效避免深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中出現(xiàn)梯度消失,使神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中利用梯度下降最小化損失更加有效。
如果將 VLAD 算法看做硬 VLAD 算法,NetVLAD 算法則是基于深度神經(jīng) VLAD 算法。從式 2-1 中可以看出,每一個(gè)局部特征與離自己最近聚類中權(quán)重為1,與其他聚類中心的差的權(quán)重為 0。而在NetVLAD中的表達(dá)如下所j 1( ), (1, 2,... ), 1iInj ij i jFeat sif urejfea a f c j C a (ija 為第 i 個(gè)特征與第 j 個(gè)聚類中心的向量差的權(quán)重,第 i 個(gè)特征到所有聚向量差的權(quán)重和為 1。所以,我們可以看出 NetVLAD 為軟 VLAD,向量差一個(gè)概率,該概率的大小與特征和聚類中心的距離有關(guān)。到最近的聚類中大,到最遠(yuǎn)的聚類中心的權(quán)重小,對(duì)于每一個(gè)特征向量,到所有聚類中心為 1。這樣相比于 VLAD 算法,NetVLAD 算法用到了更多的聚類中心的D 算法中權(quán)重只為 1 和 0,只用了離自己最近的聚類中心的信息。特征聚etVALD 的網(wǎng)絡(luò)結(jié)構(gòu)如圖 2-2 所示。
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的視覺(jué)位置識(shí)別方法[J]. 仇曉松,鄒旭東,王金戈,展揚(yáng). 計(jì)算機(jī)工程與設(shè)計(jì). 2019(01)
[2]基于深度卷積神經(jīng)網(wǎng)絡(luò)的位置識(shí)別方法[J]. 黃于峰,劉建國(guó). 計(jì)算機(jī)與數(shù)字工程. 2018(04)
本文編號(hào):3590496
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3590496.html
最近更新
教材專著