基于深度學(xué)習(xí)的單目標(biāo)跟蹤算法的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2022-02-10 18:53
單目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要分支,在智能視頻監(jiān)控、人機(jī)交互、視覺導(dǎo)航、虛擬現(xiàn)實(shí)領(lǐng)域都有廣泛的應(yīng)用。單目標(biāo)跟蹤通常面臨著尺度變化、形狀改變、背景干擾、光照變化、運(yùn)動(dòng)模糊等挑戰(zhàn)。近幾年,隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,基于深度學(xué)習(xí)的方法在單目標(biāo)跟蹤領(lǐng)域取得了不錯(cuò)的成績,促進(jìn)了單目標(biāo)跟蹤技術(shù)在各行各業(yè)的落地與應(yīng)用。因此,基于深度學(xué)習(xí)的單目標(biāo)跟蹤技術(shù)具有很重要的研究價(jià)值。本文通過對MDNet(Multi-Domain Convolutional Neural Networks)網(wǎng)絡(luò)的研究和分析,并結(jié)合其在單目標(biāo)跟蹤過程中的特點(diǎn)與不足對其進(jìn)行了改進(jìn),設(shè)計(jì)并實(shí)現(xiàn)了新的單目標(biāo)跟蹤算法ASTT-M(A Single Target Tracking Algorithm Based on MDNet)。該算法實(shí)現(xiàn)了跟蹤過程中目標(biāo)的異常檢測和目標(biāo)的多尺度變化,提出了一種基于嶺回歸求解的雙模型回歸策略和基于搜索區(qū)域裁剪的相似性干擾規(guī)避策略,同時(shí)設(shè)計(jì)了一種新的基于聚類的樣本更新方法,并且基于前面的改進(jìn)重新定義了跟蹤控制策略。在目標(biāo)異常檢測方面,本文通過對候選框分值的檢測,可以在跟蹤過程中及時(shí)檢測到目標(biāo)因?yàn)樾?..
【文章來源】:西安電子科技大學(xué)陜西省211工程院校教育部直屬院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
損失函數(shù)值與樣本特征空間歐氏距離關(guān)系圖
3.1 MDNet 網(wǎng)絡(luò)介紹網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練方式MDNe(tMulti-DomainConvolutionalNeuralNetworks)網(wǎng)絡(luò)是 Korea 的 POSTECH團(tuán)隊(duì)提出的一種目標(biāo)跟蹤算法[15],網(wǎng)絡(luò)結(jié)構(gòu)如圖 3.1 所示。主要由三個(gè)卷積層(conv1-3)和兩個(gè)全連接層(fc4-5)構(gòu)成,最后一層全連接層 6Kfc 表示網(wǎng)絡(luò)對 K 個(gè)域(K 個(gè)視頻序列)對應(yīng)的全連接層共具有 K 個(gè)分支,每個(gè)視頻序列對應(yīng)一個(gè)分支,其中前面五層稱之為共享層。在訓(xùn)練和測試時(shí)每個(gè)視頻序列都是一個(gè)單獨(dú)的域,并且有特定的分支,該分支負(fù)責(zé)一個(gè)二分類任務(wù)去識別當(dāng)前域中每一幀的目標(biāo)和背景。MDNet 網(wǎng)絡(luò)通過多域的訓(xùn)練方式使用大量跟蹤視頻中的groundtruth 來對共享層進(jìn)行了預(yù)訓(xùn)練。在訓(xùn)練過程中,每一個(gè)視頻作為一個(gè)單獨(dú)的域,會(huì)生成一個(gè)全新的分支 來負(fù)責(zé)當(dāng)前視頻序列的訓(xùn)練。在每個(gè)域的迭代過程中都對共享層進(jìn)行更新,從而使網(wǎng)絡(luò)具有了對目標(biāo)進(jìn)行通用特征表示的能力。
合在目標(biāo)跟蹤過程中對top5均分值進(jìn)行局部離群點(diǎn)檢測的方法LOF-OT(LocalOutlierFactor in Object Tracking)。圖3.3 異常檢測數(shù)據(jù)分布圖LOF 是一種基于距離的異常檢測方法,通過點(diǎn)與點(diǎn)之間距離的計(jì)算最終求得每
【參考文獻(xiàn)】:
期刊論文
[1]自然場景中文本檢測技術(shù)研究綜述[J]. 戴津. 計(jì)算機(jī)光盤軟件與應(yīng)用. 2013(18)
[2]嶺回歸分析的SAS程序設(shè)計(jì)[J]. 田俊. 數(shù)理統(tǒng)計(jì)與管理. 1999(03)
碩士論文
[1]嶺回歸與分位數(shù)回歸的研究及結(jié)合應(yīng)用[D]. 郭鵬妮.哈爾濱工業(yè)大學(xué) 2014
本文編號:3619352
【文章來源】:西安電子科技大學(xué)陜西省211工程院校教育部直屬院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
損失函數(shù)值與樣本特征空間歐氏距離關(guān)系圖
3.1 MDNet 網(wǎng)絡(luò)介紹網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練方式MDNe(tMulti-DomainConvolutionalNeuralNetworks)網(wǎng)絡(luò)是 Korea 的 POSTECH團(tuán)隊(duì)提出的一種目標(biāo)跟蹤算法[15],網(wǎng)絡(luò)結(jié)構(gòu)如圖 3.1 所示。主要由三個(gè)卷積層(conv1-3)和兩個(gè)全連接層(fc4-5)構(gòu)成,最后一層全連接層 6Kfc 表示網(wǎng)絡(luò)對 K 個(gè)域(K 個(gè)視頻序列)對應(yīng)的全連接層共具有 K 個(gè)分支,每個(gè)視頻序列對應(yīng)一個(gè)分支,其中前面五層稱之為共享層。在訓(xùn)練和測試時(shí)每個(gè)視頻序列都是一個(gè)單獨(dú)的域,并且有特定的分支,該分支負(fù)責(zé)一個(gè)二分類任務(wù)去識別當(dāng)前域中每一幀的目標(biāo)和背景。MDNet 網(wǎng)絡(luò)通過多域的訓(xùn)練方式使用大量跟蹤視頻中的groundtruth 來對共享層進(jìn)行了預(yù)訓(xùn)練。在訓(xùn)練過程中,每一個(gè)視頻作為一個(gè)單獨(dú)的域,會(huì)生成一個(gè)全新的分支 來負(fù)責(zé)當(dāng)前視頻序列的訓(xùn)練。在每個(gè)域的迭代過程中都對共享層進(jìn)行更新,從而使網(wǎng)絡(luò)具有了對目標(biāo)進(jìn)行通用特征表示的能力。
合在目標(biāo)跟蹤過程中對top5均分值進(jìn)行局部離群點(diǎn)檢測的方法LOF-OT(LocalOutlierFactor in Object Tracking)。圖3.3 異常檢測數(shù)據(jù)分布圖LOF 是一種基于距離的異常檢測方法,通過點(diǎn)與點(diǎn)之間距離的計(jì)算最終求得每
【參考文獻(xiàn)】:
期刊論文
[1]自然場景中文本檢測技術(shù)研究綜述[J]. 戴津. 計(jì)算機(jī)光盤軟件與應(yīng)用. 2013(18)
[2]嶺回歸分析的SAS程序設(shè)計(jì)[J]. 田俊. 數(shù)理統(tǒng)計(jì)與管理. 1999(03)
碩士論文
[1]嶺回歸與分位數(shù)回歸的研究及結(jié)合應(yīng)用[D]. 郭鵬妮.哈爾濱工業(yè)大學(xué) 2014
本文編號:3619352
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3619352.html
最近更新
教材專著