基于三分支神經(jīng)網(wǎng)絡(luò)的單目標(biāo)追蹤算法研究
發(fā)布時(shí)間:2020-12-31 19:20
視覺目標(biāo)追蹤是計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn)之一,在無人駕駛,智能安防、人機(jī)交互和信息偵查等領(lǐng)域都有十分重要的應(yīng)用價(jià)值。由于真實(shí)環(huán)境中目標(biāo)的表觀信息和環(huán)境背景都具有復(fù)雜性和不確定性,使得單目標(biāo)追蹤任務(wù)仍存在遮擋、運(yùn)動(dòng)模糊和背景混淆等難點(diǎn)。近幾年,機(jī)器學(xué)習(xí)技術(shù)經(jīng)常被用于計(jì)算機(jī)視覺,因?yàn)樗鼈冇心芰糜?xùn)練數(shù)據(jù)來提高性能。不幸的是,大部分的追蹤算法沒有從海量的離線訓(xùn)練視頻數(shù)據(jù)中受益,而且沒有充分利用到圖片的背景信息,存在著魯棒性差、計(jì)算速度慢等問題。為了充分利用海量的視頻數(shù)據(jù)和圖片的背景信息,本文將單目標(biāo)追蹤模型轉(zhuǎn)化為相似性度量學(xué)習(xí)模型,并使用三分支神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)相似性度量學(xué)習(xí)模型。在訓(xùn)練階段,該模型學(xué)習(xí)視頻序列中目標(biāo)與目標(biāo)之間的相似性度量、背景與背景之間的相似性度量和目標(biāo)與背景之間的空間上下文關(guān)系。在測(cè)試階段,該模型利用目標(biāo)與目標(biāo)之間、背景與背景之間和背景與目標(biāo)之間的匹配關(guān)系,在知道目標(biāo)在前一幀中的位置、尺寸信息,目標(biāo)背景之間的上下文關(guān)系的前提下,準(zhǔn)確預(yù)測(cè)目標(biāo)在當(dāng)前幀中的精確位置和尺寸。如此回環(huán)往復(fù),實(shí)時(shí)預(yù)測(cè)目標(biāo)的位置和尺寸信息,以達(dá)到追蹤的目的。為了增強(qiáng)目標(biāo)和背景表觀模型的魯棒性及可區(qū)分性,本文...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
視覺單目標(biāo)追蹤基本框架
解決單目標(biāo)追蹤任務(wù)的Siamese網(wǎng)絡(luò)的結(jié)構(gòu)通常由三部分組成,如圖2-4所示第一部分為特征提取模塊,該部分接收兩張圖像作為輸入X,通過學(xué)習(xí)一系列的卷積核構(gòu)成特征提取函數(shù)φ,得到具有魯棒性好、區(qū)分性強(qiáng)的特征表F。第二部分為特征比較模塊,該部分接收第一模塊的輸出作為輸出,學(xué)習(xí)一個(gè)非線性度量函數(shù)ψ。對(duì)于每一個(gè)候選圖像,通過比較其特征表示和目標(biāo)圖像特征表示,衡量?jī)烧咧g的相似度,最后將與目標(biāo)圖像最相似的候選圖像的位置和尺寸作為輸出P。第三部分為誤差計(jì)算模塊,該部分接受第二模塊的輸出P和標(biāo)- 16 -
準(zhǔn)確預(yù)測(cè)目標(biāo)在未來的視頻序列中的位置和尺寸。本小節(jié)將詳細(xì)介紹本文使用的三分支網(wǎng)絡(luò)的組成結(jié)構(gòu)。本文提出了基于三分支網(wǎng)絡(luò)的目標(biāo)追蹤模型,如圖3-1所示。該網(wǎng)絡(luò)包含有三個(gè)分支,分別是搜索區(qū)域分支、背景分支和目標(biāo)分支,每個(gè)分支的對(duì)應(yīng)輸入分別是搜索區(qū)域圖片PS、背景區(qū)域圖片PB和目標(biāo)區(qū)域圖片PT,三者獨(dú)立地傳遞到三個(gè)分支網(wǎng)絡(luò)φS、φB、和φT。使用分支網(wǎng)絡(luò)φS和φT的輸出作為輸入學(xué)習(xí)目標(biāo)相似性度量函數(shù) 1,該函數(shù)比較目標(biāo)φT和搜索區(qū)域φS的每一個(gè)窗口,與目標(biāo)φT相似度較大窗口將被賦予較大的分?jǐn)?shù),與目標(biāo)φT相似度較小的窗口將被賦予較小的分?jǐn)?shù)。搜索最大的得分窗口,并將其作為所預(yù)測(cè)的目標(biāo)位置。此時(shí)只得到了目標(biāo)的位置,并未得到目標(biāo)的尺寸。分支網(wǎng)絡(luò)φS和φB的輸出作為輸入學(xué)習(xí)背景相似性度量函數(shù) 2,該函數(shù)匹配搜索區(qū)域和背景區(qū)域
【參考文獻(xiàn)】:
博士論文
[1]視覺目標(biāo)跟蹤中表觀建模方法研究[D]. 趙海楠.哈爾濱工業(yè)大學(xué) 2016
本文編號(hào):2950168
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:56 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
視覺單目標(biāo)追蹤基本框架
解決單目標(biāo)追蹤任務(wù)的Siamese網(wǎng)絡(luò)的結(jié)構(gòu)通常由三部分組成,如圖2-4所示第一部分為特征提取模塊,該部分接收兩張圖像作為輸入X,通過學(xué)習(xí)一系列的卷積核構(gòu)成特征提取函數(shù)φ,得到具有魯棒性好、區(qū)分性強(qiáng)的特征表F。第二部分為特征比較模塊,該部分接收第一模塊的輸出作為輸出,學(xué)習(xí)一個(gè)非線性度量函數(shù)ψ。對(duì)于每一個(gè)候選圖像,通過比較其特征表示和目標(biāo)圖像特征表示,衡量?jī)烧咧g的相似度,最后將與目標(biāo)圖像最相似的候選圖像的位置和尺寸作為輸出P。第三部分為誤差計(jì)算模塊,該部分接受第二模塊的輸出P和標(biāo)- 16 -
準(zhǔn)確預(yù)測(cè)目標(biāo)在未來的視頻序列中的位置和尺寸。本小節(jié)將詳細(xì)介紹本文使用的三分支網(wǎng)絡(luò)的組成結(jié)構(gòu)。本文提出了基于三分支網(wǎng)絡(luò)的目標(biāo)追蹤模型,如圖3-1所示。該網(wǎng)絡(luò)包含有三個(gè)分支,分別是搜索區(qū)域分支、背景分支和目標(biāo)分支,每個(gè)分支的對(duì)應(yīng)輸入分別是搜索區(qū)域圖片PS、背景區(qū)域圖片PB和目標(biāo)區(qū)域圖片PT,三者獨(dú)立地傳遞到三個(gè)分支網(wǎng)絡(luò)φS、φB、和φT。使用分支網(wǎng)絡(luò)φS和φT的輸出作為輸入學(xué)習(xí)目標(biāo)相似性度量函數(shù) 1,該函數(shù)比較目標(biāo)φT和搜索區(qū)域φS的每一個(gè)窗口,與目標(biāo)φT相似度較大窗口將被賦予較大的分?jǐn)?shù),與目標(biāo)φT相似度較小的窗口將被賦予較小的分?jǐn)?shù)。搜索最大的得分窗口,并將其作為所預(yù)測(cè)的目標(biāo)位置。此時(shí)只得到了目標(biāo)的位置,并未得到目標(biāo)的尺寸。分支網(wǎng)絡(luò)φS和φB的輸出作為輸入學(xué)習(xí)背景相似性度量函數(shù) 2,該函數(shù)匹配搜索區(qū)域和背景區(qū)域
【參考文獻(xiàn)】:
博士論文
[1]視覺目標(biāo)跟蹤中表觀建模方法研究[D]. 趙海楠.哈爾濱工業(yè)大學(xué) 2016
本文編號(hào):2950168
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2950168.html
最近更新
教材專著