復雜場景下的視覺對象跟蹤建模及算法研究
發(fā)布時間:2021-09-24 05:57
對象跟蹤是一個計算器視覺領域內的基本任務,該任務旨在從圖像或者視頻中尋找出目標物體。該任務在自動駕駛、智能監(jiān)控、人機交互以及醫(yī)學成像等多種運用中具有很高的實用價值,因此大量的研究力量被投入其中。然而,在真實的對象跟蹤場景中,視頻目標跟蹤往往會由于復雜場景條件和目標運動的隨機性而變得困難。在自然條件下,目標物體經(jīng)常出現(xiàn)光照變化、旋轉、伸縮、遮擋、曝光不足、背景變化、運動的復雜性和隨機性等因素,這些都會使得對象跟蹤變得非常困難。雖然對象跟蹤算法已經(jīng)取得了豐碩的研究成果,但在理論和應用上也存在著不完善和待解決的問題。在此背景下,研究復雜場景下的對象跟蹤算法在理論和應用方面都具有非常重要的意義。從神經(jīng)網(wǎng)絡的模型結構出發(fā),對現(xiàn)有的模型進行優(yōu)化,結合真實對象跟蹤場景特性,探索新的網(wǎng)絡模型,研究新的處理算法,提高對象跟蹤的性能和效率。研究成果主要在如下幾個方面體現(xiàn):首先,針對復雜場景下的跟蹤失效及恢復問題,提出了一種基于自組織映射網(wǎng)絡(Self-Organizing Maps,SOM)和相關濾波器的長期記憶對象跟蹤算法。在對象跟蹤中,不同的視頻或圖像中的同一種物體常常有著不同的外觀,對這些外觀進行學...
【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:110 頁
【學位級別】:博士
【部分圖文】:
對象跟蹤的六種典型應用
1緒論31.2視覺對象跟蹤系統(tǒng)結構對象跟蹤的基本方法是給定第一幀中一般目標對象的初始狀態(tài)(如位置和尺度),或者使用對象識別方法(例如,人臉[1]或行人[2]檢測器)檢測出第一幀中包含的對象的初始狀態(tài)。利用對象跟蹤算法在下一幀中產(chǎn)生眾多候選框,并提取這些候選框的特征,在提取的特征基礎上對這些候選框進行評分,最后找一個得分最高的候選框作為預測的目標。在圖1.2中,我們展示了一個視覺對象跟蹤的典型結構。概況起來,一個典型的視覺對象跟蹤系統(tǒng)[3,4,5]一般由五個模塊組成:(1)運動模型:產(chǎn)生候選樣本。(2)外觀建模:提取有效特征表示目標。(3)觀測模型:為候選樣本進行評分。(4)模型更新:更新觀測模型使其適應目標的變化。(5)集成方法:結合多個預測獲得最優(yōu)的決策結果。運動模型生成候選樣本的速度與質量直接決定了跟蹤系統(tǒng)表現(xiàn)的優(yōu)劣。運動模型可以表示為一個經(jīng)典的動態(tài)狀態(tài)估計問題:=(,)和=(,),其中 為當前狀態(tài), 為當前觀測;為狀態(tài)演化函數(shù),為演化過程噪聲; 為測量函數(shù), 為測量噪聲。估計的目標是計算給定觀測數(shù)據(jù)的隱藏狀態(tài)的最優(yōu)估計,而運動估計則可作為貝葉斯規(guī)則[6]的遞歸形式導出。典型運動模型包括線性回歸技術[7]、卡爾曼濾波器[8]、粒子濾波器[9,10]或相關濾波器[11]。外觀建模通過不同類型的判別特征構建健壯的外觀描述符。在以前的研究中,大量手工制作的特征模型被用來表示目標外觀。如子空間表示[12]、顏色直方圖[13]、方向梯度直方圖(HOG)、哈爾特征(Haar)[14]、SURF[15]、ORB[16]和SuperPixels[17]。近年來,這些特性模型依靠深度卷積神經(jīng)網(wǎng)絡有了顯著的進展,在視覺跟蹤方面得到了大量的應用[18,19,20,21]。觀測模型根據(jù)不同的實現(xiàn)算?
1緒論11學習判別顯著性映射。Wang等人基于VGGNet-16[80]的特征,使用全連通CNN構建了回歸模型。這些方法在利用大量輔助數(shù)據(jù)進行離線學習有效特征表示時顯示出了有競爭性的對象跟蹤結果,也不要完全考慮在后續(xù)幀的目標對象的相似的局部結構和內部之間的幾何布局信息,這有利于在跟蹤過程中從復雜背景中有效地區(qū)分視覺跟蹤目標。a.目標形變b.光照變化c.突然運動d.背景雜波e.面外旋轉f.面內旋轉g.嚴重遮擋h.視野外圖1.3復雜場景下對象外觀變化的特點及挑戰(zhàn)Fig.1.3Featuredchallengescausedbysignificantappearancevariationsincomplexscene
【參考文獻】:
期刊論文
[1]融合峰旁比和幀差均值自適應模型更新的視覺跟蹤[J]. 熊昌鎮(zhèn),車滿強,王潤玲,盧顏. 光子學報. 2018(09)
本文編號:3407232
【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:110 頁
【學位級別】:博士
【部分圖文】:
對象跟蹤的六種典型應用
1緒論31.2視覺對象跟蹤系統(tǒng)結構對象跟蹤的基本方法是給定第一幀中一般目標對象的初始狀態(tài)(如位置和尺度),或者使用對象識別方法(例如,人臉[1]或行人[2]檢測器)檢測出第一幀中包含的對象的初始狀態(tài)。利用對象跟蹤算法在下一幀中產(chǎn)生眾多候選框,并提取這些候選框的特征,在提取的特征基礎上對這些候選框進行評分,最后找一個得分最高的候選框作為預測的目標。在圖1.2中,我們展示了一個視覺對象跟蹤的典型結構。概況起來,一個典型的視覺對象跟蹤系統(tǒng)[3,4,5]一般由五個模塊組成:(1)運動模型:產(chǎn)生候選樣本。(2)外觀建模:提取有效特征表示目標。(3)觀測模型:為候選樣本進行評分。(4)模型更新:更新觀測模型使其適應目標的變化。(5)集成方法:結合多個預測獲得最優(yōu)的決策結果。運動模型生成候選樣本的速度與質量直接決定了跟蹤系統(tǒng)表現(xiàn)的優(yōu)劣。運動模型可以表示為一個經(jīng)典的動態(tài)狀態(tài)估計問題:=(,)和=(,),其中 為當前狀態(tài), 為當前觀測;為狀態(tài)演化函數(shù),為演化過程噪聲; 為測量函數(shù), 為測量噪聲。估計的目標是計算給定觀測數(shù)據(jù)的隱藏狀態(tài)的最優(yōu)估計,而運動估計則可作為貝葉斯規(guī)則[6]的遞歸形式導出。典型運動模型包括線性回歸技術[7]、卡爾曼濾波器[8]、粒子濾波器[9,10]或相關濾波器[11]。外觀建模通過不同類型的判別特征構建健壯的外觀描述符。在以前的研究中,大量手工制作的特征模型被用來表示目標外觀。如子空間表示[12]、顏色直方圖[13]、方向梯度直方圖(HOG)、哈爾特征(Haar)[14]、SURF[15]、ORB[16]和SuperPixels[17]。近年來,這些特性模型依靠深度卷積神經(jīng)網(wǎng)絡有了顯著的進展,在視覺跟蹤方面得到了大量的應用[18,19,20,21]。觀測模型根據(jù)不同的實現(xiàn)算?
1緒論11學習判別顯著性映射。Wang等人基于VGGNet-16[80]的特征,使用全連通CNN構建了回歸模型。這些方法在利用大量輔助數(shù)據(jù)進行離線學習有效特征表示時顯示出了有競爭性的對象跟蹤結果,也不要完全考慮在后續(xù)幀的目標對象的相似的局部結構和內部之間的幾何布局信息,這有利于在跟蹤過程中從復雜背景中有效地區(qū)分視覺跟蹤目標。a.目標形變b.光照變化c.突然運動d.背景雜波e.面外旋轉f.面內旋轉g.嚴重遮擋h.視野外圖1.3復雜場景下對象外觀變化的特點及挑戰(zhàn)Fig.1.3Featuredchallengescausedbysignificantappearancevariationsincomplexscene
【參考文獻】:
期刊論文
[1]融合峰旁比和幀差均值自適應模型更新的視覺跟蹤[J]. 熊昌鎮(zhèn),車滿強,王潤玲,盧顏. 光子學報. 2018(09)
本文編號:3407232
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3407232.html
最近更新
教材專著