基于CNN的平面物體跟蹤算法的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-07-16 17:23
視覺目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)尤為關(guān)鍵的分支,作為視覺目標(biāo)跟蹤研究范疇之一的平面物體跟蹤既是計(jì)算機(jī)視覺學(xué)術(shù)研究的熱點(diǎn)領(lǐng)域,又在增強(qiáng)現(xiàn)實(shí)、監(jiān)視、機(jī)器人視覺等方向上具有頗為廣泛的應(yīng)用。近幾十年以來(lái),已出現(xiàn)較多算法用于解決平面物體跟蹤問題。目前大多數(shù)算法都屬于傳統(tǒng)的平面物體跟蹤算法,傳統(tǒng)的平面物體跟蹤可以歸結(jié)為非線性優(yōu)化問題,算法的核心目標(biāo)在于最小化目標(biāo)函數(shù),由于該問題本身屬于非凸性問題,因此求解過程中容易獲得局部極值解從而導(dǎo)致跟蹤效果不理想。由于現(xiàn)階段基于深度學(xué)習(xí)網(wǎng)絡(luò)的圖像處理任務(wù)備受關(guān)注,且鑒于目前將深度學(xué)習(xí)與平面物體跟蹤相結(jié)合的相關(guān)研究很少,本文提出將深度學(xué)習(xí)網(wǎng)絡(luò)應(yīng)用到平面物體跟蹤任務(wù)中,探索用于解決平面物體跟蹤問題更為精準(zhǔn)且高效的算法。本文主要的研究工作見下述內(nèi)容:(1)問題的調(diào)研與分析。本文首先對(duì)于已有的平面物體跟蹤算法進(jìn)行大量調(diào)研,并對(duì)現(xiàn)有的算法存在的局部極值問題進(jìn)行剖析。(2)提出了基于卷積神經(jīng)網(wǎng)絡(luò)的平面物體跟蹤算法。提出的算法采用卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)實(shí)現(xiàn)端到端的跟蹤訓(xùn)練過程,整體結(jié)構(gòu)模擬傳統(tǒng)的平面物體跟蹤過程中特征提取、匹配以及變換參數(shù)的評(píng)估三個(gè)步驟。該算法較傳統(tǒng)的算法更能捕...
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1模板匹配的算法流程??Figure?2-1?Template?matching?algorithm?flow??條件方差和(SCV)[341是一種基于圖像相似性度量的跟蹤算法,是高效二階最??
鍵點(diǎn)及存儲(chǔ)關(guān)鍵點(diǎn)的描述符,接下來(lái)建立對(duì)象模型與輸入圖像之間關(guān)鍵點(diǎn)的對(duì)應(yīng)??關(guān)系,最后在源于對(duì)應(yīng)關(guān)系所產(chǎn)生的假設(shè)基礎(chǔ)上,采用穩(wěn)健的幾何驗(yàn)證方法估計(jì)圖??像中目標(biāo)對(duì)象的變化,例如RANSACMM方法。算法具體流程如圖2-2所示。???y?[???目標(biāo)對(duì)象提取局部描述符(N=l)??——?Y—^^ ̄)??N??▼??當(dāng)前幀提取局部描述符(N=2,?3,...)???j???匹配描述符???I?[???幾何驗(yàn)證???I?r???N=N+1??I??圖2-2基于關(guān)鍵點(diǎn)跟蹤的算法流程??Figure?2-2?Algorithm?flow?based?on?key-point?tracking??基于關(guān)鍵點(diǎn)的平面物體跟蹤算法依賴于關(guān)鍵點(diǎn),比較典型的SATt6]算法中采用??SIFT作為關(guān)鍵點(diǎn)檢測(cè)器及特征描述符,SIFT優(yōu)勢(shì)在于對(duì)照明、噪聲、旋轉(zhuǎn)及縮放??變化具有不變性,該算法在實(shí)際跟蹤過程中,先是利用SIFT提取特征,接著在圖??像序列的每一幀中設(shè)置一定的搜索域,采用縮小搜索域范圍的方式選定關(guān)鍵的候??選部分,同時(shí)計(jì)算局部描述符并在整幅圖像中匹配它們,其次將計(jì)算得到的描述符??同目標(biāo)模型的描述符利用歐幾里德距離進(jìn)行相似性匹配,利用評(píng)估最近鄰居的距??離與第二近鄰距離的比率判斷最優(yōu)匹配
Figure?2-3?A?typical?CNN?architecture??(1)卷積層:卷積神經(jīng)網(wǎng)絡(luò)的每一層涵蓋一組神經(jīng)元及可供學(xué)習(xí)的參數(shù),??其中參數(shù)用來(lái)決定層之間的神經(jīng)元該如何連接。整個(gè)架構(gòu)由級(jí)聯(lián)層構(gòu)成,其主要??部分是卷積層,卷積層的卷積核或?yàn)V波在整個(gè)圖像的空間位置上執(zhí)行卷積操作以??生成輸出圖像的特征映射,具體操作是計(jì)算輸入圖像的區(qū)域與濾波器權(quán)重矩陣的??點(diǎn)積,計(jì)算過程中濾波器將滑過整幅圖像進(jìn)行重復(fù)相同的點(diǎn)積運(yùn)算,并將計(jì)算結(jié)??果作為本層的輸出。卷積層的計(jì)算需要注意兩點(diǎn):一是濾波器的通道數(shù)要與輸入??圖像的通道數(shù)目相同;二是網(wǎng)絡(luò)愈深則所需的濾波器愈多,那么獲得的邊緣與特??征檢測(cè)則愈多。??(2)激活層:激活層的作用是將卷積層的輸出結(jié)果做非線性映射[43],即呈??非線性形式映射數(shù)據(jù)點(diǎn),激活層是否被正確設(shè)置對(duì)于卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的表現(xiàn)性??起著至關(guān)重要的作用,現(xiàn)階段卷積神經(jīng)網(wǎng)絡(luò)中最常用的激活函數(shù)是ReLU,該激??活函數(shù)有著收斂快且梯度計(jì)算較容易的優(yōu)勢(shì),其執(zhí)行規(guī)則為y?=?max(0,x),即輸??入圖像的每個(gè)負(fù)值都將返回0值,而每個(gè)正值都將返回與其相同的值,該操作具??
【參考文獻(xiàn)】:
博士論文
[1]基于稀疏表示的RGB-D圖像特征學(xué)習(xí)研究與應(yīng)用[D]. 涂淑琴.華南農(nóng)業(yè)大學(xué) 2016
碩士論文
[1]自由活體動(dòng)物的動(dòng)態(tài)跟蹤算法研究[D]. 刁澤浩.河北大學(xué) 2018
[2]基于深度特征的多頭部姿態(tài)下自然表情識(shí)別研究[D]. 張木蘭.華中師范大學(xué) 2018
[3]基于圖像處理的自動(dòng)試衣軟件設(shè)計(jì)與實(shí)現(xiàn)[D]. 鄧建華.東華理工大學(xué) 2017
[4]門禁系統(tǒng)人數(shù)統(tǒng)計(jì)與異常行為檢測(cè)技術(shù)研究[D]. 楊偉清.西南科技大學(xué) 2016
[5]基于深度卷積神經(jīng)網(wǎng)絡(luò)的CT圖像肝臟腫瘤分割方法研究[D]. 李雯.中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院 2016
本文編號(hào):3287432
【文章來(lái)源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1模板匹配的算法流程??Figure?2-1?Template?matching?algorithm?flow??條件方差和(SCV)[341是一種基于圖像相似性度量的跟蹤算法,是高效二階最??
鍵點(diǎn)及存儲(chǔ)關(guān)鍵點(diǎn)的描述符,接下來(lái)建立對(duì)象模型與輸入圖像之間關(guān)鍵點(diǎn)的對(duì)應(yīng)??關(guān)系,最后在源于對(duì)應(yīng)關(guān)系所產(chǎn)生的假設(shè)基礎(chǔ)上,采用穩(wěn)健的幾何驗(yàn)證方法估計(jì)圖??像中目標(biāo)對(duì)象的變化,例如RANSACMM方法。算法具體流程如圖2-2所示。???y?[???目標(biāo)對(duì)象提取局部描述符(N=l)??——?Y—^^ ̄)??N??▼??當(dāng)前幀提取局部描述符(N=2,?3,...)???j???匹配描述符???I?[???幾何驗(yàn)證???I?r???N=N+1??I??圖2-2基于關(guān)鍵點(diǎn)跟蹤的算法流程??Figure?2-2?Algorithm?flow?based?on?key-point?tracking??基于關(guān)鍵點(diǎn)的平面物體跟蹤算法依賴于關(guān)鍵點(diǎn),比較典型的SATt6]算法中采用??SIFT作為關(guān)鍵點(diǎn)檢測(cè)器及特征描述符,SIFT優(yōu)勢(shì)在于對(duì)照明、噪聲、旋轉(zhuǎn)及縮放??變化具有不變性,該算法在實(shí)際跟蹤過程中,先是利用SIFT提取特征,接著在圖??像序列的每一幀中設(shè)置一定的搜索域,采用縮小搜索域范圍的方式選定關(guān)鍵的候??選部分,同時(shí)計(jì)算局部描述符并在整幅圖像中匹配它們,其次將計(jì)算得到的描述符??同目標(biāo)模型的描述符利用歐幾里德距離進(jìn)行相似性匹配,利用評(píng)估最近鄰居的距??離與第二近鄰距離的比率判斷最優(yōu)匹配
Figure?2-3?A?typical?CNN?architecture??(1)卷積層:卷積神經(jīng)網(wǎng)絡(luò)的每一層涵蓋一組神經(jīng)元及可供學(xué)習(xí)的參數(shù),??其中參數(shù)用來(lái)決定層之間的神經(jīng)元該如何連接。整個(gè)架構(gòu)由級(jí)聯(lián)層構(gòu)成,其主要??部分是卷積層,卷積層的卷積核或?yàn)V波在整個(gè)圖像的空間位置上執(zhí)行卷積操作以??生成輸出圖像的特征映射,具體操作是計(jì)算輸入圖像的區(qū)域與濾波器權(quán)重矩陣的??點(diǎn)積,計(jì)算過程中濾波器將滑過整幅圖像進(jìn)行重復(fù)相同的點(diǎn)積運(yùn)算,并將計(jì)算結(jié)??果作為本層的輸出。卷積層的計(jì)算需要注意兩點(diǎn):一是濾波器的通道數(shù)要與輸入??圖像的通道數(shù)目相同;二是網(wǎng)絡(luò)愈深則所需的濾波器愈多,那么獲得的邊緣與特??征檢測(cè)則愈多。??(2)激活層:激活層的作用是將卷積層的輸出結(jié)果做非線性映射[43],即呈??非線性形式映射數(shù)據(jù)點(diǎn),激活層是否被正確設(shè)置對(duì)于卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練的表現(xiàn)性??起著至關(guān)重要的作用,現(xiàn)階段卷積神經(jīng)網(wǎng)絡(luò)中最常用的激活函數(shù)是ReLU,該激??活函數(shù)有著收斂快且梯度計(jì)算較容易的優(yōu)勢(shì),其執(zhí)行規(guī)則為y?=?max(0,x),即輸??入圖像的每個(gè)負(fù)值都將返回0值,而每個(gè)正值都將返回與其相同的值,該操作具??
【參考文獻(xiàn)】:
博士論文
[1]基于稀疏表示的RGB-D圖像特征學(xué)習(xí)研究與應(yīng)用[D]. 涂淑琴.華南農(nóng)業(yè)大學(xué) 2016
碩士論文
[1]自由活體動(dòng)物的動(dòng)態(tài)跟蹤算法研究[D]. 刁澤浩.河北大學(xué) 2018
[2]基于深度特征的多頭部姿態(tài)下自然表情識(shí)別研究[D]. 張木蘭.華中師范大學(xué) 2018
[3]基于圖像處理的自動(dòng)試衣軟件設(shè)計(jì)與實(shí)現(xiàn)[D]. 鄧建華.東華理工大學(xué) 2017
[4]門禁系統(tǒng)人數(shù)統(tǒng)計(jì)與異常行為檢測(cè)技術(shù)研究[D]. 楊偉清.西南科技大學(xué) 2016
[5]基于深度卷積神經(jīng)網(wǎng)絡(luò)的CT圖像肝臟腫瘤分割方法研究[D]. 李雯.中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院 2016
本文編號(hào):3287432
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3287432.html
最近更新
教材專著