基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與跟蹤技術(shù)研究及應(yīng)用
發(fā)布時(shí)間:2021-12-12 07:01
目標(biāo)檢測(cè)與跟蹤技術(shù)是計(jì)算機(jī)視覺(jué)領(lǐng)域的兩個(gè)主要研究方向并且具有廣泛應(yīng)用。但是,目標(biāo)尺寸較小、目標(biāo)被遮擋嚴(yán)重影響目標(biāo)檢測(cè)與跟蹤算法的性能。本文針對(duì)小目標(biāo)和目標(biāo)被遮擋造成的檢測(cè)與跟蹤效果差的問(wèn)題,提出基于YOLO改進(jìn)的多粒度特征融合的目標(biāo)檢測(cè)算法和基于LSTM的目標(biāo)跟蹤方法,實(shí)現(xiàn)了小目標(biāo)和遮擋情況下檢測(cè)與跟蹤的性能提升。本論文主要研究?jī)?nèi)容如下:(1)研究分析了國(guó)內(nèi)外目標(biāo)檢測(cè)與目標(biāo)跟蹤的現(xiàn)狀以及目標(biāo)檢測(cè)和跟蹤過(guò)程中目標(biāo)過(guò)小和目標(biāo)被遮擋的具體問(wèn)題。介紹了深度學(xué)習(xí)的基礎(chǔ)理論與基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與跟蹤算法,為后文算法改進(jìn)提供了理論支撐。(2)提出基于YOLO改進(jìn)的多粒度特征融合的目標(biāo)檢測(cè)算法。通過(guò)對(duì)YOLO的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了多粒度特征融合的改進(jìn),使得模型在最終檢測(cè)時(shí)提取的特征向量考慮更多底層的特征,解決因被檢測(cè)目標(biāo)過(guò)小,經(jīng)過(guò)多層卷積和下采樣操作而造成的特征丟失的問(wèn)題。(3)提出基于LSTM的目標(biāo)跟蹤算法。針對(duì)目標(biāo)跟蹤中的遮擋、跟蹤速度慢的問(wèn)題,本文在基于YOLO改進(jìn)的多粒度特征融合的目標(biāo)檢測(cè)算法基礎(chǔ)上引入k鄰域搜索的感興趣區(qū)域確定模塊,快速確定目標(biāo)特征提取的感興趣區(qū)域,利用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)時(shí)序空...
【文章來(lái)源】:湖北工業(yè)大學(xué)湖北省
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TLD目標(biāo)跟蹤算法框圖
湖北工業(yè)大學(xué)碩士學(xué)位論文11第2章基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與跟蹤本章主要闡述本文所涉及到的相關(guān)理論基礎(chǔ),主要分為:深度學(xué)習(xí)基礎(chǔ)理論、基于深度學(xué)習(xí)的目標(biāo)檢測(cè)和目標(biāo)跟蹤技術(shù)。通過(guò)對(duì)相關(guān)理論的闡述,為后文中目標(biāo)檢測(cè)網(wǎng)絡(luò)和目標(biāo)跟蹤框架的結(jié)構(gòu)設(shè)計(jì)與改進(jìn)提供理論指導(dǎo),也是為后文的課題研究做鋪墊。2.1深度學(xué)習(xí)近年來(lái),伴隨著GPU計(jì)算能力的不斷提升,深度學(xué)習(xí)也得到蓬勃發(fā)展。深度學(xué)習(xí)突破以前經(jīng)典神經(jīng)網(wǎng)絡(luò)對(duì)于網(wǎng)絡(luò)層數(shù)的限制,這也是深度學(xué)習(xí)較傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的最大優(yōu)勢(shì)。深度學(xué)習(xí)不再需要單獨(dú)的對(duì)圖像特征進(jìn)行選擇與變換,而是將原始圖像數(shù)據(jù)直接輸入到深度學(xué)習(xí)網(wǎng)絡(luò)模型中,經(jīng)過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)模型學(xué)習(xí)出有效的特征表達(dá),以實(shí)現(xiàn)具體的任務(wù)。目前,深度學(xué)習(xí)的方法已經(jīng)廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)等多個(gè)研究領(lǐng)域并表現(xiàn)出傳統(tǒng)方法無(wú)與倫比的優(yōu)勢(shì),本節(jié)將對(duì)深度學(xué)習(xí)相關(guān)理論以及卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行闡述。2.1.1人工神經(jīng)網(wǎng)絡(luò)與反向傳播算法(1)人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)是深度學(xué)習(xí)的基礎(chǔ),它旨在通過(guò)數(shù)學(xué)模型模擬人腦神經(jīng)元之間的信息處理和傳遞。神經(jīng)元是神經(jīng)網(wǎng)絡(luò)的最基本單元,其神經(jīng)元的結(jié)構(gòu)如下圖2.1所示:圖2.1神經(jīng)元原理示意圖由圖2.1可知,每一個(gè)神經(jīng)元接受一組n維信號(hào)數(shù)據(jù)的輸入
湖北工業(yè)大學(xué)碩士學(xué)位論文12n,,,,XXXXX321和一個(gè)偏置b,經(jīng)過(guò)神經(jīng)元的處理,得到一個(gè)輸出值Y。神經(jīng)元的處理過(guò)程對(duì)應(yīng)著一個(gè)函數(shù)f,其表達(dá)式為式(2-1):112211221,0,nnnnXWXWXWYXWXWXW(2-1)如式(2-1),當(dāng)信息經(jīng)過(guò)權(quán)值連接和偏置后超過(guò)閾值則被激活,通過(guò)這種方式有選擇的將信息進(jìn)行傳遞。將如圖2.1的多個(gè)神經(jīng)元如圖2.2按層連接在一起就組成了人工神經(jīng)網(wǎng)絡(luò),一般當(dāng)神經(jīng)網(wǎng)絡(luò)的層數(shù)大于2層時(shí)稱之為深度神經(jīng)網(wǎng)絡(luò)。圖2.2神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖圖2.2就是經(jīng)典的全連接神經(jīng)網(wǎng)絡(luò),每個(gè)神經(jīng)元都通過(guò)一個(gè)權(quán)重參數(shù)iW相連接,每一個(gè)輸入iX經(jīng)過(guò)權(quán)重向后一層傳遞,同時(shí),整個(gè)網(wǎng)絡(luò)參數(shù)包括偏置b,最終通過(guò)輸出層將輸入通過(guò)神經(jīng)網(wǎng)絡(luò)進(jìn)行映射。實(shí)質(zhì)上,圖2.2人工神經(jīng)網(wǎng)絡(luò)本質(zhì)上是輸入到輸出的矩陣線性運(yùn)算,隨著神經(jīng)網(wǎng)絡(luò)層的加深,只是將這樣線性運(yùn)算進(jìn)行疊加,整個(gè)深度神經(jīng)網(wǎng)絡(luò)依然是線性的。由于深度神經(jīng)網(wǎng)絡(luò)是這種線性運(yùn)算,所以網(wǎng)絡(luò)深度的加深對(duì)提取結(jié)構(gòu)化、層次化特征是不起作用的,為了增強(qiáng)深度神經(jīng)網(wǎng)絡(luò)的豐富的非線性表達(dá),引入非線性激活函數(shù)。非線性激活函數(shù)本質(zhì)上是對(duì)公式(2-1)的改進(jìn),Sigmoid激活函數(shù)是一個(gè)比較經(jīng)典的激活函數(shù),Sigmoid激活函數(shù)表達(dá)式如式(2-2):11xfxe(2-2)對(duì)于輸入x,神經(jīng)元通過(guò)式(2-2)進(jìn)行非線性映射。Sigmoid激活函數(shù)不僅具有很好的非線性映射的作用,它還具有很好的數(shù)學(xué)性質(zhì),易于求導(dǎo),有利于反向傳播的實(shí)現(xiàn)。Sigmoid激活函數(shù)的函數(shù)圖像如圖2.3所示,此外還有其他優(yōu)秀的激活函數(shù)如Relu、LeakyRelu、ELU等。他們適用于不同的應(yīng)用場(chǎng)景,目的是增加模型的非線性表達(dá)的同時(shí)使得網(wǎng)絡(luò)模型的訓(xùn)練更快速。
【參考文獻(xiàn)】:
期刊論文
[1]目標(biāo)跟蹤算法綜述[J]. 孟琭,楊旭. 自動(dòng)化學(xué)報(bào). 2019(07)
[2]粒子濾波理論在單目標(biāo)跟蹤中的應(yīng)用綜述[J]. 劉暢,楊鎖昌,汪連棟. 飛航導(dǎo)彈. 2017(10)
[3]基于深度學(xué)習(xí)的目標(biāo)跟蹤方法研究現(xiàn)狀與展望[J]. 羅海波,許凌云,惠斌,常錚. 紅外與激光工程. 2017(05)
[4]SIFT特征的目標(biāo)跟蹤算法研究[J]. 范永紅,李娜,李華光,張建國(guó). 宏觀經(jīng)濟(jì)管理. 2017(S1)
[5]強(qiáng)跟蹤稀疏網(wǎng)格濾波在水下目標(biāo)跟蹤中的應(yīng)用[J]. 王越,徐正生,于飛,陳斐楠. 計(jì)算機(jī)工程與應(yīng)用. 2017(22)
[6]基于變換觀測(cè)模型的粒子濾波跟蹤算法[J]. 李春鑫. 光電技術(shù)應(yīng)用. 2011(03)
[7]粒子濾波算法在目標(biāo)跟蹤中的應(yīng)用[J]. 饒文碧,雷育華,王君. 武漢理工大學(xué)學(xué)報(bào). 2009(03)
[8]基于均值漂移與卡爾曼濾波的目標(biāo)跟蹤算法[J]. 常發(fā)亮,劉雪,王華杰. 計(jì)算機(jī)工程與應(yīng)用. 2007(12)
[9]一種改進(jìn)的基于顏色直方圖的實(shí)時(shí)目標(biāo)跟蹤算法[J]. 付永會(huì),張風(fēng)超,張憲民. 數(shù)據(jù)采集與處理. 2001(03)
博士論文
[1]復(fù)雜場(chǎng)景下單目標(biāo)的視覺(jué)跟蹤算法研究[D]. 馮平.華中科技大學(xué) 2019
碩士論文
[1]基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤算法研究[D]. 陳會(huì)志.南京郵電大學(xué) 2019
[2]基于深度學(xué)習(xí)的目標(biāo)跟蹤算法研究[D]. 梁浩(Hawkeye Liang).中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所) 2019
[3]基于深度學(xué)習(xí)的實(shí)時(shí)目標(biāo)跟蹤應(yīng)用研究[D]. 趙春梅.中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院光電技術(shù)研究所) 2019
[4]基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與跟蹤方法研究[D]. 鄭亞壘.鄭州大學(xué) 2019
[5]基于CMAC的無(wú)人船模糊PID航跡控制技術(shù)研究[D]. 李超.湖北工業(yè)大學(xué) 2019
[6]基于孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤算法研究[D]. 張爍.華中科技大學(xué) 2019
[7]無(wú)人船海上目標(biāo)單目視覺(jué)檢測(cè)與跟蹤算法研究[D]. 時(shí)俊楠.自然資源部第一海洋研究所 2019
[8]基于深度學(xué)習(xí)的復(fù)雜場(chǎng)景下單目標(biāo)跟蹤算法的研究[D]. 郭雅麗.長(zhǎng)安大學(xué) 2019
[9]基于孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤研究與應(yīng)用[D]. 馬欣.中國(guó)礦業(yè)大學(xué) 2019
[10]基于深度學(xué)習(xí)的目標(biāo)跟蹤算法研究[D]. 周揚(yáng).揚(yáng)州大學(xué) 2019
本文編號(hào):3536220
【文章來(lái)源】:湖北工業(yè)大學(xué)湖北省
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TLD目標(biāo)跟蹤算法框圖
湖北工業(yè)大學(xué)碩士學(xué)位論文11第2章基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與跟蹤本章主要闡述本文所涉及到的相關(guān)理論基礎(chǔ),主要分為:深度學(xué)習(xí)基礎(chǔ)理論、基于深度學(xué)習(xí)的目標(biāo)檢測(cè)和目標(biāo)跟蹤技術(shù)。通過(guò)對(duì)相關(guān)理論的闡述,為后文中目標(biāo)檢測(cè)網(wǎng)絡(luò)和目標(biāo)跟蹤框架的結(jié)構(gòu)設(shè)計(jì)與改進(jìn)提供理論指導(dǎo),也是為后文的課題研究做鋪墊。2.1深度學(xué)習(xí)近年來(lái),伴隨著GPU計(jì)算能力的不斷提升,深度學(xué)習(xí)也得到蓬勃發(fā)展。深度學(xué)習(xí)突破以前經(jīng)典神經(jīng)網(wǎng)絡(luò)對(duì)于網(wǎng)絡(luò)層數(shù)的限制,這也是深度學(xué)習(xí)較傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的最大優(yōu)勢(shì)。深度學(xué)習(xí)不再需要單獨(dú)的對(duì)圖像特征進(jìn)行選擇與變換,而是將原始圖像數(shù)據(jù)直接輸入到深度學(xué)習(xí)網(wǎng)絡(luò)模型中,經(jīng)過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)模型學(xué)習(xí)出有效的特征表達(dá),以實(shí)現(xiàn)具體的任務(wù)。目前,深度學(xué)習(xí)的方法已經(jīng)廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)等多個(gè)研究領(lǐng)域并表現(xiàn)出傳統(tǒng)方法無(wú)與倫比的優(yōu)勢(shì),本節(jié)將對(duì)深度學(xué)習(xí)相關(guān)理論以及卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行闡述。2.1.1人工神經(jīng)網(wǎng)絡(luò)與反向傳播算法(1)人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)是深度學(xué)習(xí)的基礎(chǔ),它旨在通過(guò)數(shù)學(xué)模型模擬人腦神經(jīng)元之間的信息處理和傳遞。神經(jīng)元是神經(jīng)網(wǎng)絡(luò)的最基本單元,其神經(jīng)元的結(jié)構(gòu)如下圖2.1所示:圖2.1神經(jīng)元原理示意圖由圖2.1可知,每一個(gè)神經(jīng)元接受一組n維信號(hào)數(shù)據(jù)的輸入
湖北工業(yè)大學(xué)碩士學(xué)位論文12n,,,,XXXXX321和一個(gè)偏置b,經(jīng)過(guò)神經(jīng)元的處理,得到一個(gè)輸出值Y。神經(jīng)元的處理過(guò)程對(duì)應(yīng)著一個(gè)函數(shù)f,其表達(dá)式為式(2-1):112211221,0,nnnnXWXWXWYXWXWXW(2-1)如式(2-1),當(dāng)信息經(jīng)過(guò)權(quán)值連接和偏置后超過(guò)閾值則被激活,通過(guò)這種方式有選擇的將信息進(jìn)行傳遞。將如圖2.1的多個(gè)神經(jīng)元如圖2.2按層連接在一起就組成了人工神經(jīng)網(wǎng)絡(luò),一般當(dāng)神經(jīng)網(wǎng)絡(luò)的層數(shù)大于2層時(shí)稱之為深度神經(jīng)網(wǎng)絡(luò)。圖2.2神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖圖2.2就是經(jīng)典的全連接神經(jīng)網(wǎng)絡(luò),每個(gè)神經(jīng)元都通過(guò)一個(gè)權(quán)重參數(shù)iW相連接,每一個(gè)輸入iX經(jīng)過(guò)權(quán)重向后一層傳遞,同時(shí),整個(gè)網(wǎng)絡(luò)參數(shù)包括偏置b,最終通過(guò)輸出層將輸入通過(guò)神經(jīng)網(wǎng)絡(luò)進(jìn)行映射。實(shí)質(zhì)上,圖2.2人工神經(jīng)網(wǎng)絡(luò)本質(zhì)上是輸入到輸出的矩陣線性運(yùn)算,隨著神經(jīng)網(wǎng)絡(luò)層的加深,只是將這樣線性運(yùn)算進(jìn)行疊加,整個(gè)深度神經(jīng)網(wǎng)絡(luò)依然是線性的。由于深度神經(jīng)網(wǎng)絡(luò)是這種線性運(yùn)算,所以網(wǎng)絡(luò)深度的加深對(duì)提取結(jié)構(gòu)化、層次化特征是不起作用的,為了增強(qiáng)深度神經(jīng)網(wǎng)絡(luò)的豐富的非線性表達(dá),引入非線性激活函數(shù)。非線性激活函數(shù)本質(zhì)上是對(duì)公式(2-1)的改進(jìn),Sigmoid激活函數(shù)是一個(gè)比較經(jīng)典的激活函數(shù),Sigmoid激活函數(shù)表達(dá)式如式(2-2):11xfxe(2-2)對(duì)于輸入x,神經(jīng)元通過(guò)式(2-2)進(jìn)行非線性映射。Sigmoid激活函數(shù)不僅具有很好的非線性映射的作用,它還具有很好的數(shù)學(xué)性質(zhì),易于求導(dǎo),有利于反向傳播的實(shí)現(xiàn)。Sigmoid激活函數(shù)的函數(shù)圖像如圖2.3所示,此外還有其他優(yōu)秀的激活函數(shù)如Relu、LeakyRelu、ELU等。他們適用于不同的應(yīng)用場(chǎng)景,目的是增加模型的非線性表達(dá)的同時(shí)使得網(wǎng)絡(luò)模型的訓(xùn)練更快速。
【參考文獻(xiàn)】:
期刊論文
[1]目標(biāo)跟蹤算法綜述[J]. 孟琭,楊旭. 自動(dòng)化學(xué)報(bào). 2019(07)
[2]粒子濾波理論在單目標(biāo)跟蹤中的應(yīng)用綜述[J]. 劉暢,楊鎖昌,汪連棟. 飛航導(dǎo)彈. 2017(10)
[3]基于深度學(xué)習(xí)的目標(biāo)跟蹤方法研究現(xiàn)狀與展望[J]. 羅海波,許凌云,惠斌,常錚. 紅外與激光工程. 2017(05)
[4]SIFT特征的目標(biāo)跟蹤算法研究[J]. 范永紅,李娜,李華光,張建國(guó). 宏觀經(jīng)濟(jì)管理. 2017(S1)
[5]強(qiáng)跟蹤稀疏網(wǎng)格濾波在水下目標(biāo)跟蹤中的應(yīng)用[J]. 王越,徐正生,于飛,陳斐楠. 計(jì)算機(jī)工程與應(yīng)用. 2017(22)
[6]基于變換觀測(cè)模型的粒子濾波跟蹤算法[J]. 李春鑫. 光電技術(shù)應(yīng)用. 2011(03)
[7]粒子濾波算法在目標(biāo)跟蹤中的應(yīng)用[J]. 饒文碧,雷育華,王君. 武漢理工大學(xué)學(xué)報(bào). 2009(03)
[8]基于均值漂移與卡爾曼濾波的目標(biāo)跟蹤算法[J]. 常發(fā)亮,劉雪,王華杰. 計(jì)算機(jī)工程與應(yīng)用. 2007(12)
[9]一種改進(jìn)的基于顏色直方圖的實(shí)時(shí)目標(biāo)跟蹤算法[J]. 付永會(huì),張風(fēng)超,張憲民. 數(shù)據(jù)采集與處理. 2001(03)
博士論文
[1]復(fù)雜場(chǎng)景下單目標(biāo)的視覺(jué)跟蹤算法研究[D]. 馮平.華中科技大學(xué) 2019
碩士論文
[1]基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤算法研究[D]. 陳會(huì)志.南京郵電大學(xué) 2019
[2]基于深度學(xué)習(xí)的目標(biāo)跟蹤算法研究[D]. 梁浩(Hawkeye Liang).中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所) 2019
[3]基于深度學(xué)習(xí)的實(shí)時(shí)目標(biāo)跟蹤應(yīng)用研究[D]. 趙春梅.中國(guó)科學(xué)院大學(xué)(中國(guó)科學(xué)院光電技術(shù)研究所) 2019
[4]基于深度學(xué)習(xí)的目標(biāo)檢測(cè)與跟蹤方法研究[D]. 鄭亞壘.鄭州大學(xué) 2019
[5]基于CMAC的無(wú)人船模糊PID航跡控制技術(shù)研究[D]. 李超.湖北工業(yè)大學(xué) 2019
[6]基于孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤算法研究[D]. 張爍.華中科技大學(xué) 2019
[7]無(wú)人船海上目標(biāo)單目視覺(jué)檢測(cè)與跟蹤算法研究[D]. 時(shí)俊楠.自然資源部第一海洋研究所 2019
[8]基于深度學(xué)習(xí)的復(fù)雜場(chǎng)景下單目標(biāo)跟蹤算法的研究[D]. 郭雅麗.長(zhǎng)安大學(xué) 2019
[9]基于孿生神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤研究與應(yīng)用[D]. 馬欣.中國(guó)礦業(yè)大學(xué) 2019
[10]基于深度學(xué)習(xí)的目標(biāo)跟蹤算法研究[D]. 周揚(yáng).揚(yáng)州大學(xué) 2019
本文編號(hào):3536220
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3536220.html
最近更新
教材專著