深度學(xué)習(xí)及其在視頻目標(biāo)跟蹤中的應(yīng)用研究
發(fā)布時(shí)間:2021-01-06 21:13
近些年,深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域取得的突破,使其研究日益受到人們的關(guān)注。目前,深度學(xué)習(xí)中最重要的基礎(chǔ)模型結(jié)構(gòu)——卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際應(yīng)用當(dāng)中還存在著泛化能力差、計(jì)算復(fù)雜度高等問題。本文立足于深度學(xué)習(xí)算法及其在目標(biāo)跟蹤中的應(yīng)用研究,主要工作如下:(1)基于國內(nèi)外關(guān)于深度學(xué)習(xí)算法及其在目標(biāo)跟蹤上的研究發(fā)展,對卷積神經(jīng)網(wǎng)絡(luò)模型和目標(biāo)跟蹤技術(shù)現(xiàn)存的問題進(jìn)行了分析。(2)研究了深度學(xué)習(xí)網(wǎng)絡(luò)中的池化層設(shè)計(jì)問題。池化層是深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的一個(gè)基礎(chǔ)部分,各種池化算法中,隨機(jī)池化具有較強(qiáng)的抗過擬合能力,隨著各種提升卷積神經(jīng)網(wǎng)絡(luò)性能的具有負(fù)值響應(yīng)激活函數(shù)的出現(xiàn),傳統(tǒng)的隨機(jī)池化方法已無法適用。針對隨機(jī)池化無法適用于負(fù)值響應(yīng)激活函數(shù)的問題,我們提出一種通用隨機(jī)池化方法——域偏移最小值法。該方法對于ReLU,雖然不嚴(yán)格等效于原始方法,但是能保持性能不變甚至略有改善。實(shí)驗(yàn)表明:所提出的隨機(jī)池化方法能很好地適用于具有負(fù)值響應(yīng)激活函數(shù),便于設(shè)計(jì)相應(yīng)的深度神經(jīng)網(wǎng)絡(luò)。(3)研究了隨機(jī)池化在目標(biāo)跟蹤卷積神經(jīng)網(wǎng)絡(luò)中的設(shè)計(jì)問題。卷積神經(jīng)網(wǎng)絡(luò)是目標(biāo)跟蹤任務(wù)中特征提取的重要部分,實(shí)際目標(biāo)跟蹤任務(wù)中要求卷積神經(jīng)網(wǎng)絡(luò)在保證較高準(zhǔn)確...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:90 頁
【學(xué)位級別】:碩士
【部分圖文】:
早期LeNet-5結(jié)構(gòu)
分類網(wǎng)絡(luò)只是四層的全連接網(wǎng)絡(luò),對目標(biāo)的特征刻畫能力還是不夠優(yōu)秀,使得總體效果還是低于傳統(tǒng)以人工特征為基礎(chǔ)的目標(biāo)跟蹤算法,如 Struck[23]等;在線模型更新限定閾值的選取較為敏感,當(dāng)選取過小,目標(biāo)表觀發(fā)生變化時(shí)很容易造成模型得不到及時(shí)更新,當(dāng)選取過大,很容易造成遮擋對象或背景被誤認(rèn)為是跟蹤對象,從而導(dǎo)致目標(biāo)漂移。2.3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤方法SO-DLT[37](Structured Output Deep Learning Tracker)是 2015 年王乃巖在 DLT 算法的基礎(chǔ)上改進(jìn)得到,該算法繼承了 DLT 利用非跟蹤數(shù)據(jù)離線預(yù)訓(xùn)練加上在線跟蹤微調(diào)的策略以解決跟蹤過程中訓(xùn)練數(shù)據(jù)不充足的問題,同時(shí),也對 DLT 存在的一些問題進(jìn)行了很大的改進(jìn)。首先在離線預(yù)訓(xùn)練階段,SO-DLT 使用卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)區(qū)分物體和非物體的通用物體特征,即從實(shí)例中學(xué)習(xí)物體的概念。該算法針對目標(biāo)跟蹤問題設(shè)計(jì)了具有針對性的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.10 所示,
南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 深度學(xué)習(xí)的相關(guān)技術(shù)與應(yīng)用SO-DLT 離線預(yù)訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)到的是通用物體特征,因?yàn)?ImageNet中的圖像與實(shí)際跟蹤的圖像不同,所以在線跟蹤對于 SO-DLT 跟蹤器的性能是必不可少的。SO-DLT 在線跟蹤過程如圖 2.11 所示,當(dāng)處理第 t 幀時(shí),以前一幀(第 t-1 幀)預(yù)測位置為中心,開始以最小的尺度不斷遞增式地裁剪輸入到網(wǎng)絡(luò)中,當(dāng)網(wǎng)絡(luò)輸出的概率圖總和高于設(shè)定的閾值時(shí),停止裁剪,并以當(dāng)前裁剪的尺度作為最佳的搜索區(qū)域大小。當(dāng)選定好第 t 幀的最佳搜索區(qū)域后,在該區(qū)域輸出的概率圖上利用一定的策略確定最終目標(biāo)框的位置和尺度大小。在模型在線更新方面,一般如果跟蹤器模型不經(jīng)常更新,可能無法很好地適應(yīng)目標(biāo)物體發(fā)生的表觀變化;如果過于經(jīng)常更新,不準(zhǔn)確的結(jié)果可能會損害跟蹤器的性能。所以 SO-DLT 在模型在線更新方面,如圖 2.11,使用兩個(gè) CNN——CNNS與 CNNL,兩者最后的結(jié)果會進(jìn)行結(jié)合,取置信度最高的作為輸出結(jié)果,使用兩種 CNN 的做法能在適應(yīng)目標(biāo)表觀變化和漂移間達(dá)到均衡。
本文編號:2961267
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:90 頁
【學(xué)位級別】:碩士
【部分圖文】:
早期LeNet-5結(jié)構(gòu)
分類網(wǎng)絡(luò)只是四層的全連接網(wǎng)絡(luò),對目標(biāo)的特征刻畫能力還是不夠優(yōu)秀,使得總體效果還是低于傳統(tǒng)以人工特征為基礎(chǔ)的目標(biāo)跟蹤算法,如 Struck[23]等;在線模型更新限定閾值的選取較為敏感,當(dāng)選取過小,目標(biāo)表觀發(fā)生變化時(shí)很容易造成模型得不到及時(shí)更新,當(dāng)選取過大,很容易造成遮擋對象或背景被誤認(rèn)為是跟蹤對象,從而導(dǎo)致目標(biāo)漂移。2.3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)跟蹤方法SO-DLT[37](Structured Output Deep Learning Tracker)是 2015 年王乃巖在 DLT 算法的基礎(chǔ)上改進(jìn)得到,該算法繼承了 DLT 利用非跟蹤數(shù)據(jù)離線預(yù)訓(xùn)練加上在線跟蹤微調(diào)的策略以解決跟蹤過程中訓(xùn)練數(shù)據(jù)不充足的問題,同時(shí),也對 DLT 存在的一些問題進(jìn)行了很大的改進(jìn)。首先在離線預(yù)訓(xùn)練階段,SO-DLT 使用卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)區(qū)分物體和非物體的通用物體特征,即從實(shí)例中學(xué)習(xí)物體的概念。該算法針對目標(biāo)跟蹤問題設(shè)計(jì)了具有針對性的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖 2.10 所示,
南京郵電大學(xué)碩士研究生學(xué)位論文 第二章 深度學(xué)習(xí)的相關(guān)技術(shù)與應(yīng)用SO-DLT 離線預(yù)訓(xùn)練得到的卷積神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)到的是通用物體特征,因?yàn)?ImageNet中的圖像與實(shí)際跟蹤的圖像不同,所以在線跟蹤對于 SO-DLT 跟蹤器的性能是必不可少的。SO-DLT 在線跟蹤過程如圖 2.11 所示,當(dāng)處理第 t 幀時(shí),以前一幀(第 t-1 幀)預(yù)測位置為中心,開始以最小的尺度不斷遞增式地裁剪輸入到網(wǎng)絡(luò)中,當(dāng)網(wǎng)絡(luò)輸出的概率圖總和高于設(shè)定的閾值時(shí),停止裁剪,并以當(dāng)前裁剪的尺度作為最佳的搜索區(qū)域大小。當(dāng)選定好第 t 幀的最佳搜索區(qū)域后,在該區(qū)域輸出的概率圖上利用一定的策略確定最終目標(biāo)框的位置和尺度大小。在模型在線更新方面,一般如果跟蹤器模型不經(jīng)常更新,可能無法很好地適應(yīng)目標(biāo)物體發(fā)生的表觀變化;如果過于經(jīng)常更新,不準(zhǔn)確的結(jié)果可能會損害跟蹤器的性能。所以 SO-DLT 在模型在線更新方面,如圖 2.11,使用兩個(gè) CNN——CNNS與 CNNL,兩者最后的結(jié)果會進(jìn)行結(jié)合,取置信度最高的作為輸出結(jié)果,使用兩種 CNN 的做法能在適應(yīng)目標(biāo)表觀變化和漂移間達(dá)到均衡。
本文編號:2961267
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2961267.html
最近更新
教材專著