基于紅外線成像視頻的目標檢測研究
發(fā)布時間:2020-08-06 12:05
【摘要】:目標檢測是計算機視覺領(lǐng)域的一項具有挑戰(zhàn)性的任務(wù)。不同于傳統(tǒng)的RGB三通道視頻拍攝設(shè)備,熱紅外(Thermal Infrared,TIR)像攝像儀具有能夠在完全黑暗的環(huán)境中運行和對光照和陰影變化不敏感的優(yōu)勢。它能提供嘈雜的低分辨率圖像,主要用于捕捉相對于較冷背景的目標。紅外視頻成像在軍事和安全等領(lǐng)域的需求潛力巨大。相對于傳統(tǒng)RGB三通道視頻的研究,目前對紅外視頻目標檢測的研究還相對較少,相關(guān)技術(shù)還亟待提高。論文的研究目標是針對根據(jù)熱紅外視頻具有的噪聲復(fù)雜、畫質(zhì)模糊、通道單一、圖像信息少的特點,利用深度神經(jīng)網(wǎng)絡(luò)技術(shù),提出了基于矯正光流算法紅外視頻目標檢測模型,以及利用超分辨率模型來加強對小目標檢測。本文的創(chuàng)新工作概括如下:1.針對紅外視頻光流噪聲大和歸一化時出現(xiàn)零點漂移的問題,在計算光流時,本文提出了非線性的矯正光流算法,使光流在作進一步歸一化時,所有的靜止目標可以保持相同的光流值,并且提出了高效的矯正閾值,使光流在矯正后能有效保持目標運動信息的區(qū)分度。2.對基于圖像的單階段目標檢測系統(tǒng)進行了改進,通過在輸入中疊加包含目標的運動信息的矯正光流圖像和包含有外觀信息的原始視頻幀圖像,提升了現(xiàn)有主要單階段檢測系統(tǒng)的性能,特別是同時提高了對外觀信息缺乏的運動目標的檢測性能。與傳統(tǒng)運動目標檢測模型不同,改進后的檢測框架,還可以對靜止目標進行有效地檢測,克服了如幀間差分法等運動目標檢測方法的不足,實現(xiàn)了動靜目標的同時檢測。3.針對紅外視頻圖像包含外觀信息少的特點,提出了利用基于深度神經(jīng)網(wǎng)絡(luò)的超分辨率模型,對視頻圖像信息進行了擴充和增強。實驗結(jié)果表明,超分辨率化后的視頻更有利于提高小目標的檢測。4.針對原始VOT-TIR2016數(shù)據(jù)集的視頻幀中只標注了一個目標的不足,本文對該數(shù)據(jù)集的標注進行了有效的擴充,使之能夠適用于多目標檢測,為進一步開展基于紅外線視頻的目標檢測研究打下了良好的基礎(chǔ)。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.41;TN21
【圖文】:
第一章 緒論第一章 緒 論1.1 課題研究背景和研究意義1.1.1 研究背景圖像或視頻目標檢測一直是計算機視覺領(lǐng)域比較棘手的難題。深度學(xué)習(xí)的發(fā)展,為通用目標檢測實現(xiàn)提供一個可靠的解決途徑。通用目標檢測主要涉及以下方面:(1)給定一幅圖像,確定該圖像中是否存在用戶需求的目標。(2)確定目標所屬的類別或標簽。(3)確定目標所處圖像中的具體位置,即目標的邊界框(Bounding Box)的4 個頂點坐標。如圖 1-1 所示。
目標檢測所采用的熱像儀器具有諸多優(yōu)勢:(1)能夠在完全黑暗的環(huán)境中運(2)捕捉的畫面對光照和陰影變化不敏感;(3)像醫(yī)院所使用的 B 超類似捉對象的輪廓信息,減少了隱私侵入。從使用上看,熱像儀能提供嘈雜的低率圖像,主要用于捕捉相對于較冷背景的點狀或較小的目標。早期因價格因通常僅限于軍事目的。當(dāng)前熱像儀的價格趨于平民化,因此得到了廣泛應(yīng)用。怎樣提高紅外成像圖像質(zhì)量,擴展檢測動態(tài)目標種類,成為當(dāng)前急需解決的。雖然市場的需求潛力巨大,但目前涉及到熱紅外視頻的目標檢測的研究較少。于傳統(tǒng)的 RGB 三通道圖像,熱紅外圖像相當(dāng)于噪聲復(fù)雜、畫質(zhì)模糊的灰度單圖像,所采集的有用圖像信息較少。影響熱紅外視頻成像的主要因素是動力化和溫度變化,而不是傳統(tǒng) RGB 三通道圖像的照明變化和物體顏色變化。這溫度變化是指目標的熱特征變化。目標運動、雨水、灰塵、高濕度都會造成模糊[5]。部分成像效果和目標檢測如圖 1-2 所示。圖 1-2(a)為紅外線成像視人行走的序列圖像,圖 1-2(b)為紅外線成像視頻中發(fā)熱汽車移動的序列圖
一些傳統(tǒng)的方法將背景模型設(shè)置為視頻中前 N 幀的均值或中值,與均值模型或中值濾波模型相較,背景模型必須隨著視頻流方向自適應(yīng)。高斯混合將紅外圖像中的每個像素構(gòu)建為高斯混合,基于每個高斯方差,可以將圖像特定像素分為背景和前景,該算法對于閃電變化、重復(fù)運動,雜亂運動和緩動具有魯棒性。中值背景模型使用目標的長寬和陰影大小的比例來過濾掉非的區(qū)域,使用圖像中背景的梯度信息剔除由于視差和配準誤差導(dǎo)致的錯誤檢用張量投票算法生成不同尺度的內(nèi)在運動結(jié)構(gòu)特征。.2.2 圖像超分辨率研究現(xiàn)狀圖像超分辨(Super Resolution,SR)也屬于計算機視覺重要的研究領(lǐng)域,像由較低的分辨率變換為較高的分辨率。它不是單純的上采樣過程,還要保像的細節(jié)和紋理清晰。單圖像超分辨率(Single Image Super-Resolution ,SIS一個眾所周知的挑戰(zhàn),具體的低分辨率(Low Resolution,LR)輸入可以對應(yīng)同的高分辨率(High Resolution,HR)圖像空間[10];谏窠(jīng)網(wǎng)絡(luò)的超分辨究具體發(fā)展歷程如圖 1-3 所示:
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.41;TN21
【圖文】:
第一章 緒論第一章 緒 論1.1 課題研究背景和研究意義1.1.1 研究背景圖像或視頻目標檢測一直是計算機視覺領(lǐng)域比較棘手的難題。深度學(xué)習(xí)的發(fā)展,為通用目標檢測實現(xiàn)提供一個可靠的解決途徑。通用目標檢測主要涉及以下方面:(1)給定一幅圖像,確定該圖像中是否存在用戶需求的目標。(2)確定目標所屬的類別或標簽。(3)確定目標所處圖像中的具體位置,即目標的邊界框(Bounding Box)的4 個頂點坐標。如圖 1-1 所示。
目標檢測所采用的熱像儀器具有諸多優(yōu)勢:(1)能夠在完全黑暗的環(huán)境中運(2)捕捉的畫面對光照和陰影變化不敏感;(3)像醫(yī)院所使用的 B 超類似捉對象的輪廓信息,減少了隱私侵入。從使用上看,熱像儀能提供嘈雜的低率圖像,主要用于捕捉相對于較冷背景的點狀或較小的目標。早期因價格因通常僅限于軍事目的。當(dāng)前熱像儀的價格趨于平民化,因此得到了廣泛應(yīng)用。怎樣提高紅外成像圖像質(zhì)量,擴展檢測動態(tài)目標種類,成為當(dāng)前急需解決的。雖然市場的需求潛力巨大,但目前涉及到熱紅外視頻的目標檢測的研究較少。于傳統(tǒng)的 RGB 三通道圖像,熱紅外圖像相當(dāng)于噪聲復(fù)雜、畫質(zhì)模糊的灰度單圖像,所采集的有用圖像信息較少。影響熱紅外視頻成像的主要因素是動力化和溫度變化,而不是傳統(tǒng) RGB 三通道圖像的照明變化和物體顏色變化。這溫度變化是指目標的熱特征變化。目標運動、雨水、灰塵、高濕度都會造成模糊[5]。部分成像效果和目標檢測如圖 1-2 所示。圖 1-2(a)為紅外線成像視人行走的序列圖像,圖 1-2(b)為紅外線成像視頻中發(fā)熱汽車移動的序列圖
一些傳統(tǒng)的方法將背景模型設(shè)置為視頻中前 N 幀的均值或中值,與均值模型或中值濾波模型相較,背景模型必須隨著視頻流方向自適應(yīng)。高斯混合將紅外圖像中的每個像素構(gòu)建為高斯混合,基于每個高斯方差,可以將圖像特定像素分為背景和前景,該算法對于閃電變化、重復(fù)運動,雜亂運動和緩動具有魯棒性。中值背景模型使用目標的長寬和陰影大小的比例來過濾掉非的區(qū)域,使用圖像中背景的梯度信息剔除由于視差和配準誤差導(dǎo)致的錯誤檢用張量投票算法生成不同尺度的內(nèi)在運動結(jié)構(gòu)特征。.2.2 圖像超分辨率研究現(xiàn)狀圖像超分辨(Super Resolution,SR)也屬于計算機視覺重要的研究領(lǐng)域,像由較低的分辨率變換為較高的分辨率。它不是單純的上采樣過程,還要保像的細節(jié)和紋理清晰。單圖像超分辨率(Single Image Super-Resolution ,SIS一個眾所周知的挑戰(zhàn),具體的低分辨率(Low Resolution,LR)輸入可以對應(yīng)同的高分辨率(High Resolution,HR)圖像空間[10];谏窠(jīng)網(wǎng)絡(luò)的超分辨究具體發(fā)展歷程如圖 1-3 所示:
【相似文獻】
相關(guān)期刊論文 前10條
1 柴樺;;基于深度卷積網(wǎng)絡(luò)的壓縮人臉超分辨率研究[J];信息與電腦(理論版);2019年18期
2 朱海;王國中;范濤;楊露;;基于深度超分辨率重建的監(jiān)控圖像人臉識別[J];電子測量技術(shù);2018年16期
3 付龍;呂曉琪;李婷;谷宇;;基于擴散的自適應(yīng)超分辨率重建[J];現(xiàn)代電子技術(shù);2017年10期
4 劉芳華;阮若林;王建峰;倪浩;;基于在線字典學(xué)習(xí)的人臉超分辨率重建[J];現(xiàn)代電子技術(shù);2017年13期
5 衛(wèi)小強;;基于仿生學(xué)多源圖像超分辨率重建的并行優(yōu)化研究[J];電腦編程技巧與維護;2017年13期
6 廖海斌;陳友斌;陳慶虎;;基于非局部相似字典學(xué)習(xí)的人臉超分辨率與識別[J];武漢大學(xué)學(xué)報(信息科學(xué)版);2016年10期
7 王宇輝;;圖像超分辨率重新建立技術(shù)綜述[J];科技創(chuàng)業(yè)月刊;2016年17期
8 賈志城;;視頻超分辨率重建及其刑偵應(yīng)用[J];中國有線電視;2015年08期
9 趙U
本文編號:2782373
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/2782373.html
最近更新
教材專著