視頻監(jiān)控中的前景目標(biāo)檢測算法研究
發(fā)布時間:2020-11-05 16:27
近年來,視頻監(jiān)控?zé)o論是在工業(yè)生產(chǎn)還是安防領(lǐng)域中都發(fā)揮著舉足輕重的作用,其主要特征是采用機(jī)器視覺的方法,通過對傳感器獲取到的視頻(或圖像序列)進(jìn)行自動計算與分析,實現(xiàn)對監(jiān)控場景中的目標(biāo)進(jìn)行檢測、跟蹤、定位和識別,并在此基礎(chǔ)上對目標(biāo)的行為做出分析和判斷,從而做到既能完成常規(guī)監(jiān)視,又可以在異常事件發(fā)生時及時做出反應(yīng)。前景目標(biāo)檢測屬于監(jiān)控系統(tǒng)的前端處理部分,是后續(xù)各種高級處理任務(wù)(如目標(biāo)跟蹤、目標(biāo)識別、視頻編碼、視頻分析等)的基礎(chǔ)。在過去的幾十年中,前景目標(biāo)檢測技術(shù)受到了國內(nèi)外學(xué)者的廣泛研究,大量算法的提出使得前景目標(biāo)檢測技術(shù)取得了可觀的進(jìn)步,并由實驗走向了具體應(yīng)用。但是由于實際場景中包含各種各樣的復(fù)雜因素,如光照變化、動態(tài)背景、相機(jī)抖動、陰影以及偽裝等干擾,設(shè)計一個實時性好,魯棒性強(qiáng)的前景目標(biāo)檢測算法仍然具有重大研究意義。本研究課題以監(jiān)控視頻作為研究對象,進(jìn)行前景目標(biāo)檢測方面的應(yīng)用算法相關(guān)研究,目的是為基于數(shù)字圖像處理的視頻監(jiān)控系統(tǒng)的實用化提供理論依據(jù)和實踐參考。本文主要的創(chuàng)新性研究工作及研究成果如下:1)提出多種新的紋理特征算子用于前景目標(biāo)檢測。顏色特征作為最常見的特征廣泛應(yīng)用于計算機(jī)視覺的各個領(lǐng)域,但是在面對包含光照變化、偽裝、陰影等干擾因素的監(jiān)控場景,顏色特征具有很大的局限性,因此很多經(jīng)典的紋理特征例如LBP、LTP、LDP等被提出并應(yīng)用于前景目標(biāo)檢測,這些紋理特征在面對光照變化、陰影等干擾表現(xiàn)出很好的魯棒性。但是監(jiān)控場景還可能包含很多其他干擾因素:噪聲、相機(jī)抖動、動態(tài)背景等等,而大多數(shù)紋理特征在面對這些干擾通常表現(xiàn)效果很差,因此本文在現(xiàn)有紋理特征的基礎(chǔ)上考慮從多個方面進(jìn)行改進(jìn),使其對監(jiān)控場景的各種干擾因素具有更好的魯棒性;與此同時,相比于只使用單一的顏色特征或者紋理特征用于前景目標(biāo)檢測,本文通過將顏色特征和紋理特征相結(jié)合,充分利用兩種特征優(yōu)劣互補(bǔ)進(jìn)行背景建模,實驗結(jié)果表明與同類算法相比,本文算法在實時性、精度等方面都取得了更好的結(jié)果。2)提出了一種多尺度全卷積網(wǎng)絡(luò)結(jié)構(gòu)用于前景目標(biāo)檢測。近年來,卷積神經(jīng)網(wǎng)絡(luò)在計算機(jī)視覺的各個領(lǐng)域取得了突破性進(jìn)展,因此有研究人員開始嘗試將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于前景目標(biāo)檢測領(lǐng)域,但是其主要思想都是基于圖像塊的預(yù)測方法,通過在各個像素周圍截取一小部分圖像塊來預(yù)測每個像素的輸出類別標(biāo)簽,而這種方式有很多缺點,比如速度慢,計算冗余,而且精度不高。全卷積網(wǎng)絡(luò)結(jié)構(gòu)的提出為這種像素級分類任務(wù)提供了一種端到端的預(yù)測方式,本文嘗試將全卷積網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)用到前景目標(biāo)檢測,實驗結(jié)果表明全卷積網(wǎng)絡(luò)結(jié)構(gòu)比基于圖像塊預(yù)測的方式在速度、精度上都有明顯提高。同時,借鑒近年來出現(xiàn)的一些新的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計思想,提出一種多尺度全卷積網(wǎng)絡(luò)結(jié)構(gòu)用于前景目標(biāo)檢測,實驗結(jié)果表明,本文算法在公共評測數(shù)據(jù)集上取得了較優(yōu)的結(jié)果,而且能滿足實時性要求。3)提出了一種將傳統(tǒng)前景目標(biāo)檢測算法與語義分割算法相結(jié)合的實時前景目標(biāo)檢測算法框架,F(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的前景目標(biāo)檢測算法對每個監(jiān)控場景都需要進(jìn)行模型訓(xùn)練,因此他們在實際監(jiān)控場景中應(yīng)用有限。本文提出一種將傳統(tǒng)前景目標(biāo)檢測算法與語義分割算法相結(jié)合的實時前景目標(biāo)檢測算法框架,該算法不需要對每個應(yīng)用場景都進(jìn)行模型訓(xùn)練,屬于無監(jiān)督型的前景目標(biāo)檢測算法。其核心思想是借助語義信息來提高前景目標(biāo)檢測算法的建模能力,實際監(jiān)控場景中,經(jīng)常會出現(xiàn)物體陰影、噪聲、動態(tài)背景等干擾因素,這些因素對傳統(tǒng)前景目標(biāo)檢測算法建模精度有很大干擾,使得最后的檢測結(jié)果中出現(xiàn)很多錯誤的前景目標(biāo),而語義分割對這些干擾因素有很好的魯棒性,因此可以借助語義分割與前景目標(biāo)檢測算法進(jìn)行交互,幫助前景檢測算法“剔除”這些干擾因素,從而得到更精確的前景檢測結(jié)果。實驗結(jié)果表明本文算法優(yōu)于目前幾乎所有的無監(jiān)督型前景目標(biāo)檢測算法,同時還能達(dá)到實時性要求。4)提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的前景目標(biāo)檢測結(jié)果融合策略。近年來學(xué)術(shù)界、工業(yè)界提出了各種前景目標(biāo)檢測算法,但是各種算法都有各自的優(yōu)勢、劣勢,很少有算法能同時處理監(jiān)控場景中出現(xiàn)的各種干擾因素。因此,有研究人員考慮將各種算法結(jié)果進(jìn)行融合,充分發(fā)揮不同算法的優(yōu)勢,出現(xiàn)了基于遺傳算法、多數(shù)投票等算法的前景檢測結(jié)果融合策略。本文提出一種全卷積編碼-解碼網(wǎng)絡(luò)結(jié)構(gòu)用于前景目標(biāo)檢測結(jié)果融合,將多種前景目標(biāo)檢測算法的結(jié)果輸入到網(wǎng)絡(luò)中,生成更精確的前景檢測結(jié)果。實驗結(jié)果表明本文提出的融合策略優(yōu)于其他融合策略。
【學(xué)位單位】:中國科學(xué)院大學(xué)(中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TN948.6
【部分圖文】:
第1章 緒論第1章 緒論1.1研究背景及意義近年來,隨著計算機(jī)、通信、傳感器以及多媒體等技術(shù)的快速發(fā)展,信息的獲取速度和獲取量成幾何級數(shù)遞增,可以說,人類正處于一個信息大爆炸的時代。計算機(jī)視覺的研究目的是利用計算機(jī)模擬人類的視覺系統(tǒng),使得計算機(jī)具有視覺信息攝入能力、信息分析能力以及決策制定能力,從而在某些應(yīng)用場景中替代人工操作,節(jié)省人工成本。因此,近年來計算機(jī)視覺相關(guān)的研究得到極大的重視和快速的發(fā)展,并且在視頻監(jiān)控、工業(yè)生產(chǎn)、醫(yī)療診斷、自動駕駛、智慧城市以及智能支付等眾多領(lǐng)域得到廣泛應(yīng)用,取得了巨大的經(jīng)濟(jì)效益與社會效益[1–4]。
圖1.2智能視頻監(jiān)控系統(tǒng)流程[6]分析和理解,并根據(jù)預(yù)設(shè)規(guī)則輸出分析結(jié)果。概括起來,智能視頻監(jiān)控系統(tǒng)的主要目的就是要讓計算機(jī)回答當(dāng)前場景興趣目標(biāo)在哪里,是什么,在干什么等。從智能視頻監(jiān)控系統(tǒng)流程可以看出,底層的興趣目標(biāo)提取過程是整個監(jiān)控系統(tǒng)基礎(chǔ)部分,是后續(xù)目標(biāo)跟蹤、目標(biāo)識別及行為分析等任務(wù)的重要基礎(chǔ),其性能的好壞直接影響了后續(xù)目標(biāo)任務(wù)的性能。本文將這個興趣目標(biāo)的提取過程稱為“前景目標(biāo)檢測”。很多文獻(xiàn)中[10–13]也將該過程稱為“運(yùn)動目標(biāo)檢測”,然而實際監(jiān)控場景中運(yùn)動的目標(biāo)不一定是興趣目標(biāo),比如搖曳的樹木、水面(海面)波紋、噴泉、運(yùn)動的扶梯等等;而且還有很多情況下靜止的目標(biāo)也可能屬于興趣目標(biāo),比如故意丟棄的(危險)物品都屬于興趣目標(biāo),因此本文主要使用“前景目標(biāo)檢測”這一學(xué)術(shù)名詞。前景目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的研究熱點之一,其應(yīng)用領(lǐng)域不僅僅局限于智能視頻監(jiān)控,在人機(jī)交互、軍事、多媒體等領(lǐng)域都具有廣泛應(yīng)用:
第1章 緒論機(jī)場、火車站等人流密集場景監(jiān)控[14,15]。(2)人機(jī)交互:新一代的人機(jī)交互系統(tǒng)可以實時準(zhǔn)確地檢測識別肢體動作信息,然后迅速地響應(yīng)相應(yīng)操作,相較于傳統(tǒng)的鍵盤鼠標(biāo)的交互方式,新一代的人機(jī)交互方式更加便捷高效。典型的代表應(yīng)用有微軟的Kinect、谷歌的GoogleGlass、體感游戲等[16–18]。
【參考文獻(xiàn)】
本文編號:2871890
【學(xué)位單位】:中國科學(xué)院大學(xué)(中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TN948.6
【部分圖文】:
第1章 緒論第1章 緒論1.1研究背景及意義近年來,隨著計算機(jī)、通信、傳感器以及多媒體等技術(shù)的快速發(fā)展,信息的獲取速度和獲取量成幾何級數(shù)遞增,可以說,人類正處于一個信息大爆炸的時代。計算機(jī)視覺的研究目的是利用計算機(jī)模擬人類的視覺系統(tǒng),使得計算機(jī)具有視覺信息攝入能力、信息分析能力以及決策制定能力,從而在某些應(yīng)用場景中替代人工操作,節(jié)省人工成本。因此,近年來計算機(jī)視覺相關(guān)的研究得到極大的重視和快速的發(fā)展,并且在視頻監(jiān)控、工業(yè)生產(chǎn)、醫(yī)療診斷、自動駕駛、智慧城市以及智能支付等眾多領(lǐng)域得到廣泛應(yīng)用,取得了巨大的經(jīng)濟(jì)效益與社會效益[1–4]。
圖1.2智能視頻監(jiān)控系統(tǒng)流程[6]分析和理解,并根據(jù)預(yù)設(shè)規(guī)則輸出分析結(jié)果。概括起來,智能視頻監(jiān)控系統(tǒng)的主要目的就是要讓計算機(jī)回答當(dāng)前場景興趣目標(biāo)在哪里,是什么,在干什么等。從智能視頻監(jiān)控系統(tǒng)流程可以看出,底層的興趣目標(biāo)提取過程是整個監(jiān)控系統(tǒng)基礎(chǔ)部分,是后續(xù)目標(biāo)跟蹤、目標(biāo)識別及行為分析等任務(wù)的重要基礎(chǔ),其性能的好壞直接影響了后續(xù)目標(biāo)任務(wù)的性能。本文將這個興趣目標(biāo)的提取過程稱為“前景目標(biāo)檢測”。很多文獻(xiàn)中[10–13]也將該過程稱為“運(yùn)動目標(biāo)檢測”,然而實際監(jiān)控場景中運(yùn)動的目標(biāo)不一定是興趣目標(biāo),比如搖曳的樹木、水面(海面)波紋、噴泉、運(yùn)動的扶梯等等;而且還有很多情況下靜止的目標(biāo)也可能屬于興趣目標(biāo),比如故意丟棄的(危險)物品都屬于興趣目標(biāo),因此本文主要使用“前景目標(biāo)檢測”這一學(xué)術(shù)名詞。前景目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的研究熱點之一,其應(yīng)用領(lǐng)域不僅僅局限于智能視頻監(jiān)控,在人機(jī)交互、軍事、多媒體等領(lǐng)域都具有廣泛應(yīng)用:
第1章 緒論機(jī)場、火車站等人流密集場景監(jiān)控[14,15]。(2)人機(jī)交互:新一代的人機(jī)交互系統(tǒng)可以實時準(zhǔn)確地檢測識別肢體動作信息,然后迅速地響應(yīng)相應(yīng)操作,相較于傳統(tǒng)的鍵盤鼠標(biāo)的交互方式,新一代的人機(jī)交互方式更加便捷高效。典型的代表應(yīng)用有微軟的Kinect、谷歌的GoogleGlass、體感游戲等[16–18]。
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 馮學(xué)強(qiáng);張良旭;劉志宗;;無人駕駛汽車的發(fā)展綜述[J];山東工業(yè)技術(shù);2015年05期
2 尹寶才;王文通;王立春;;深度學(xué)習(xí)研究綜述[J];北京工業(yè)大學(xué)學(xué)報;2015年01期
3 黃凱奇;陳曉棠;康運(yùn)鋒;譚鐵牛;;智能視頻監(jiān)控技術(shù)綜述[J];計算機(jī)學(xué)報;2015年06期
4 劉麗;匡綱要;;圖像紋理特征提取方法綜述[J];中國圖象圖形學(xué)報;2009年04期
5 鄭世寶;;智能視頻監(jiān)控技術(shù)與應(yīng)用[J];電視技術(shù);2009年01期
6 葛繼科;邱玉輝;吳春明;蒲國林;;遺傳算法研究綜述[J];計算機(jī)應(yīng)用研究;2008年10期
本文編號:2871890
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2871890.html
最近更新
教材專著