低光條件下停機坪場面人體運動目標行為識別方法研究
發(fā)布時間:2024-11-03 09:24
隨著民航產業(yè)的發(fā)展,飛行出行已經成為時下更多年輕人、中產階級的首選。但是快速增長的旅客人群也為當今的機場安全帶來了巨大的負擔,停機坪作為機場中極其重要的一部分,建立全覆蓋全天候的智能視頻監(jiān)控系統(tǒng)的需求迫在眉睫。智能視頻監(jiān)控中的核心技術人體行為識別在近幾年發(fā)展迅速,但是研究的重點多是圍繞可見光數(shù)據展開,在紅外數(shù)據中少有建樹;诩t外視頻數(shù)據的相應技術因紅外圖像色彩紋理信息缺失、目標邊緣模糊等問題依舊無法實現(xiàn)實時有效的人體行為識別。所以本文的研究針對紅外視頻中的人體行為識別而展開。傳統(tǒng)的行為識別技術存在的主要問題是特征描述子表征能力弱,在復雜多變的場景下魯棒性差,特征維度巨大,往往需要使用特殊的編碼方法降維,這無疑加大了計算成本。而近幾年興起的卷積神經網絡方法,其特征學習能力強,能夠通過數(shù)據分布自適應地捕獲其中的信息,提取出抽象的語義特征,其端到端的模型結構也大大減少了數(shù)據預處理和后續(xù)分類的計算成本。所以本文采用卷積神經網絡的方法,對紅外視頻中的人體動作信息進行學習建模。本文的主要貢獻如下:首先,本文提出了兩種分別適合RGB數(shù)據和光流數(shù)據的三維卷積神經網絡。兩支網絡根據相應的數(shù)據類型做出結構...
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4011045
【文章頁數(shù)】:81 頁
【學位級別】:碩士
【部分圖文】:
目標跟蹤的研究已發(fā)展了幾十年,各類算法層出不窮。而動作識別分類的研究,由于其對視頻數(shù)據的需求、硬件計算能力的要求,在一段時間都停滯不前。而在近幾年,隨著圖像芯片的迅速發(fā)展,全球范圍內視頻數(shù)據的累積、大量科研人員投入關注,使得基于視頻序列的動作識別的算法[8]又再次新興了起來。在過....
圖2.1RGBdifference[30]模擬光流前面說到光流是目前深度學習算法中使用最多效果最好的網絡輸入特征,但是對龐數(shù)據計算光流是很大的工作量,極度占用計算資源,因此為了大大減小計算成本,Pher等人[35]提出了通過生成式網絡來生成的類光流特征圖的模擬光流特征,....
可能在三維空間里就可以通過一個平面來劃分,而這個平面就是所謂的超平面。SVM的訓練就是使得每類樣本都距離這個超平面越來越遠,而且通過引入懲罰系數(shù)來對錯誤分類的樣本進行調節(jié),從而提高整體的分類水平。但是由于SVM提高數(shù)據維度的操作,有時候也會伴隨著維度災難的產生。不過總體而言,....
圖2.4卷積操作積神經網絡對比于其他神經網絡的優(yōu)勢也主要體現(xiàn)在對卷積層的三種改進中,局部感知、權值共享和多卷積核。部感知。如圖2.5所示,傳統(tǒng)的神經網絡采用全連接的方式對輸入圖像的全局,這樣對于一個mm的輸入圖像而言,需要一個mm的濾波器進行處理,所數(shù)個數(shù)為....
本文編號:4011045
本文鏈接:http://sikaile.net/kejilunwen/hangkongsky/4011045.html
最近更新
教材專著