基于自適應(yīng)特征聚類網(wǎng)的行人重識別
發(fā)布時間:2021-12-12 05:28
隨著社會信息化建設(shè)的不斷發(fā)展,城市中監(jiān)控攝設(shè)備的數(shù)量與監(jiān)控視頻數(shù)據(jù)正急劇增加,人工瀏覽并處理所有監(jiān)控視頻已變得費時費力,因此,如何利用計算機自動整合監(jiān)控視頻信息具有重要意義。行人重識別技術(shù)可以從多個攝像機拍攝視頻中對指定行人進行檢索,該技術(shù)在智能視頻監(jiān)控、智能交通、智能安防等領(lǐng)域均有廣泛應(yīng)用,但由于視頻拍攝角度不同、行人運動姿態(tài)多變、行人背景變化復(fù)雜、攝像機拍攝質(zhì)量參差不齊、大霧大雨惡劣天氣等影響,使得目前行人重識別精度不高,距離實際應(yīng)用仍然有一定的差距。目前主流的行人重識別解決方案由特征提取和相似度度量這兩大部分構(gòu)成,前者用于提取具有表征性和魯棒性的行人特征,后者將行人特征投影到更易區(qū)分的分布空間,從而提高行人重識別模型的檢索能力。綜上所述,本文針對特征提取和相似度度量提出了三種優(yōu)化方法:設(shè)計一種自適應(yīng)特征聚類網(wǎng)絡(luò)結(jié)構(gòu),用于提取具有較高表征能力與魯棒性的行人特征。自適應(yīng)特征聚類網(wǎng)絡(luò)由基礎(chǔ)特征提取網(wǎng)絡(luò)、特征聚類模塊和分類模塊三部分組成,選取ResNet-50網(wǎng)絡(luò)結(jié)構(gòu)作為基礎(chǔ)特征提取網(wǎng)絡(luò),在獲得行人特征圖后,使用自定義的平面對稱填充和一層卷積層對特征圖做像素級的分類,并將同類特征聚類通過...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:97 頁
【學(xué)位級別】:碩士
【部分圖文】:
智慧城市
攝像機產(chǎn)生的視頻數(shù)據(jù)可以達到驚人的 TB 甚至 PB 級別;再點,屬于低密度高價值,監(jiān)控視頻中重要的信息往往僅出現(xiàn)在因此,如何智能高效的合理利用這些大量的、具有自己獨特分,從而真正實現(xiàn)的智能監(jiān)控,對于那些算法研究人員來說也是安防監(jiān)控領(lǐng)域,例如各地的公安機關(guān),如果在街頭出現(xiàn)盜竊、安干警往往會選擇在中央監(jiān)控室內(nèi),調(diào)集所有可收集到的監(jiān)控,一段一段的觀看視頻來查找犯罪嫌疑人,如圖 1.2 所示,而在面對如今與日俱增的海量數(shù)據(jù)面前,已很難完成既定任務(wù)。的運算能力,設(shè)計出相對應(yīng)的智能監(jiān)控算法,讓機器自動完成將監(jiān)控工作人員從繁重而重復(fù)的肉眼觀看視頻的任務(wù)中解放出監(jiān)控的效率,從而推動智能視頻監(jiān)控領(lǐng)域的發(fā)展,這一需求已利用計算機視覺方面的技術(shù)算法來實現(xiàn)智能安防,已成為目前希望解決的技術(shù)問題。
第一章 緒論identification)[1],以前也被稱為多攝像機追蹤,即將所有出現(xiàn)在監(jiān)控視頻中的行人像進行合理匹配,從而找到待檢測行人在所有視頻中出現(xiàn)的位置,如圖 1.3 所示。近幾年來,行人重識別技術(shù)受到越來越多研究人員的青睞,目前可以說是計算機視大類中的一個研究熱點。行人重識別技術(shù)的核心問題包括:目標檢測、機器學(xué)習(xí)、式識別、信息論、多源信息融合、數(shù)字圖像處理等在內(nèi)的多個學(xué)科領(lǐng)域和多種知識構(gòu),它需要處理的主要對象是大量攝像頭所拍攝下來的海量視頻信息,但在實際應(yīng)當中,由于監(jiān)控視頻清晰度的參差不齊、拍攝角度的變化較大、背景環(huán)境的差異性大、行人圖像出現(xiàn)遮擋等眾多問題的存在[2],使得行人重識別在實現(xiàn)起來也是困難重,種種不確定因素也給行人重識別這一技術(shù)帶來了前所未有的挑戰(zhàn),因此,如何用硬件支持或是軟件的特定算法來有效緩解不確定因素所帶來的干擾,正是目前行重識別的相關(guān)研究人員們所要解決的核心問題。
本文編號:3536089
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:97 頁
【學(xué)位級別】:碩士
【部分圖文】:
智慧城市
攝像機產(chǎn)生的視頻數(shù)據(jù)可以達到驚人的 TB 甚至 PB 級別;再點,屬于低密度高價值,監(jiān)控視頻中重要的信息往往僅出現(xiàn)在因此,如何智能高效的合理利用這些大量的、具有自己獨特分,從而真正實現(xiàn)的智能監(jiān)控,對于那些算法研究人員來說也是安防監(jiān)控領(lǐng)域,例如各地的公安機關(guān),如果在街頭出現(xiàn)盜竊、安干警往往會選擇在中央監(jiān)控室內(nèi),調(diào)集所有可收集到的監(jiān)控,一段一段的觀看視頻來查找犯罪嫌疑人,如圖 1.2 所示,而在面對如今與日俱增的海量數(shù)據(jù)面前,已很難完成既定任務(wù)。的運算能力,設(shè)計出相對應(yīng)的智能監(jiān)控算法,讓機器自動完成將監(jiān)控工作人員從繁重而重復(fù)的肉眼觀看視頻的任務(wù)中解放出監(jiān)控的效率,從而推動智能視頻監(jiān)控領(lǐng)域的發(fā)展,這一需求已利用計算機視覺方面的技術(shù)算法來實現(xiàn)智能安防,已成為目前希望解決的技術(shù)問題。
第一章 緒論identification)[1],以前也被稱為多攝像機追蹤,即將所有出現(xiàn)在監(jiān)控視頻中的行人像進行合理匹配,從而找到待檢測行人在所有視頻中出現(xiàn)的位置,如圖 1.3 所示。近幾年來,行人重識別技術(shù)受到越來越多研究人員的青睞,目前可以說是計算機視大類中的一個研究熱點。行人重識別技術(shù)的核心問題包括:目標檢測、機器學(xué)習(xí)、式識別、信息論、多源信息融合、數(shù)字圖像處理等在內(nèi)的多個學(xué)科領(lǐng)域和多種知識構(gòu),它需要處理的主要對象是大量攝像頭所拍攝下來的海量視頻信息,但在實際應(yīng)當中,由于監(jiān)控視頻清晰度的參差不齊、拍攝角度的變化較大、背景環(huán)境的差異性大、行人圖像出現(xiàn)遮擋等眾多問題的存在[2],使得行人重識別在實現(xiàn)起來也是困難重,種種不確定因素也給行人重識別這一技術(shù)帶來了前所未有的挑戰(zhàn),因此,如何用硬件支持或是軟件的特定算法來有效緩解不確定因素所帶來的干擾,正是目前行重識別的相關(guān)研究人員們所要解決的核心問題。
本文編號:3536089
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3536089.html
最近更新
教材專著