基于改進(jìn)IDE網(wǎng)絡(luò)的行人重識別
發(fā)布時間:2020-06-19 12:14
【摘要】:為了及時有效的解決社會安全問題,在一些大型的公共場所均已經(jīng)配套完善的視頻監(jiān)控系統(tǒng),記錄密集人群的行為信息或者運(yùn)動軌跡,對維護(hù)社會秩序和社會公共安全具有重要作用。行人重識別問題就是要對不同攝像頭的圖像數(shù)據(jù)或者視頻數(shù)據(jù)檢測出的行人進(jìn)行判斷是否是同一個行人號碼標(biāo)識(Identity Document,ID)。行人重識別技術(shù)不但已經(jīng)成為執(zhí)法部門管理公共安全和犯罪偵破的重要手段,而且也可以計算公共場所的人流數(shù)據(jù),以此改進(jìn)交通系統(tǒng)設(shè)計或者優(yōu)化商場商品布局。身份嵌入(Identification Embedding,IDE)網(wǎng)絡(luò)作為行人重識別非常重要的基準(zhǔn)之一,它通過特征描述的方法,把每個行人當(dāng)做分類問題的一個類別,但是在實(shí)際應(yīng)用中,IDE網(wǎng)絡(luò)存在提取特征無法適應(yīng)復(fù)雜環(huán)境變化和全局特征泛化能力弱的問題,因此針對IDE網(wǎng)絡(luò)存在的不足從三個方面進(jìn)行改進(jìn)。在主干網(wǎng)絡(luò)方面,分別使用DenseNet和PCB網(wǎng)絡(luò)代替ResNet對輸入圖片提取特征;在數(shù)據(jù)增強(qiáng)方面,為了使模型適應(yīng)復(fù)雜環(huán)境的變化,采用色彩抖動和隨機(jī)擦除對數(shù)據(jù)集進(jìn)行擴(kuò)充;在網(wǎng)絡(luò)結(jié)構(gòu)方面,分別引入空間注意力和通道注意力兩種不同的注意力機(jī)制將其和IDE網(wǎng)絡(luò)進(jìn)行融合。經(jīng)過實(shí)驗(yàn)分析,得出以下結(jié)論:(1)改進(jìn)主干網(wǎng)絡(luò)的DenseNet在提取特征方面優(yōu)于原始主干網(wǎng)絡(luò)ResNet,且可以防止模型過擬合;改進(jìn)主干網(wǎng)絡(luò)的PCB網(wǎng)絡(luò)對特征圖進(jìn)行水平分割,可以使模型學(xué)習(xí)到每個行人不同區(qū)域的局部特征。DenseNet改進(jìn)的IDE網(wǎng)絡(luò)和PCB網(wǎng)絡(luò)改進(jìn)的IDE網(wǎng)絡(luò)的首位命中率分別比原始IDE網(wǎng)絡(luò)高1.66%和3.18%;(2)色彩抖動可以讓模型適應(yīng)不同光照條件的復(fù)雜背景,隨機(jī)擦除則可以克服行人的部分遮擋問題,增強(qiáng)模型的泛化能力。融入色彩抖動的改進(jìn)IDE網(wǎng)絡(luò)和融入隨機(jī)擦除的改進(jìn)IDE網(wǎng)絡(luò)的首位命中率分別比原始IDE網(wǎng)絡(luò)高1.57%和2.40%;(3)空間注意力機(jī)制和通道注意力機(jī)制通過對特征進(jìn)行空間轉(zhuǎn)換和重標(biāo)定的策略,可以得到更加魯棒的特征。融合空間注意力的改進(jìn)IDE網(wǎng)絡(luò)和融合通道注意力的改進(jìn)IDE網(wǎng)絡(luò)的首位命中率分別比原始IDE網(wǎng)絡(luò)高2.20%和1.10%。
【學(xué)位授予單位】:長安大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP183;D631;TP391.41
【圖文】:
圖 2.1 完整的卷積神經(jīng)網(wǎng)絡(luò)示意圖由圖 2.1 可知,典型的卷積神經(jīng)網(wǎng)絡(luò)分類器一般包含輸入層、卷積層、激勵層[65]、池化層和全連接層(Fully Connected Layer,F(xiàn)C)、批歸一化層[66](Batch Normalization,BN)。其中,輸入層用于數(shù)據(jù)的輸入,比如:原始圖片數(shù)據(jù)的全部像素;卷積層是每個神經(jīng)元和上一層的若干小區(qū)域連接,計算卷積核權(quán)重和小區(qū)域像素的內(nèi)積,使用卷積核進(jìn)行特征提取和特征映射;神經(jīng)激勵層是將特征層的數(shù)據(jù)分布映射到另一個非線性的特征空間;池化層的核心內(nèi)容是對特征圖進(jìn)行稀疏處理,減少數(shù)據(jù)運(yùn)算量;全連接層一般用于最后計算類別得分,其所有神經(jīng)元和上一層的所有神經(jīng)元一一連接,它可以作為一個中間的通道,將原始的圖像數(shù)據(jù)轉(zhuǎn)換為最后不同類別的得分。圖像輸入網(wǎng)絡(luò)后經(jīng)卷積層提取特征,每層的感受野會逐漸變大,淺層的網(wǎng)絡(luò)層提取圖片的淺層特征,而越深的卷積層可以提取更多的語義信息和細(xì)微特征,各層的詳細(xì)說明如下。2.2.1 卷積層卷積層主要用來對輸入的圖像或者特征圖提取更深層次的特征,是卷積神經(jīng)網(wǎng)絡(luò)的
圖 2.2 卷積操作過程, ,1 1m ni j i ji joutput I K b 為卷積核, m, n分別為卷積核的寬和高, i, j數(shù)為尺寸補(bǔ)全,這個參數(shù)是用來對特征圖的外,就是將特征圖的外圍的一圈進(jìn)行補(bǔ)零操作。入特征圖的尺寸和輸出特征圖的尺寸保持一致次所造成的邊緣信息參考度下降。卷積層的輸長以及尺寸補(bǔ)全同時決定,輸出圖像的尺寸如21inoutsize ksize paddingsizestride
本文編號:2720774
【學(xué)位授予單位】:長安大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP183;D631;TP391.41
【圖文】:
圖 2.1 完整的卷積神經(jīng)網(wǎng)絡(luò)示意圖由圖 2.1 可知,典型的卷積神經(jīng)網(wǎng)絡(luò)分類器一般包含輸入層、卷積層、激勵層[65]、池化層和全連接層(Fully Connected Layer,F(xiàn)C)、批歸一化層[66](Batch Normalization,BN)。其中,輸入層用于數(shù)據(jù)的輸入,比如:原始圖片數(shù)據(jù)的全部像素;卷積層是每個神經(jīng)元和上一層的若干小區(qū)域連接,計算卷積核權(quán)重和小區(qū)域像素的內(nèi)積,使用卷積核進(jìn)行特征提取和特征映射;神經(jīng)激勵層是將特征層的數(shù)據(jù)分布映射到另一個非線性的特征空間;池化層的核心內(nèi)容是對特征圖進(jìn)行稀疏處理,減少數(shù)據(jù)運(yùn)算量;全連接層一般用于最后計算類別得分,其所有神經(jīng)元和上一層的所有神經(jīng)元一一連接,它可以作為一個中間的通道,將原始的圖像數(shù)據(jù)轉(zhuǎn)換為最后不同類別的得分。圖像輸入網(wǎng)絡(luò)后經(jīng)卷積層提取特征,每層的感受野會逐漸變大,淺層的網(wǎng)絡(luò)層提取圖片的淺層特征,而越深的卷積層可以提取更多的語義信息和細(xì)微特征,各層的詳細(xì)說明如下。2.2.1 卷積層卷積層主要用來對輸入的圖像或者特征圖提取更深層次的特征,是卷積神經(jīng)網(wǎng)絡(luò)的
圖 2.2 卷積操作過程, ,1 1m ni j i ji joutput I K b 為卷積核, m, n分別為卷積核的寬和高, i, j數(shù)為尺寸補(bǔ)全,這個參數(shù)是用來對特征圖的外,就是將特征圖的外圍的一圈進(jìn)行補(bǔ)零操作。入特征圖的尺寸和輸出特征圖的尺寸保持一致次所造成的邊緣信息參考度下降。卷積層的輸長以及尺寸補(bǔ)全同時決定,輸出圖像的尺寸如21inoutsize ksize paddingsizestride
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 錢坤;王天真;馬斌;湯天浩;CLARAMUNT Christophe;;一種新型的局部連接BP網(wǎng)絡(luò)模型及應(yīng)用[J];系統(tǒng)科學(xué)與數(shù)學(xué);2014年07期
相關(guān)碩士學(xué)位論文 前3條
1 劉楷怡;行人重識別中的特征表達(dá)和度量學(xué)習(xí)的研究[D];華南理工大學(xué);2018年
2 邱隆慶;基于特征學(xué)習(xí)的行人重識別研究[D];華南理工大學(xué);2017年
3 劉娜;基于卷積神經(jīng)網(wǎng)絡(luò)的行人重識別算法[D];華東師范大學(xué);2017年
本文編號:2720774
本文鏈接:http://sikaile.net/falvlunwen/fanzuizhian/2720774.html
最近更新
教材專著