基于深度學(xué)習(xí)的行人屬性識(shí)別
發(fā)布時(shí)間:2021-02-28 22:19
行人屬性識(shí)別可以將監(jiān)控視頻中的行人信息變成可以用于搜索的高級(jí)語(yǔ)義信息,其可以輔助完成行人檢索、行人重識(shí)別等任務(wù),所以,吸引了越來(lái)越多研究者的關(guān)注。早期的行人屬性識(shí)別算法均是使用手工設(shè)計(jì)規(guī)則的方法提取圖片特征進(jìn)行行人屬性識(shí)別,但實(shí)際場(chǎng)景復(fù)雜度較高,該類(lèi)算法難以獲得較好識(shí)別效果。因此,提出兩種基于深度學(xué)習(xí)的改進(jìn)算法:(1)為了減少背景對(duì)于屬性識(shí)別的干擾,提出基于抑制背景干擾的行人屬性識(shí)別算法。該算法通過(guò)強(qiáng)制網(wǎng)絡(luò)提取到的特征集中于圖像中的人體區(qū)域來(lái)提高屬性識(shí)別效果。首先,增加兩個(gè)分支,主干網(wǎng)絡(luò)提取行人圖像特征,增加的分支用于在特征圖上分離行人人體區(qū)域與背景區(qū)域,得到不同區(qū)域的特征向量。然后,通過(guò)加權(quán)交叉熵?fù)p失函數(shù)計(jì)算網(wǎng)絡(luò)預(yù)測(cè)的損失,通過(guò)區(qū)域?qū)Ρ葥p失函數(shù)計(jì)算由于背景干擾而產(chǎn)生錯(cuò)誤的特征提取所造成的損失。最后,將兩部分損失累加作為網(wǎng)絡(luò)的總損失,對(duì)網(wǎng)絡(luò)進(jìn)行參數(shù)的更新。(2)為了通過(guò)定位各個(gè)屬性的位置來(lái)提高識(shí)別效果,提出基于屬性定位的行人屬性識(shí)別算法。首先,算法設(shè)計(jì)了一個(gè)屬性定位模塊,有針對(duì)性地對(duì)每個(gè)屬性進(jìn)行區(qū)域級(jí)加權(quán)來(lái)提高網(wǎng)絡(luò)的屬性定位能力。然后,將屬性定位模塊應(yīng)用到網(wǎng)絡(luò)的多個(gè)層級(jí),形成一個(gè)多分支...
【文章來(lái)源】:中國(guó)民航大學(xué)天津市
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
訓(xùn)練過(guò)程中區(qū)域?qū)Ρ葥p失函數(shù)變化趨勢(shì)
中國(guó)民航大學(xué)碩士學(xué)位論文37否佩戴帽子提取類(lèi)激活圖的結(jié)果,可以看出定位存在一定的誤差。如果直接利用存在誤差的類(lèi)激活圖對(duì)中間層特征進(jìn)行加權(quán),然后將加權(quán)特征圖用于屬性分類(lèi),那么這種誤差會(huì)導(dǎo)致訓(xùn)練的過(guò)程中屬性的定位越來(lái)越遠(yuǎn)離正確的位置。為了防止這種現(xiàn)象的出現(xiàn),本章算法將基礎(chǔ)網(wǎng)絡(luò)擴(kuò)展為三個(gè)分支,主干分支不添加屬性定位模塊,只用作特征提取和屬性分類(lèi),另外兩個(gè)分支添加屬性定位模塊,如圖4-1所示,將Block4延伸出的分支命名為分支一,將Block3分支延伸出的分支命名為分支二。最后增加一個(gè)特征融合操作,將主干網(wǎng)絡(luò)的分類(lèi)結(jié)果與分支網(wǎng)絡(luò)的模塊輸出的特征向量進(jìn)行線性加權(quán)融合,計(jì)算方法如式(4.4)所示。這樣既保證了網(wǎng)絡(luò)原本的屬性分類(lèi)正確性,又融合了包含位置信息的特征,使網(wǎng)絡(luò)在保持原有性能的同時(shí),進(jìn)一步提高網(wǎng)絡(luò)的分類(lèi)能力。123yyyy(4.4)其中,1y為主干網(wǎng)絡(luò)的輸出,2y為分支一的輸出,3y為分支二的輸出,為分支一的加權(quán)系數(shù),為分支二的加權(quán)系數(shù)。圖4-4帽子屬性的類(lèi)激活圖4.2.3屬性定位模塊本章算法設(shè)計(jì)了一個(gè)屬性定位模塊,該模塊可以獲取屬性在圖像中的位置信息,輔助屬性識(shí)別任務(wù),提高識(shí)別效果。模塊的結(jié)構(gòu)如圖4-5所示,模塊的輸入為網(wǎng)絡(luò)的中間層特征圖和對(duì)應(yīng)層級(jí)的類(lèi)激活圖。中間層特征圖的維度為NCHW,其中N為網(wǎng)絡(luò)一次輸入的圖片數(shù)量,C為特征圖的通道數(shù),H為特征圖的高度,W為特征圖的寬度。類(lèi)激活圖的維度為attNnumHW,其中N為BatchSize,attnum為數(shù)據(jù)集的標(biāo)簽數(shù)目,類(lèi)激活圖的高度和寬度均與模塊輸入的特征圖維度一致。屬性定位模塊的實(shí)現(xiàn)細(xì)節(jié)包含以下三個(gè)步驟:
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)技術(shù)在細(xì)胞形態(tài)學(xué)圖像處理中的研究進(jìn)展[J]. 趙天賜,王庚,連荷清,方喆君,王欣,陳倩,吳衛(wèi). 臨床檢驗(yàn)雜志. 2019(11)
[2]深度學(xué)習(xí)算法研究進(jìn)展[J]. 田啟川,王滿(mǎn)麗. 計(jì)算機(jī)工程與應(yīng)用. 2019(22)
[3]基于深度學(xué)習(xí)的圖像語(yǔ)義分割技術(shù)研究綜述[J]. 鄺輝宇,吳俊君. 計(jì)算機(jī)工程與應(yīng)用. 2019(19)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型綜述[J]. 許必宵,宮婧,孫知信. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(12)
[5]深度學(xué)習(xí)在圖像識(shí)別中的應(yīng)用研究綜述[J]. 鄭遠(yuǎn)攀,李廣陽(yáng),李曄. 計(jì)算機(jī)工程與應(yīng)用. 2019(12)
[6]基于改進(jìn)損失函數(shù)的多階段行人屬性識(shí)別方法[J]. 鄭少飛,湯進(jìn),羅斌,王逍,王文中. 模式識(shí)別與人工智能. 2018(12)
[7]基于深度學(xué)習(xí)的行人屬性多標(biāo)簽識(shí)別[J]. 李亞鵬,萬(wàn)遂人. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào). 2018(04)
[8]基于深度學(xué)習(xí)的行人屬性識(shí)別[J]. 陳萍,楊鴻波. 信息通信. 2018(04)
[9]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
本文編號(hào):3056538
【文章來(lái)源】:中國(guó)民航大學(xué)天津市
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
訓(xùn)練過(guò)程中區(qū)域?qū)Ρ葥p失函數(shù)變化趨勢(shì)
中國(guó)民航大學(xué)碩士學(xué)位論文37否佩戴帽子提取類(lèi)激活圖的結(jié)果,可以看出定位存在一定的誤差。如果直接利用存在誤差的類(lèi)激活圖對(duì)中間層特征進(jìn)行加權(quán),然后將加權(quán)特征圖用于屬性分類(lèi),那么這種誤差會(huì)導(dǎo)致訓(xùn)練的過(guò)程中屬性的定位越來(lái)越遠(yuǎn)離正確的位置。為了防止這種現(xiàn)象的出現(xiàn),本章算法將基礎(chǔ)網(wǎng)絡(luò)擴(kuò)展為三個(gè)分支,主干分支不添加屬性定位模塊,只用作特征提取和屬性分類(lèi),另外兩個(gè)分支添加屬性定位模塊,如圖4-1所示,將Block4延伸出的分支命名為分支一,將Block3分支延伸出的分支命名為分支二。最后增加一個(gè)特征融合操作,將主干網(wǎng)絡(luò)的分類(lèi)結(jié)果與分支網(wǎng)絡(luò)的模塊輸出的特征向量進(jìn)行線性加權(quán)融合,計(jì)算方法如式(4.4)所示。這樣既保證了網(wǎng)絡(luò)原本的屬性分類(lèi)正確性,又融合了包含位置信息的特征,使網(wǎng)絡(luò)在保持原有性能的同時(shí),進(jìn)一步提高網(wǎng)絡(luò)的分類(lèi)能力。123yyyy(4.4)其中,1y為主干網(wǎng)絡(luò)的輸出,2y為分支一的輸出,3y為分支二的輸出,為分支一的加權(quán)系數(shù),為分支二的加權(quán)系數(shù)。圖4-4帽子屬性的類(lèi)激活圖4.2.3屬性定位模塊本章算法設(shè)計(jì)了一個(gè)屬性定位模塊,該模塊可以獲取屬性在圖像中的位置信息,輔助屬性識(shí)別任務(wù),提高識(shí)別效果。模塊的結(jié)構(gòu)如圖4-5所示,模塊的輸入為網(wǎng)絡(luò)的中間層特征圖和對(duì)應(yīng)層級(jí)的類(lèi)激活圖。中間層特征圖的維度為NCHW,其中N為網(wǎng)絡(luò)一次輸入的圖片數(shù)量,C為特征圖的通道數(shù),H為特征圖的高度,W為特征圖的寬度。類(lèi)激活圖的維度為attNnumHW,其中N為BatchSize,attnum為數(shù)據(jù)集的標(biāo)簽數(shù)目,類(lèi)激活圖的高度和寬度均與模塊輸入的特征圖維度一致。屬性定位模塊的實(shí)現(xiàn)細(xì)節(jié)包含以下三個(gè)步驟:
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)技術(shù)在細(xì)胞形態(tài)學(xué)圖像處理中的研究進(jìn)展[J]. 趙天賜,王庚,連荷清,方喆君,王欣,陳倩,吳衛(wèi). 臨床檢驗(yàn)雜志. 2019(11)
[2]深度學(xué)習(xí)算法研究進(jìn)展[J]. 田啟川,王滿(mǎn)麗. 計(jì)算機(jī)工程與應(yīng)用. 2019(22)
[3]基于深度學(xué)習(xí)的圖像語(yǔ)義分割技術(shù)研究綜述[J]. 鄺輝宇,吳俊君. 計(jì)算機(jī)工程與應(yīng)用. 2019(19)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)模型綜述[J]. 許必宵,宮婧,孫知信. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(12)
[5]深度學(xué)習(xí)在圖像識(shí)別中的應(yīng)用研究綜述[J]. 鄭遠(yuǎn)攀,李廣陽(yáng),李曄. 計(jì)算機(jī)工程與應(yīng)用. 2019(12)
[6]基于改進(jìn)損失函數(shù)的多階段行人屬性識(shí)別方法[J]. 鄭少飛,湯進(jìn),羅斌,王逍,王文中. 模式識(shí)別與人工智能. 2018(12)
[7]基于深度學(xué)習(xí)的行人屬性多標(biāo)簽識(shí)別[J]. 李亞鵬,萬(wàn)遂人. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào). 2018(04)
[8]基于深度學(xué)習(xí)的行人屬性識(shí)別[J]. 陳萍,楊鴻波. 信息通信. 2018(04)
[9]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
本文編號(hào):3056538
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3056538.html
最近更新
教材專(zhuān)著