一種基于深度學習的物流快遞驛站異常行為識別方法
發(fā)布時間:2021-11-19 18:52
隨著網(wǎng)點數(shù)量的快速增長,物流快遞驛站的安全問題得到了越來越多的重視。文章提出了一種基于深度學習的物流快遞驛站異常行為識別方法,其采用卷積神經(jīng)網(wǎng)絡ResNet152提取視頻的每一幀圖像特征,通過遞歸神經(jīng)網(wǎng)絡LSTM對幀與幀之間的時序關(guān)系進行建模,并采用多路分支網(wǎng)絡架構(gòu)以適應不同物流快遞驛站的攝像機視角變化。在實際物流快遞驛站場景下的實驗結(jié)果驗證了本文方法的有效性。
【文章來源】:物流科技. 2020,43(09)
【文章頁數(shù)】:5 頁
【部分圖文】:
以分支1為例的融合網(wǎng)絡結(jié)構(gòu)
基于深度學習的物流快遞驛站異常行為識別方法的網(wǎng)絡結(jié)構(gòu)如圖1所示,其由多個分支網(wǎng)絡構(gòu)成,每個分支網(wǎng)絡對應訓練場景中的特定攝像機視角,分別由卷積網(wǎng)絡、遞歸網(wǎng)絡、融合網(wǎng)絡和分類網(wǎng)絡構(gòu)成。其中卷積網(wǎng)絡用來提取視頻中每一幀圖片的特征,遞歸網(wǎng)絡用來對幀與幀之間的時序關(guān)系進行建模。卷積網(wǎng)絡和遞歸網(wǎng)絡學習該視角相關(guān)的區(qū)分性特征,而融合網(wǎng)絡則對來自其他分支的特征數(shù)據(jù)進行融合,以利用不同分支提取特征的互補性,分類網(wǎng)絡最終輸出每一視頻幀屬于各個動作的概率。由于實際應用時物流快遞驛站的攝像機視角和訓練場景并不相同,因此單獨訓練一個視角分類網(wǎng)絡,用于給出輸入視頻屬于各個分支的概率。在應用階段,物流快遞驛站的每路視頻輸入到各個分支網(wǎng)絡,并使用視角分類網(wǎng)絡獲得的分支概率作為權(quán)重來集成各個分支上獲得的動作分類結(jié)果。1.2 基于卷積網(wǎng)絡的視頻幀圖像特征提取。
相比于重復地堆疊網(wǎng)絡,Res Net在輸出和輸入之間引入了短路連接,從而可以有效地解決網(wǎng)絡層數(shù)過深出現(xiàn)的梯度消失問題。本文采用在Image Net 11K圖像集上預訓練的152層Res Net網(wǎng)絡[14]提取視頻幀的圖像特征,輸入圖像的大小為224×224,輸出為Res Net152網(wǎng)絡的flatten0_output層,其維度為2 048維,即vt,i∈R2 048。1.3 基于遞歸網(wǎng)絡的視頻幀與幀時序關(guān)系建模。
【參考文獻】:
期刊論文
[1]我國物流快遞行業(yè)安全監(jiān)管研究[J]. 魏宇析. 合作經(jīng)濟與科技. 2020(08)
[2]我國快遞配送末端自提點發(fā)展模式分析[J]. 王碩,張文濤,馮淑貞. 綜合運輸. 2018(07)
[3]快遞業(yè)“最后一公里”配送模式分析[J]. 王曉琦. 南方企業(yè)家. 2018(03)
[4]基于計算機視覺的物流暴力分揀行為識別[J]. 尚淑玲. 計算機仿真. 2013(12)
碩士論文
[1]計算機視覺在物流倉儲安全管理中的應用研究[D]. 劉穩(wěn).安徽理工大學 2019
本文編號:3505652
【文章來源】:物流科技. 2020,43(09)
【文章頁數(shù)】:5 頁
【部分圖文】:
以分支1為例的融合網(wǎng)絡結(jié)構(gòu)
基于深度學習的物流快遞驛站異常行為識別方法的網(wǎng)絡結(jié)構(gòu)如圖1所示,其由多個分支網(wǎng)絡構(gòu)成,每個分支網(wǎng)絡對應訓練場景中的特定攝像機視角,分別由卷積網(wǎng)絡、遞歸網(wǎng)絡、融合網(wǎng)絡和分類網(wǎng)絡構(gòu)成。其中卷積網(wǎng)絡用來提取視頻中每一幀圖片的特征,遞歸網(wǎng)絡用來對幀與幀之間的時序關(guān)系進行建模。卷積網(wǎng)絡和遞歸網(wǎng)絡學習該視角相關(guān)的區(qū)分性特征,而融合網(wǎng)絡則對來自其他分支的特征數(shù)據(jù)進行融合,以利用不同分支提取特征的互補性,分類網(wǎng)絡最終輸出每一視頻幀屬于各個動作的概率。由于實際應用時物流快遞驛站的攝像機視角和訓練場景并不相同,因此單獨訓練一個視角分類網(wǎng)絡,用于給出輸入視頻屬于各個分支的概率。在應用階段,物流快遞驛站的每路視頻輸入到各個分支網(wǎng)絡,并使用視角分類網(wǎng)絡獲得的分支概率作為權(quán)重來集成各個分支上獲得的動作分類結(jié)果。1.2 基于卷積網(wǎng)絡的視頻幀圖像特征提取。
相比于重復地堆疊網(wǎng)絡,Res Net在輸出和輸入之間引入了短路連接,從而可以有效地解決網(wǎng)絡層數(shù)過深出現(xiàn)的梯度消失問題。本文采用在Image Net 11K圖像集上預訓練的152層Res Net網(wǎng)絡[14]提取視頻幀的圖像特征,輸入圖像的大小為224×224,輸出為Res Net152網(wǎng)絡的flatten0_output層,其維度為2 048維,即vt,i∈R2 048。1.3 基于遞歸網(wǎng)絡的視頻幀與幀時序關(guān)系建模。
【參考文獻】:
期刊論文
[1]我國物流快遞行業(yè)安全監(jiān)管研究[J]. 魏宇析. 合作經(jīng)濟與科技. 2020(08)
[2]我國快遞配送末端自提點發(fā)展模式分析[J]. 王碩,張文濤,馮淑貞. 綜合運輸. 2018(07)
[3]快遞業(yè)“最后一公里”配送模式分析[J]. 王曉琦. 南方企業(yè)家. 2018(03)
[4]基于計算機視覺的物流暴力分揀行為識別[J]. 尚淑玲. 計算機仿真. 2013(12)
碩士論文
[1]計算機視覺在物流倉儲安全管理中的應用研究[D]. 劉穩(wěn).安徽理工大學 2019
本文編號:3505652
本文鏈接:http://sikaile.net/jingjifazhanlunwen/3505652.html
最近更新
教材專著