基于改進(jìn)端到端深度學(xué)習(xí)框架的行人檢測算法研究
發(fā)布時間:2021-04-02 14:55
隨著地鐵在各大中型城市的發(fā)展,它逐漸成為了城市運輸?shù)闹袌粤α俊6@對城市的交通管理,地鐵調(diào)度,運輸資源的分配,以及城市的公共安全等提出了更高的要求,在此背景下,地鐵的客流檢測和統(tǒng)計就成為了提供數(shù)據(jù)支撐的關(guān)鍵技術(shù)。而行人檢測又是客流檢測等的基礎(chǔ)關(guān)鍵性技術(shù)。隨著計算力的發(fā)展,目前基于深度學(xué)習(xí)的目標(biāo)檢測算法已經(jīng)較為成熟,當(dāng)下流行的目標(biāo)檢測網(wǎng)絡(luò)為了兼顧更多種類的場景和目標(biāo),網(wǎng)絡(luò)層數(shù)普遍較深。而本文中的行人檢測屬于單目標(biāo)檢測,所用到的頭肩樣本特征也較為簡單,此時深層網(wǎng)絡(luò)則并不完全適用,會出現(xiàn)較大的計算冗余,導(dǎo)致在檢測方面檢測速度較慢。且在地鐵行人檢測中其單個目標(biāo)在畫面中占比較小,場景中行人密集場景較多,存在行人遮擋現(xiàn)象,這也會導(dǎo)致普通的網(wǎng)絡(luò)框架表現(xiàn)力下降,出現(xiàn)漏檢問題。經(jīng)過實驗表明,經(jīng)過針對性改進(jìn)的端到端深度學(xué)習(xí)框架在保證檢測精度的情況下,能夠有效提升檢測速度。本文研究了地鐵環(huán)境下基于端到端深度學(xué)習(xí)框架的行人檢測算法。主要針對目前行人檢測中由于網(wǎng)絡(luò)冗余造成的檢測速度較慢的問題,和由遮擋造成的漏檢情況,對已有的典型端到端深度學(xué)習(xí)框架YOLOv3進(jìn)行精簡優(yōu)化。具體工作的內(nèi)容如下:1.針對本任務(wù)中的背...
【文章來源】:北方工業(yè)大學(xué)北京市
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)示意圖
第二章基于端到端深度學(xué)習(xí)框架的目標(biāo)檢測理論基礎(chǔ)11圖2-1FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)示意圖圖2-2R-FCN網(wǎng)絡(luò)結(jié)構(gòu)示意圖2.端到端目標(biāo)檢測框架端到端目標(biāo)檢測算法無需提前生成候選區(qū)域,而是通過大小和長寬比不同的錨框,對特征提取部分的卷積神經(jīng)網(wǎng)絡(luò)中產(chǎn)生的特征圖上的每個區(qū)域進(jìn)行密集采樣。這樣就可以省略感興趣區(qū)域選擇階段,直接生成預(yù)測框的位置和分類情況。目前應(yīng)用較多的網(wǎng)絡(luò)為YOLO網(wǎng)絡(luò)系列和SSD網(wǎng)絡(luò)系列,SSD網(wǎng)絡(luò)經(jīng)典結(jié)構(gòu)如圖2-3所示。YOLOv3目標(biāo)檢測網(wǎng)絡(luò)是目前在工業(yè)界表現(xiàn)最為優(yōu)秀且最穩(wěn)定的網(wǎng)絡(luò)框架,本文主要對YOLOv3網(wǎng)絡(luò)進(jìn)行改進(jìn)和優(yōu)化,下文將主要介紹YOLO系列的算法。
第二章基于端到端深度學(xué)習(xí)框架的目標(biāo)檢測理論基礎(chǔ)13圖2-4YOLOv1的檢測流程示意圖置信度的計算公式如下truthpredConfidence=Pr(Object)IOU(2-1)其中,Pr(Object)代表是否含有目標(biāo),不含為0,包含目標(biāo)則為1,而IOU表示真實框與預(yù)測框的面積的交并比,計算示意圖如圖2-5所示。計算方式如下:()()truthpredareaABIOUareaAB=(2-2)圖2-5IUO計算示意圖在每個單元的預(yù)測框的預(yù)測中,包含預(yù)測框中心點的坐標(biāo)(x,y),預(yù)測框的寬和高(w,h)以及它的置信度(confidence)。除此之外,每個單元還需要預(yù)測C類目標(biāo)的類別概率,即Pr(Class|Objec),每個單元最后只生成一個預(yù)測框的類別概率。而在檢測過程中,每個柵格檢測結(jié)果的計算公式如下:
【參考文獻(xiàn)】:
碩士論文
[1]基于深度學(xué)習(xí)的快速目標(biāo)檢測技術(shù)研究[D]. 王震.天津理工大學(xué) 2017
[2]監(jiān)控場景下人數(shù)統(tǒng)計關(guān)鍵技術(shù)研究[D]. 李佩.重慶郵電大學(xué) 2016
本文編號:3115467
【文章來源】:北方工業(yè)大學(xué)北京市
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)示意圖
第二章基于端到端深度學(xué)習(xí)框架的目標(biāo)檢測理論基礎(chǔ)11圖2-1FasterR-CNN網(wǎng)絡(luò)結(jié)構(gòu)示意圖圖2-2R-FCN網(wǎng)絡(luò)結(jié)構(gòu)示意圖2.端到端目標(biāo)檢測框架端到端目標(biāo)檢測算法無需提前生成候選區(qū)域,而是通過大小和長寬比不同的錨框,對特征提取部分的卷積神經(jīng)網(wǎng)絡(luò)中產(chǎn)生的特征圖上的每個區(qū)域進(jìn)行密集采樣。這樣就可以省略感興趣區(qū)域選擇階段,直接生成預(yù)測框的位置和分類情況。目前應(yīng)用較多的網(wǎng)絡(luò)為YOLO網(wǎng)絡(luò)系列和SSD網(wǎng)絡(luò)系列,SSD網(wǎng)絡(luò)經(jīng)典結(jié)構(gòu)如圖2-3所示。YOLOv3目標(biāo)檢測網(wǎng)絡(luò)是目前在工業(yè)界表現(xiàn)最為優(yōu)秀且最穩(wěn)定的網(wǎng)絡(luò)框架,本文主要對YOLOv3網(wǎng)絡(luò)進(jìn)行改進(jìn)和優(yōu)化,下文將主要介紹YOLO系列的算法。
第二章基于端到端深度學(xué)習(xí)框架的目標(biāo)檢測理論基礎(chǔ)13圖2-4YOLOv1的檢測流程示意圖置信度的計算公式如下truthpredConfidence=Pr(Object)IOU(2-1)其中,Pr(Object)代表是否含有目標(biāo),不含為0,包含目標(biāo)則為1,而IOU表示真實框與預(yù)測框的面積的交并比,計算示意圖如圖2-5所示。計算方式如下:()()truthpredareaABIOUareaAB=(2-2)圖2-5IUO計算示意圖在每個單元的預(yù)測框的預(yù)測中,包含預(yù)測框中心點的坐標(biāo)(x,y),預(yù)測框的寬和高(w,h)以及它的置信度(confidence)。除此之外,每個單元還需要預(yù)測C類目標(biāo)的類別概率,即Pr(Class|Objec),每個單元最后只生成一個預(yù)測框的類別概率。而在檢測過程中,每個柵格檢測結(jié)果的計算公式如下:
【參考文獻(xiàn)】:
碩士論文
[1]基于深度學(xué)習(xí)的快速目標(biāo)檢測技術(shù)研究[D]. 王震.天津理工大學(xué) 2017
[2]監(jiān)控場景下人數(shù)統(tǒng)計關(guān)鍵技術(shù)研究[D]. 李佩.重慶郵電大學(xué) 2016
本文編號:3115467
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3115467.html
最近更新
教材專著