工廠監(jiān)控視頻中的安全帽檢測(cè)
發(fā)布時(shí)間:2021-03-07 01:38
安全帽佩戴檢測(cè)是實(shí)現(xiàn)安全生產(chǎn)的重要環(huán)節(jié)。隨著監(jiān)控設(shè)備日益普及,監(jiān)控視頻的數(shù)量飛速上漲,如何將這些視頻資源用于智能檢測(cè)已經(jīng)成為一種迫切的需求。近年來(lái)基于深度學(xué)習(xí)的方法在目標(biāo)檢測(cè)和圖像分類上取得了不錯(cuò)的進(jìn)展,但大多基于公共數(shù)據(jù)集,在工業(yè)場(chǎng)景中應(yīng)用時(shí)還存在一些準(zhǔn)確性和速度上的問(wèn)題。將安全帽的檢測(cè)分為人體檢測(cè)和安全帽檢測(cè)。以工廠監(jiān)控視頻幀為研究對(duì)象,構(gòu)建了一個(gè)使用邊界框進(jìn)行標(biāo)注的人體檢測(cè)數(shù)據(jù)集,該數(shù)據(jù)集包含3029張圖像,共包括近萬(wàn)個(gè)人體目標(biāo)。使用該數(shù)據(jù)集對(duì)Faster R-CNN進(jìn)行訓(xùn)練以實(shí)現(xiàn)人體檢測(cè),針對(duì)目標(biāo)規(guī)模小的特點(diǎn),修改Faster R-CNN的參數(shù),包括anchors的尺寸和RPN中的閾值;針對(duì)目標(biāo)分布密集的特點(diǎn),使用soft-NMS改進(jìn)后處理過(guò)程,在不重新訓(xùn)練模型的情況下提高人體檢測(cè)的準(zhǔn)確性。在不使用工廠室內(nèi)圖像作為訓(xùn)練集的情況下,將室內(nèi)場(chǎng)景數(shù)據(jù)加入驗(yàn)證集防止模型訓(xùn)練時(shí)過(guò)擬合,加強(qiáng)了模型的泛化能力。根據(jù)人體長(zhǎng)寬比確定工人頭部位置,使用滑動(dòng)窗口縮小安全帽的范圍,以便使用傳統(tǒng)方法或神經(jīng)網(wǎng)絡(luò)對(duì)安全帽進(jìn)行分類。使用數(shù)據(jù)集對(duì)改進(jìn)的模型進(jìn)行訓(xùn)練并測(cè)試,結(jié)果表明基于Faster R-CNN的改...
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
整體流程圖
一般用于人體檢測(cè)的神經(jīng)網(wǎng)絡(luò)按照結(jié)構(gòu)可以分為單階段網(wǎng)絡(luò)(one-stage network)、兩階段網(wǎng)絡(luò)(two-stage network)和多階段網(wǎng)絡(luò)(multi-stage network)。單階段網(wǎng)絡(luò)包括 YOLO 系列和 SSD 等,其識(shí)別準(zhǔn)確率較低,但是檢測(cè)速度較快;兩階段網(wǎng)絡(luò)包括 Fast R-CNN 和 Faster R-CNN 等,其識(shí)別準(zhǔn)確率較高,但是檢測(cè)速度較慢;多階段網(wǎng)絡(luò)包括 R-CNN 和 SPPNet 等,其識(shí)別準(zhǔn)確率極低,檢測(cè)速度也極慢,如今已很少在實(shí)際工業(yè)環(huán)境中使用。單階段網(wǎng)絡(luò)通過(guò) anchor 列舉出候選框后直接進(jìn)行多分類和回歸以完成識(shí)別和定位,不生成候選區(qū)域。單階段表示它僅使用一個(gè) CNN 直接預(yù)測(cè)目標(biāo)的類別和位置,這也是其速度快和準(zhǔn)確率低的原因。多階段網(wǎng)絡(luò)一般先通過(guò)選擇性搜索(selective search)獲取候選區(qū)域,再進(jìn)行回歸并利用 SVM 進(jìn)行多分類。稱為多階段是因?yàn)檫x擇性搜索、特征提取、回歸和分類是分成多個(gè)階段單獨(dú)進(jìn)行訓(xùn)練的。選擇性搜索屬于傳統(tǒng)機(jī)器學(xué)習(xí)的算法,在檢測(cè)網(wǎng)絡(luò)中計(jì)算時(shí)間最長(zhǎng),在 Faster R-CNN 中已經(jīng)被 RPN 取代。
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文窮舉候選框時(shí)的特征提取網(wǎng)絡(luò)以及第二階段中的多分類和回歸網(wǎng)絡(luò)被整合到一個(gè)網(wǎng)絡(luò)中,再加上第一階段提取候選區(qū)域的網(wǎng)絡(luò),總共需要對(duì)兩個(gè)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這也是其稱為兩階段網(wǎng)絡(luò)的原因。兩階段網(wǎng)絡(luò)在第一階段會(huì)抑制掉大量的負(fù)樣本,使正負(fù)樣本對(duì)損失的貢獻(xiàn)盡量相同,這就減少了正負(fù)樣本不均衡問(wèn)題帶來(lái)的影響。2.1.2 Faster R-CNNFaster R-CNN 是經(jīng)典的兩階段網(wǎng)絡(luò),于 2015 年提出,經(jīng)歷了從 R-CNN 到 FasR-CNN 的發(fā)展,最終將目標(biāo)檢測(cè)的基本步驟統(tǒng)一到一個(gè)深度網(wǎng)絡(luò)框架之中。FasterR-CNN 相對(duì)于 Fast R-CNN 在第一階段進(jìn)行了改進(jìn),利用 RPN 代替選擇性搜索,減少了冗余的計(jì)算,并且使得訓(xùn)練過(guò)程可以使用圖形處理器(Graphics Processing UnitGPU)進(jìn)行加速,提高了檢測(cè)速度。其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖 2.2 所示,fc 表示全連接層,k 表示每個(gè)點(diǎn) anchors 的數(shù)量。
本文編號(hào):3068173
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
整體流程圖
一般用于人體檢測(cè)的神經(jīng)網(wǎng)絡(luò)按照結(jié)構(gòu)可以分為單階段網(wǎng)絡(luò)(one-stage network)、兩階段網(wǎng)絡(luò)(two-stage network)和多階段網(wǎng)絡(luò)(multi-stage network)。單階段網(wǎng)絡(luò)包括 YOLO 系列和 SSD 等,其識(shí)別準(zhǔn)確率較低,但是檢測(cè)速度較快;兩階段網(wǎng)絡(luò)包括 Fast R-CNN 和 Faster R-CNN 等,其識(shí)別準(zhǔn)確率較高,但是檢測(cè)速度較慢;多階段網(wǎng)絡(luò)包括 R-CNN 和 SPPNet 等,其識(shí)別準(zhǔn)確率極低,檢測(cè)速度也極慢,如今已很少在實(shí)際工業(yè)環(huán)境中使用。單階段網(wǎng)絡(luò)通過(guò) anchor 列舉出候選框后直接進(jìn)行多分類和回歸以完成識(shí)別和定位,不生成候選區(qū)域。單階段表示它僅使用一個(gè) CNN 直接預(yù)測(cè)目標(biāo)的類別和位置,這也是其速度快和準(zhǔn)確率低的原因。多階段網(wǎng)絡(luò)一般先通過(guò)選擇性搜索(selective search)獲取候選區(qū)域,再進(jìn)行回歸并利用 SVM 進(jìn)行多分類。稱為多階段是因?yàn)檫x擇性搜索、特征提取、回歸和分類是分成多個(gè)階段單獨(dú)進(jìn)行訓(xùn)練的。選擇性搜索屬于傳統(tǒng)機(jī)器學(xué)習(xí)的算法,在檢測(cè)網(wǎng)絡(luò)中計(jì)算時(shí)間最長(zhǎng),在 Faster R-CNN 中已經(jīng)被 RPN 取代。
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文窮舉候選框時(shí)的特征提取網(wǎng)絡(luò)以及第二階段中的多分類和回歸網(wǎng)絡(luò)被整合到一個(gè)網(wǎng)絡(luò)中,再加上第一階段提取候選區(qū)域的網(wǎng)絡(luò),總共需要對(duì)兩個(gè)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,這也是其稱為兩階段網(wǎng)絡(luò)的原因。兩階段網(wǎng)絡(luò)在第一階段會(huì)抑制掉大量的負(fù)樣本,使正負(fù)樣本對(duì)損失的貢獻(xiàn)盡量相同,這就減少了正負(fù)樣本不均衡問(wèn)題帶來(lái)的影響。2.1.2 Faster R-CNNFaster R-CNN 是經(jīng)典的兩階段網(wǎng)絡(luò),于 2015 年提出,經(jīng)歷了從 R-CNN 到 FasR-CNN 的發(fā)展,最終將目標(biāo)檢測(cè)的基本步驟統(tǒng)一到一個(gè)深度網(wǎng)絡(luò)框架之中。FasterR-CNN 相對(duì)于 Fast R-CNN 在第一階段進(jìn)行了改進(jìn),利用 RPN 代替選擇性搜索,減少了冗余的計(jì)算,并且使得訓(xùn)練過(guò)程可以使用圖形處理器(Graphics Processing UnitGPU)進(jìn)行加速,提高了檢測(cè)速度。其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖 2.2 所示,fc 表示全連接層,k 表示每個(gè)點(diǎn) anchors 的數(shù)量。
本文編號(hào):3068173
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3068173.html
最近更新
教材專著