基于深度學習實現(xiàn)視頻中車輛檢測與空間定位
發(fā)布時間:2021-07-07 21:01
近幾年來,由于人工智能的不斷普及,智能汽車以及汽車輔助駕駛等方向逐漸成為技術變革新一輪的前進方向,并取得了相當不錯的成果。其中對視頻流中目標(包括行人、汽車以及交通燈等)的檢測、識別、分割與測距是智能汽車輔助駕駛系統(tǒng)的重要組成部分。自從2012年的Alex Net在Image Net大賽中博得第一名,深度學習不斷在目標的檢測、識別與分割等領域取得佳績,同時在計算機視覺領域,采用雙目立體視覺對目標進行距離探測也逐漸被許多研究學者關注。但以上方案仍然存在算法計算量過大導致的實時性不足的問題。目標的檢測、識別與分割是目標測距的前提和基礎,由于本文的目的是獲得目標的精準分割圖,且目前將檢測、識別與分割綜合到一起的算法只有Mask RCNN,所以本文實現(xiàn)目標檢測、識別與分割的基本方案為Mask R-CNN算法;同時利用雙目立體視覺對目標進行測距。并且針對以上幾種算法中所涉及到的實時性不足的問題,提出了如下解決方案。首先,本文針對Mask R-CNN的參數(shù)過多、計算量較大以致實時性不足的問題,提出了基于Mobile Net V2的Mask R-CNN算法,利用Mobile Net V2替換Mask...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【部分圖文】:
中心像素點的anchors在RPN中,卷積操作的步長為1,輸出為所有包圍框的分類預測值以及
RPN預測后的ROIs
哈爾濱工業(yè)大學工程碩士學位論文-22-正樣本中被預測正確數(shù)目的比例。理想情況,希望P和R都是越高越好,但是通常情況下隨著P增大R會減小,反之亦然,例如在正負樣本都為100的情況下,當把所有的樣本都預測為正樣本,此時P=0.5,但是R=1;但如果把其中98個正樣本和100各負樣本都預測為負樣本,余下2個正樣本預測為正樣本,此時P=1,但是R=0.02。由此可見對MaskR-CNN的評價需要綜合P和R的屬性來得到平均精度。AP的定義為:以P以及R為縱橫坐標繪制的二維曲線為標準,將曲線以及橫縱坐標軸包含的近似面積為AP。AP的計算流程如下:1.根據(jù)設定的IOU閾值對每一個預測目標進行分類,即IOU大于等于閾值的視為TP,反之則視為FP;2.按照置信度大小對預測結果排序;3.依次計算P與R;4.根據(jù)P和R繪制P-R曲線,如圖2-10藍色折線圖所示;5.利用面積法計算AP,即根據(jù)P的遞減曲線繪制的新P-R曲線的面積,如圖2-10紅色折線圖所示。圖2-10P-R曲線的繪制由分析可得,AP越接近于1,說明模型的效果越好,例如在理想情況下,所有樣本預測正確其負樣本沒有被錯誤預測為正樣本的情況下,可以算得P-R曲線為一條平行于R軸且P始終為1的線段,由此可以求得AP為1。由于本文所感興趣的目標類別并不單一,而且圖片中的類別也不單一,因此在對MaskR-CNN進行評價時不能僅用某一類別來衡量,或者僅使用一張
【參考文獻】:
期刊論文
[1]光流法及其在臨近預報中的應用[J]. 曹春燕,陳元昭,劉東華,李程,李輝,賀佳佳. 氣象學報. 2015(03)
[2]一種基于改進光流法的電子穩(wěn)像算法[J]. 程德強,郭政,劉潔,錢建生,張媛媛,張佳琳. 煤炭學報. 2015(03)
[3]基于光流法與特征統(tǒng)計的魚群異常行為檢測[J]. 于欣,侯曉嬌,盧煥達,余心杰,范良忠,劉鷹. 農(nóng)業(yè)工程學報. 2014(02)
[4]光流算法比較分析研究[J]. 張佳威,支瑞峰. 現(xiàn)代電子技術. 2013(13)
[5]運動細節(jié)估計的光流場方法[J]. 潘金山,蘇志勛,王偉. 計算機輔助設計與圖形學學報. 2011(08)
博士論文
[1]月球車立體視覺與視覺導航方法研究[D]. 侯建.哈爾濱工業(yè)大學 2007
碩士論文
[1]基于雙目立體視覺的不規(guī)則物體體積測量方法研究[D]. 梁樂.西安理工大學 2019
[2]雙目視覺機器人的目標識別與抓取技術研究[D]. 毛孟娜.沈陽工業(yè)大學 2019
[3]基于立體視覺的可見光通信室內(nèi)定位技術研究與實現(xiàn)[D]. 于朋鑫.北京郵電大學 2019
[4]基于雙目立體視覺的玉米葉片識別與定位[D]. 田東旭.吉林大學 2018
[5]基于雙目視覺的移動充電車的設計與實現(xiàn)[D]. 杜鶴峰.西安電子科技大學 2018
[6]基于雙目視覺的巡視機器人避障研究[D]. 倪晨陽.天津大學 2018
[7]基于雙目立體視覺的心臟軟組織三維重構技術研究[D]. 馬波濤.電子科技大學 2017
[8]基于智能手機的車輛檢測與車距測量[D]. 顧兆倫.浙江大學 2017
[9]基于雙目立體視覺的眼球突出度測量方法研究[D]. 張帥.北京交通大學 2016
本文編號:3270363
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【部分圖文】:
中心像素點的anchors在RPN中,卷積操作的步長為1,輸出為所有包圍框的分類預測值以及
RPN預測后的ROIs
哈爾濱工業(yè)大學工程碩士學位論文-22-正樣本中被預測正確數(shù)目的比例。理想情況,希望P和R都是越高越好,但是通常情況下隨著P增大R會減小,反之亦然,例如在正負樣本都為100的情況下,當把所有的樣本都預測為正樣本,此時P=0.5,但是R=1;但如果把其中98個正樣本和100各負樣本都預測為負樣本,余下2個正樣本預測為正樣本,此時P=1,但是R=0.02。由此可見對MaskR-CNN的評價需要綜合P和R的屬性來得到平均精度。AP的定義為:以P以及R為縱橫坐標繪制的二維曲線為標準,將曲線以及橫縱坐標軸包含的近似面積為AP。AP的計算流程如下:1.根據(jù)設定的IOU閾值對每一個預測目標進行分類,即IOU大于等于閾值的視為TP,反之則視為FP;2.按照置信度大小對預測結果排序;3.依次計算P與R;4.根據(jù)P和R繪制P-R曲線,如圖2-10藍色折線圖所示;5.利用面積法計算AP,即根據(jù)P的遞減曲線繪制的新P-R曲線的面積,如圖2-10紅色折線圖所示。圖2-10P-R曲線的繪制由分析可得,AP越接近于1,說明模型的效果越好,例如在理想情況下,所有樣本預測正確其負樣本沒有被錯誤預測為正樣本的情況下,可以算得P-R曲線為一條平行于R軸且P始終為1的線段,由此可以求得AP為1。由于本文所感興趣的目標類別并不單一,而且圖片中的類別也不單一,因此在對MaskR-CNN進行評價時不能僅用某一類別來衡量,或者僅使用一張
【參考文獻】:
期刊論文
[1]光流法及其在臨近預報中的應用[J]. 曹春燕,陳元昭,劉東華,李程,李輝,賀佳佳. 氣象學報. 2015(03)
[2]一種基于改進光流法的電子穩(wěn)像算法[J]. 程德強,郭政,劉潔,錢建生,張媛媛,張佳琳. 煤炭學報. 2015(03)
[3]基于光流法與特征統(tǒng)計的魚群異常行為檢測[J]. 于欣,侯曉嬌,盧煥達,余心杰,范良忠,劉鷹. 農(nóng)業(yè)工程學報. 2014(02)
[4]光流算法比較分析研究[J]. 張佳威,支瑞峰. 現(xiàn)代電子技術. 2013(13)
[5]運動細節(jié)估計的光流場方法[J]. 潘金山,蘇志勛,王偉. 計算機輔助設計與圖形學學報. 2011(08)
博士論文
[1]月球車立體視覺與視覺導航方法研究[D]. 侯建.哈爾濱工業(yè)大學 2007
碩士論文
[1]基于雙目立體視覺的不規(guī)則物體體積測量方法研究[D]. 梁樂.西安理工大學 2019
[2]雙目視覺機器人的目標識別與抓取技術研究[D]. 毛孟娜.沈陽工業(yè)大學 2019
[3]基于立體視覺的可見光通信室內(nèi)定位技術研究與實現(xiàn)[D]. 于朋鑫.北京郵電大學 2019
[4]基于雙目立體視覺的玉米葉片識別與定位[D]. 田東旭.吉林大學 2018
[5]基于雙目視覺的移動充電車的設計與實現(xiàn)[D]. 杜鶴峰.西安電子科技大學 2018
[6]基于雙目視覺的巡視機器人避障研究[D]. 倪晨陽.天津大學 2018
[7]基于雙目立體視覺的心臟軟組織三維重構技術研究[D]. 馬波濤.電子科技大學 2017
[8]基于智能手機的車輛檢測與車距測量[D]. 顧兆倫.浙江大學 2017
[9]基于雙目立體視覺的眼球突出度測量方法研究[D]. 張帥.北京交通大學 2016
本文編號:3270363
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3270363.html
最近更新
教材專著