基于車載視覺的行人檢測及行為識別
發(fā)布時間:2021-10-14 18:24
隨著車禍?zhǔn)鹿实闹鹉暝黾?以及計算機(jī)硬件性能的不斷提升和Ai在特定場景下的解決能力展現(xiàn)出超出人類的驚人表現(xiàn),用于分析車載駕駛系統(tǒng)的行人檢測和行為識別技術(shù)具有可觀的應(yīng)用前景。目前的行為識別技術(shù)的應(yīng)用大多是用于監(jiān)控場景,很少有研究將行為識別應(yīng)用到車載駕駛系統(tǒng)中。本文研究如何將行人檢測技術(shù)與行人的行為識別技術(shù)應(yīng)用到車輛駕駛中,實現(xiàn)一個動態(tài)4D(2D+時間+行為交互)的系統(tǒng)。本文主要內(nèi)容如下:(1)首先介紹卷積神經(jīng)網(wǎng)絡(luò)的基本組成和執(zhí)行原理,接著介紹基于深度學(xué)習(xí)的行人檢測技術(shù)和行為識別技術(shù),并且對不同技術(shù)進(jìn)行分析以及性能對比。然后詳細(xì)解析YOLOV3-TINY行人檢測算法,最后針對車載視覺的特定應(yīng)用場景對YOLOV3-TINY進(jìn)行優(yōu)化,包括針對計算行人的Anchors,對行人單類進(jìn)行重訓(xùn)練,優(yōu)化YOLOV3-TINY特征提取網(wǎng)絡(luò),增加YOLOV3-TINY預(yù)測尺度,通過目標(biāo)跟蹤提高行人檢測準(zhǔn)確性。(2)研究基于連續(xù)多幀圖像的行為識別,本部分首先是利用C3D模型對多幀圖片特征進(jìn)行提取,然后進(jìn)行分類。然后分別從激活函數(shù),網(wǎng)絡(luò)深度兩個方向?qū)W(wǎng)絡(luò)結(jié)構(gòu)提出優(yōu)化策略,并對優(yōu)化前后性能進(jìn)行對比,最后引入CNN設(shè)...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖 2-2 神經(jīng)元結(jié)構(gòu)神經(jīng)元輸入與一個或多個神經(jīng)元輸出相連,每個連接上帶有權(quán)對應(yīng)相乘相加后加上偏置信號得到總的輸入值,總的輸入值經(jīng)經(jīng)元的最終輸出[40]。函數(shù)神經(jīng)元的權(quán)值與偏置信號得到線性特征,激活函數(shù)能夠增加神,豐富神經(jīng)元的特征提取,解決線性不可分的問題[41]。常見的id 函數(shù),ReLU[19]函數(shù),Leaky ReLU[19]函數(shù)等,下面主要介紹本U 函數(shù),Leaky ReLU 函數(shù)。ReLU 函數(shù)公式為: ,00,0()xxxf x 函數(shù)屏蔽了小于 0 的輸出,缺點(diǎn)是訓(xùn)練過程中如果權(quán)值更新不再被激活,經(jīng)過這一單元的梯度將永久為 0,該神經(jīng)元“死
圖 2-3 卷積層與輸入層對應(yīng)關(guān)系*3 的卷積核按步長移動,生成含 4*4(6-3+1)個神經(jīng)元的參數(shù)稱為權(quán)值。用來簡化卷積層的輸出尺寸,常常接在卷積層后面,p 上面架一個局部窗口滑動,并且不再需要權(quán)值和偏置,池最大池化,另一種為平均池化,最大池化是將卷積層窗口的輸出,而平均池化是將卷積層窗口上的平均值作為輸出
【參考文獻(xiàn)】:
期刊論文
[1]基于Dropout的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)模型平均方法[J]. 程俊華,曾國輝,魯敦科,黃勃. 計算機(jī)應(yīng)用. 2019(06)
[2]基于反透視變換的車道線檢測算法[J]. 劉萍,孫耀航. 計算機(jī)與數(shù)字工程. 2019(03)
[3]基于Faster R-CNN和IoU優(yōu)化的實驗室人數(shù)統(tǒng)計與管理系統(tǒng)[J]. 盛恒,黃銘,楊晶晶. 計算機(jī)應(yīng)用. 2019(06)
[4]基于DSP平臺的實時視覺車輛檢測方法[J]. 王海,李誠,蔡英鳳,陳龍,何友國. 江蘇大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
[5]基于特征向量提取和SVM分類器的課堂人臉識別研究[J]. 黃麗媛,吳南壽,王雪花,曾亞光,韓定安,周月霞. 儀器儀表用戶. 2019(02)
[6]基于OPENPOSE的三維上肢康復(fù)系統(tǒng)[J]. 王懷宇,林艷萍,汪方. 機(jī)電一體化. 2018(09)
[7]一種基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)加速器設(shè)計與實現(xiàn)[J]. 仇越,馬文濤,柴志雷. 微電子學(xué)與計算機(jī). 2018(08)
[8]多特征級聯(lián)的低能見度環(huán)境紅外行人檢測方法[J]. 劉峰,王思博,王向軍,趙廣偉,霍文甲. 紅外與激光工程. 2018(06)
[9]行為識別技術(shù)的研究與發(fā)展[J]. 祁家榕,張昌偉. 智能計算機(jī)與應(yīng)用. 2017(04)
博士論文
[1]視頻中人體行為識別若干問題研究[D]. 裴利沈.電子科技大學(xué) 2016
碩士論文
[1]基于因子得分的K-Means聚類算法的我國P2P網(wǎng)貸平臺信用評級研究[D]. 朱正皓.浙江財經(jīng)大學(xué) 2019
[2]基于機(jī)器視覺的行人檢測技術(shù)研究[D]. 馮偲.長春工業(yè)大學(xué) 2017
[3]基于數(shù)據(jù)挖掘技術(shù)的臺區(qū)線損計算方法研究[D]. 李亞.華北電力大學(xué)(北京) 2017
[4]基于DSP的道路前方車輛識別算法研究[D]. 韻卓.吉林大學(xué) 2014
本文編號:3436627
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖 2-2 神經(jīng)元結(jié)構(gòu)神經(jīng)元輸入與一個或多個神經(jīng)元輸出相連,每個連接上帶有權(quán)對應(yīng)相乘相加后加上偏置信號得到總的輸入值,總的輸入值經(jīng)經(jīng)元的最終輸出[40]。函數(shù)神經(jīng)元的權(quán)值與偏置信號得到線性特征,激活函數(shù)能夠增加神,豐富神經(jīng)元的特征提取,解決線性不可分的問題[41]。常見的id 函數(shù),ReLU[19]函數(shù),Leaky ReLU[19]函數(shù)等,下面主要介紹本U 函數(shù),Leaky ReLU 函數(shù)。ReLU 函數(shù)公式為: ,00,0()xxxf x 函數(shù)屏蔽了小于 0 的輸出,缺點(diǎn)是訓(xùn)練過程中如果權(quán)值更新不再被激活,經(jīng)過這一單元的梯度將永久為 0,該神經(jīng)元“死
圖 2-3 卷積層與輸入層對應(yīng)關(guān)系*3 的卷積核按步長移動,生成含 4*4(6-3+1)個神經(jīng)元的參數(shù)稱為權(quán)值。用來簡化卷積層的輸出尺寸,常常接在卷積層后面,p 上面架一個局部窗口滑動,并且不再需要權(quán)值和偏置,池最大池化,另一種為平均池化,最大池化是將卷積層窗口的輸出,而平均池化是將卷積層窗口上的平均值作為輸出
【參考文獻(xiàn)】:
期刊論文
[1]基于Dropout的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)模型平均方法[J]. 程俊華,曾國輝,魯敦科,黃勃. 計算機(jī)應(yīng)用. 2019(06)
[2]基于反透視變換的車道線檢測算法[J]. 劉萍,孫耀航. 計算機(jī)與數(shù)字工程. 2019(03)
[3]基于Faster R-CNN和IoU優(yōu)化的實驗室人數(shù)統(tǒng)計與管理系統(tǒng)[J]. 盛恒,黃銘,楊晶晶. 計算機(jī)應(yīng)用. 2019(06)
[4]基于DSP平臺的實時視覺車輛檢測方法[J]. 王海,李誠,蔡英鳳,陳龍,何友國. 江蘇大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
[5]基于特征向量提取和SVM分類器的課堂人臉識別研究[J]. 黃麗媛,吳南壽,王雪花,曾亞光,韓定安,周月霞. 儀器儀表用戶. 2019(02)
[6]基于OPENPOSE的三維上肢康復(fù)系統(tǒng)[J]. 王懷宇,林艷萍,汪方. 機(jī)電一體化. 2018(09)
[7]一種基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)加速器設(shè)計與實現(xiàn)[J]. 仇越,馬文濤,柴志雷. 微電子學(xué)與計算機(jī). 2018(08)
[8]多特征級聯(lián)的低能見度環(huán)境紅外行人檢測方法[J]. 劉峰,王思博,王向軍,趙廣偉,霍文甲. 紅外與激光工程. 2018(06)
[9]行為識別技術(shù)的研究與發(fā)展[J]. 祁家榕,張昌偉. 智能計算機(jī)與應(yīng)用. 2017(04)
博士論文
[1]視頻中人體行為識別若干問題研究[D]. 裴利沈.電子科技大學(xué) 2016
碩士論文
[1]基于因子得分的K-Means聚類算法的我國P2P網(wǎng)貸平臺信用評級研究[D]. 朱正皓.浙江財經(jīng)大學(xué) 2019
[2]基于機(jī)器視覺的行人檢測技術(shù)研究[D]. 馮偲.長春工業(yè)大學(xué) 2017
[3]基于數(shù)據(jù)挖掘技術(shù)的臺區(qū)線損計算方法研究[D]. 李亞.華北電力大學(xué)(北京) 2017
[4]基于DSP的道路前方車輛識別算法研究[D]. 韻卓.吉林大學(xué) 2014
本文編號:3436627
本文鏈接:http://sikaile.net/kejilunwen/qiche/3436627.html
最近更新
教材專著