基于Stacked Hourglass網(wǎng)絡(luò)的二維人體骨骼關(guān)鍵點(diǎn)檢測
發(fā)布時間:2021-08-27 04:38
駕駛員注意力不集中是導(dǎo)致交通事故發(fā)生的主要原因之一,基于計算機(jī)視覺的分心駕駛識別技術(shù)具有非侵入、成本低等優(yōu)勢,是目前相關(guān)研究的熱點(diǎn)和趨勢。本文利用基于計算機(jī)視覺的人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)獲取駕駛員上半身的姿態(tài),通過學(xué)習(xí)姿態(tài)信息幫助網(wǎng)絡(luò)識別駕駛員行為,F(xiàn)有人體骨骼關(guān)鍵點(diǎn)檢測算法對背景復(fù)雜、遮擋嚴(yán)重、像素過小等目標(biāo)的檢測效果差,本文通過對現(xiàn)有算法的改進(jìn)來解決上述問題,從而提高算法的精度和魯棒性,達(dá)到檢測駕駛員骨骼關(guān)鍵點(diǎn)的要求。本文主要研究內(nèi)容如下:(1)改進(jìn)了Faster R-CNN人物目標(biāo)檢測算法,首先針對現(xiàn)有行人檢測數(shù)據(jù)集在拍攝場景、樣本密度、遮擋場景等方面缺陷,制作了WiderPerson數(shù)據(jù)集;其次在Faster R-CNN的基礎(chǔ)上改進(jìn)Anchors尺寸和特征圖尺寸,增強(qiáng)RoI池化特征,設(shè)置忽略采樣區(qū)域,使用動態(tài)采用策略,從而提高了其在人物目標(biāo)檢測上的精度。(2)提出了一種改進(jìn)的人體骨骼關(guān)鍵點(diǎn)檢測算法,該算法在Stacked Hourglass網(wǎng)絡(luò)的基礎(chǔ)上添加空間變換網(wǎng)絡(luò)模塊,解決Stacked Hourglass網(wǎng)絡(luò)對人物目標(biāo)檢測位置敏感問題,同時使用難樣本挖掘均方差損失函數(shù),提高...
【文章來源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
人體骨骼關(guān)鍵點(diǎn)示意圖
南京航空航天大學(xué)碩士學(xué)位論文建立、部位搜索空間的減小以及推理算法的優(yōu)化等四個方面。兩種方法對早期的人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)的發(fā)展起了重大推進(jìn)作用,但是、魯棒性不足等缺陷,一度導(dǎo)致人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)的發(fā)展陷入瓶頸之習(xí)的發(fā)展,人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)也迎來了新的春天。由于深度學(xué)習(xí)表現(xiàn)對人體骨骼關(guān)鍵點(diǎn)檢測算法的研究進(jìn)一步深入,研究內(nèi)容主要分為二維人體和三維人體骨骼關(guān)鍵點(diǎn)檢測[15]。維人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)在研究方向上分為兩大類:骨骼關(guān)鍵點(diǎn)檢測算法點(diǎn)檢測框架研究,如圖 1.2 所示。其中,對骨骼關(guān)鍵點(diǎn)檢測框架的研究上,和由底而上兩種[16]。
網(wǎng)絡(luò)最后會連接一層或多層全連接層,通過全連接層將特征映射利用損失函數(shù)計算損失。在有些任務(wù)(例如語義分割、人體骨骼關(guān)鍵點(diǎn)檢中使用上采樣層,主要原因是這些任務(wù)不但需要高階的特征,同時還需要到高階特征和低階特征的尺度不同,在進(jìn)行高、低特征融合時,需要將小采樣。卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時,首先要對網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)(如權(quán)重、偏置然后訓(xùn)練樣本通過網(wǎng)絡(luò)進(jìn)行前向傳播,層層計算后由損失函數(shù)得到損失值反向傳播的方式對學(xué)習(xí)參數(shù)進(jìn)行更新。重復(fù)迭代,當(dāng)損失函數(shù)計算的誤差完成訓(xùn)練。積與池化層是卷積神經(jīng)網(wǎng)絡(luò)中最基本的組成部分。卷積層的計算示例如圖 2.1 所示的特征圖;灰色部分填入的值都是零,稱為補(bǔ)零操作,目的是調(diào)整輸出的核的大小是3 3,可以看作是一個滑動窗口,滑動步長是 2,從左到右、;瑒舆^程中,將窗口內(nèi)的特征圖中的值和卷積核對應(yīng)的值相乘,然后求作為輸出特征圖對應(yīng)位置的值。
【參考文獻(xiàn)】:
期刊論文
[1]基于反向雙目識別的駕駛員分心檢測[J]. 王冠,李振龍. 科學(xué)技術(shù)與工程. 2018(17)
[2]駕駛?cè)朔中臓顟B(tài)判別支持向量機(jī)模型優(yōu)化算法[J]. 張輝,錢大琳,邵春福,錢振偉,菅美英. 交通運(yùn)輸系統(tǒng)工程與信息. 2018(01)
[3]二維人體姿態(tài)估計研究進(jìn)展[J]. 韓貴金,沈建冬. 西安郵電大學(xué)學(xué)報. 2017(04)
[4]基于面部行為分析的駕駛員疲勞檢測方法[J]. 耿磊,袁菲,肖志濤,張芳,吳駿,李月龍. 計算機(jī)工程. 2018(01)
[5]基于腦電分析的連續(xù)駕駛疲勞高發(fā)時間判斷[J]. 李君羨,潘曉東. 交通科學(xué)與工程. 2012(04)
[6]Hough算法在圖像處理中的應(yīng)用[J]. 鐘彩,文密. 信息通信. 2012(06)
[7]遺傳算法研究進(jìn)展[J]. 馬永杰,云文霞. 計算機(jī)應(yīng)用研究. 2012(04)
[8]疲勞駕駛的腦電特性探索[J]. 彭軍強(qiáng),吳平東,殷罡. 北京理工大學(xué)學(xué)報. 2007(07)
[9]前饋神經(jīng)網(wǎng)絡(luò)中的反向傳播算法及其改進(jìn):進(jìn)展與展望[J]. 劉曙光,鄭崇勛,劉明遠(yuǎn). 計算機(jī)科學(xué). 1996(01)
碩士論文
[1]基于機(jī)器視覺的自動驗(yàn)布系統(tǒng)研究與開發(fā)[D]. 張美杰.廣東工業(yè)大學(xué) 2018
[2]基于改進(jìn)TextBoxes的自然場景文本檢測算法[D]. 余崢.華東師范大學(xué) 2018
[3]基于神經(jīng)網(wǎng)絡(luò)的多源數(shù)據(jù)攻擊檢測研究與應(yīng)用[D]. 李志鵬.電子科技大學(xué) 2018
[4]基于人臉識別駕駛員疲勞檢測系統(tǒng)設(shè)計與開發(fā)[D]. 才博.大連理工大學(xué) 2016
[5]考慮駕駛員生物電信號的疲勞駕駛檢測方法研究[D]. 薛雷.吉林大學(xué) 2015
[6]針對靜態(tài)圖像的人體姿態(tài)估計[D]. 丁肖.遼寧大學(xué) 2015
本文編號:3365663
【文章來源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
人體骨骼關(guān)鍵點(diǎn)示意圖
南京航空航天大學(xué)碩士學(xué)位論文建立、部位搜索空間的減小以及推理算法的優(yōu)化等四個方面。兩種方法對早期的人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)的發(fā)展起了重大推進(jìn)作用,但是、魯棒性不足等缺陷,一度導(dǎo)致人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)的發(fā)展陷入瓶頸之習(xí)的發(fā)展,人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)也迎來了新的春天。由于深度學(xué)習(xí)表現(xiàn)對人體骨骼關(guān)鍵點(diǎn)檢測算法的研究進(jìn)一步深入,研究內(nèi)容主要分為二維人體和三維人體骨骼關(guān)鍵點(diǎn)檢測[15]。維人體骨骼關(guān)鍵點(diǎn)檢測技術(shù)在研究方向上分為兩大類:骨骼關(guān)鍵點(diǎn)檢測算法點(diǎn)檢測框架研究,如圖 1.2 所示。其中,對骨骼關(guān)鍵點(diǎn)檢測框架的研究上,和由底而上兩種[16]。
網(wǎng)絡(luò)最后會連接一層或多層全連接層,通過全連接層將特征映射利用損失函數(shù)計算損失。在有些任務(wù)(例如語義分割、人體骨骼關(guān)鍵點(diǎn)檢中使用上采樣層,主要原因是這些任務(wù)不但需要高階的特征,同時還需要到高階特征和低階特征的尺度不同,在進(jìn)行高、低特征融合時,需要將小采樣。卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時,首先要對網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)(如權(quán)重、偏置然后訓(xùn)練樣本通過網(wǎng)絡(luò)進(jìn)行前向傳播,層層計算后由損失函數(shù)得到損失值反向傳播的方式對學(xué)習(xí)參數(shù)進(jìn)行更新。重復(fù)迭代,當(dāng)損失函數(shù)計算的誤差完成訓(xùn)練。積與池化層是卷積神經(jīng)網(wǎng)絡(luò)中最基本的組成部分。卷積層的計算示例如圖 2.1 所示的特征圖;灰色部分填入的值都是零,稱為補(bǔ)零操作,目的是調(diào)整輸出的核的大小是3 3,可以看作是一個滑動窗口,滑動步長是 2,從左到右、;瑒舆^程中,將窗口內(nèi)的特征圖中的值和卷積核對應(yīng)的值相乘,然后求作為輸出特征圖對應(yīng)位置的值。
【參考文獻(xiàn)】:
期刊論文
[1]基于反向雙目識別的駕駛員分心檢測[J]. 王冠,李振龍. 科學(xué)技術(shù)與工程. 2018(17)
[2]駕駛?cè)朔中臓顟B(tài)判別支持向量機(jī)模型優(yōu)化算法[J]. 張輝,錢大琳,邵春福,錢振偉,菅美英. 交通運(yùn)輸系統(tǒng)工程與信息. 2018(01)
[3]二維人體姿態(tài)估計研究進(jìn)展[J]. 韓貴金,沈建冬. 西安郵電大學(xué)學(xué)報. 2017(04)
[4]基于面部行為分析的駕駛員疲勞檢測方法[J]. 耿磊,袁菲,肖志濤,張芳,吳駿,李月龍. 計算機(jī)工程. 2018(01)
[5]基于腦電分析的連續(xù)駕駛疲勞高發(fā)時間判斷[J]. 李君羨,潘曉東. 交通科學(xué)與工程. 2012(04)
[6]Hough算法在圖像處理中的應(yīng)用[J]. 鐘彩,文密. 信息通信. 2012(06)
[7]遺傳算法研究進(jìn)展[J]. 馬永杰,云文霞. 計算機(jī)應(yīng)用研究. 2012(04)
[8]疲勞駕駛的腦電特性探索[J]. 彭軍強(qiáng),吳平東,殷罡. 北京理工大學(xué)學(xué)報. 2007(07)
[9]前饋神經(jīng)網(wǎng)絡(luò)中的反向傳播算法及其改進(jìn):進(jìn)展與展望[J]. 劉曙光,鄭崇勛,劉明遠(yuǎn). 計算機(jī)科學(xué). 1996(01)
碩士論文
[1]基于機(jī)器視覺的自動驗(yàn)布系統(tǒng)研究與開發(fā)[D]. 張美杰.廣東工業(yè)大學(xué) 2018
[2]基于改進(jìn)TextBoxes的自然場景文本檢測算法[D]. 余崢.華東師范大學(xué) 2018
[3]基于神經(jīng)網(wǎng)絡(luò)的多源數(shù)據(jù)攻擊檢測研究與應(yīng)用[D]. 李志鵬.電子科技大學(xué) 2018
[4]基于人臉識別駕駛員疲勞檢測系統(tǒng)設(shè)計與開發(fā)[D]. 才博.大連理工大學(xué) 2016
[5]考慮駕駛員生物電信號的疲勞駕駛檢測方法研究[D]. 薛雷.吉林大學(xué) 2015
[6]針對靜態(tài)圖像的人體姿態(tài)估計[D]. 丁肖.遼寧大學(xué) 2015
本文編號:3365663
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/3365663.html
教材專著