面向運動員場景的實時檢測算法研究
發(fā)布時間:2021-02-21 15:18
隨著大數(shù)據(jù)的出現(xiàn)以及硬件的不斷迭代更新,使得深度學習在目標檢測領(lǐng)域取得了突破性進展。目前,智能機器人,無人駕駛系統(tǒng),客流統(tǒng)計已成為相關(guān)行業(yè)的重點研究方向,基于視覺的行人檢測是其中的關(guān)鍵技術(shù)。與街道行人,室內(nèi)行人等行人檢測相比,運動場上的球員檢測一直沒有被重視起來,球員檢測可以定位球員,與姿態(tài)識別,視頻追蹤結(jié)合,可以在某種程度上取代裁判執(zhí)行獎懲機制,更具有公正效益。本文以運動場上運動員為背景,改進深度學習算法,對高分辨率小目標實時檢測的相關(guān)算法展開研究。主要研究內(nèi)容如下:在圖像輸入部分,本文提出新的圖像分塊與合并算法去處理輸入圖像,把整張高分辨率的圖像劃分成不同大小的小塊,提高訓練模型時輸入圖像分辨率,采用存儲圖像塊索引的方式合并圖像塊,采用類IoU的方式合并大于設(shè)定閾值的檢測框,提升檢測召回率。與此同時,嘗試分別使用改進的Retinanet和單階段的Yolov2網(wǎng)絡(luò),做速度性能的對比,挖掘新方向,其中使用Yolov2算法模型可以在精確率和召回率略有降低的情況下提升對高分辨率圖像的檢測速度。在對特征提取部分,本文以Retinanet結(jié)構(gòu)網(wǎng)絡(luò)為基礎(chǔ),提出了使用逐通道逐點卷積的卷積層設(shè)計Xc...
【文章來源】:東北大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
圖1.3整體框架圖??Fig.?1.3?The?Framwork??本文的研宄為基于深度學習的高分辨率實時檢測行人算法的研宂,本文章節(jié)安??排如下:??第1章,緒論
絡(luò)框架主要有ResNet[42]系列,DenseNet[43]系列,Inception#??叫系列,一些基于移動端而設(shè)計的輕量級網(wǎng)絡(luò)結(jié)構(gòu)ShuffleNet^481、MobileNe#9’5()]、??SqueneezeNet?[川。??2.1.1?ResNet?系歹lj??在計算機視覺里,神經(jīng)網(wǎng)絡(luò)越深,圖像的語義信息越豐富,但由于激活函數(shù)還??有硬件條件的限制,網(wǎng)絡(luò)并不是越深越好,隨著網(wǎng)絡(luò)梯度的加深會在某種程度上引??起梯度彌散和梯度爆炸,導致神經(jīng)網(wǎng)絡(luò)訓練困難,訓練結(jié)果無法收斂。如圖2.1所??示,設(shè)定3個神經(jīng)元,輸入為一數(shù)據(jù)集合,輸出為結(jié)果,每個神經(jīng)元使用非線性激??活函數(shù)。??y??圖2.1神經(jīng)元模型??Fig.2.1?Neuron?model??關(guān)于上圖的表達式可以寫成式2.1的形式,其中函數(shù)/代表著一類激活函數(shù)。??/(^1)?=?h?(w3/2?(w2/i?(w,)))?(2.1)??若要對wl求梯度,根據(jù)鏈式求導法則,得到的解為:??(2.2)??8/2?3?dfx?2?;??-7?-??
很大,形成梯度爆炸。這個問題在很大程??度上己經(jīng)被batch?normalization解決的很好,繼而研宄工作者們都在加深網(wǎng)絡(luò)上做??實驗。??在加深網(wǎng)絡(luò)的過程中,在訓練集上會有更高的錯誤率,所以更深的網(wǎng)絡(luò)沒有過??擬合,也就是更深的網(wǎng)絡(luò)效果并不是很好,因為網(wǎng)絡(luò)沒有訓練好,因為在網(wǎng)絡(luò)越來??越深的時候,反傳回來的梯度之間的相關(guān)性會越來越差,最后接近白噪聲。因為我??們知道圖像是具備局部相關(guān)性的,那其實可以認為梯度也具備局部相關(guān)性,ResNet??結(jié)構(gòu)在保持梯度相關(guān)性方面很優(yōu)秀,如圖2.2所示,直接往深層映射特征導致網(wǎng)絡(luò)??難以學習,殘差塊(residualblock)就是在標準的卷積結(jié)構(gòu)上,通過在一個淺層網(wǎng)??絡(luò)基礎(chǔ)上疊加y?=?x?(identitymappings,恒等映射),可以讓網(wǎng)絡(luò)隨深度增加而不??退化。??256-d???5???1x1,64???Y^???Weight?re,u???layer??±???relu?X?3x3,64???1?^identity?|?relu??Weight?,r??F(x)?layer? ̄ ̄ ̄ ̄?????1x1,256??F(x)+x????relU?relu??T??圖2.2卷積網(wǎng)絡(luò)殘差塊??Fig.?2.2?ResNet?block??如圖2.2左,通過shortcut對x做一個恒等變換,加到經(jīng)過卷積之后的下一??層:??H(x)?=?F(x)?+?x?(2.3)??-8?-??
【參考文獻】:
期刊論文
[1]基于強化深度特征融合的行人再識別算法研究[J]. 李佳麗,郭捷. 信息技術(shù). 2018(07)
[2]基于Adaboost算法的行人檢測方法[J]. 郭烈,王榮本,張明恒,金立生. 計算機工程. 2008(03)
博士論文
[1]基于淺層學習引導深度學習的行人檢測[D]. 劉弋鋒.武漢大學 2016
[2]足球視頻內(nèi)容分析關(guān)鍵技術(shù)研究[D]. 白雪峰.哈爾濱工業(yè)大學 2014
本文編號:3044536
【文章來源】:東北大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
圖1.3整體框架圖??Fig.?1.3?The?Framwork??本文的研宄為基于深度學習的高分辨率實時檢測行人算法的研宂,本文章節(jié)安??排如下:??第1章,緒論
絡(luò)框架主要有ResNet[42]系列,DenseNet[43]系列,Inception#??叫系列,一些基于移動端而設(shè)計的輕量級網(wǎng)絡(luò)結(jié)構(gòu)ShuffleNet^481、MobileNe#9’5()]、??SqueneezeNet?[川。??2.1.1?ResNet?系歹lj??在計算機視覺里,神經(jīng)網(wǎng)絡(luò)越深,圖像的語義信息越豐富,但由于激活函數(shù)還??有硬件條件的限制,網(wǎng)絡(luò)并不是越深越好,隨著網(wǎng)絡(luò)梯度的加深會在某種程度上引??起梯度彌散和梯度爆炸,導致神經(jīng)網(wǎng)絡(luò)訓練困難,訓練結(jié)果無法收斂。如圖2.1所??示,設(shè)定3個神經(jīng)元,輸入為一數(shù)據(jù)集合,輸出為結(jié)果,每個神經(jīng)元使用非線性激??活函數(shù)。??y??圖2.1神經(jīng)元模型??Fig.2.1?Neuron?model??關(guān)于上圖的表達式可以寫成式2.1的形式,其中函數(shù)/代表著一類激活函數(shù)。??/(^1)?=?h?(w3/2?(w2/i?(w,)))?(2.1)??若要對wl求梯度,根據(jù)鏈式求導法則,得到的解為:??(2.2)??8/2?3?dfx?2?;??-7?-??
很大,形成梯度爆炸。這個問題在很大程??度上己經(jīng)被batch?normalization解決的很好,繼而研宄工作者們都在加深網(wǎng)絡(luò)上做??實驗。??在加深網(wǎng)絡(luò)的過程中,在訓練集上會有更高的錯誤率,所以更深的網(wǎng)絡(luò)沒有過??擬合,也就是更深的網(wǎng)絡(luò)效果并不是很好,因為網(wǎng)絡(luò)沒有訓練好,因為在網(wǎng)絡(luò)越來??越深的時候,反傳回來的梯度之間的相關(guān)性會越來越差,最后接近白噪聲。因為我??們知道圖像是具備局部相關(guān)性的,那其實可以認為梯度也具備局部相關(guān)性,ResNet??結(jié)構(gòu)在保持梯度相關(guān)性方面很優(yōu)秀,如圖2.2所示,直接往深層映射特征導致網(wǎng)絡(luò)??難以學習,殘差塊(residualblock)就是在標準的卷積結(jié)構(gòu)上,通過在一個淺層網(wǎng)??絡(luò)基礎(chǔ)上疊加y?=?x?(identitymappings,恒等映射),可以讓網(wǎng)絡(luò)隨深度增加而不??退化。??256-d???5???1x1,64???Y^???Weight?re,u???layer??±???relu?X?3x3,64???1?^identity?|?relu??Weight?,r??F(x)?layer? ̄ ̄ ̄ ̄?????1x1,256??F(x)+x????relU?relu??T??圖2.2卷積網(wǎng)絡(luò)殘差塊??Fig.?2.2?ResNet?block??如圖2.2左,通過shortcut對x做一個恒等變換,加到經(jīng)過卷積之后的下一??層:??H(x)?=?F(x)?+?x?(2.3)??-8?-??
【參考文獻】:
期刊論文
[1]基于強化深度特征融合的行人再識別算法研究[J]. 李佳麗,郭捷. 信息技術(shù). 2018(07)
[2]基于Adaboost算法的行人檢測方法[J]. 郭烈,王榮本,張明恒,金立生. 計算機工程. 2008(03)
博士論文
[1]基于淺層學習引導深度學習的行人檢測[D]. 劉弋鋒.武漢大學 2016
[2]足球視頻內(nèi)容分析關(guān)鍵技術(shù)研究[D]. 白雪峰.哈爾濱工業(yè)大學 2014
本文編號:3044536
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3044536.html
最近更新
教材專著