天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于YOLOv3剪枝模型的姿態(tài)和步態(tài)識(shí)別算法研究

發(fā)布時(shí)間:2021-04-15 01:24
  在計(jì)算機(jī)視覺(jué)的模式識(shí)別中,目標(biāo)檢測(cè)是一個(gè)非常具有挑戰(zhàn)性并且極具現(xiàn)實(shí)意義的的研究方向。多人姿態(tài)估計(jì)作為計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要組成部分,也影響著很多其它研究方向,包括但不限于人機(jī)交互、體感技術(shù)等。隨著當(dāng)下全球化的趨勢(shì)愈加明顯,安全問(wèn)題也日益嚴(yán)峻,相比較于其它用于偽裝身份的方法,步態(tài)由于其不可偽裝性、遠(yuǎn)距離性等特點(diǎn)成為了當(dāng)下各國(guó)安全的研究重點(diǎn)。近年來(lái),隨著計(jì)算機(jī)軟硬件的大力發(fā)展和數(shù)據(jù)量的爆炸式增長(zhǎng),深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域表現(xiàn)十分優(yōu)異,基于深度學(xué)習(xí)的多人姿態(tài)估計(jì)和步態(tài)識(shí)別方法也在各個(gè)領(lǐng)域發(fā)揮出重要的作用。論文首先介紹了多人姿態(tài)估計(jì)和步態(tài)識(shí)別技術(shù)的研究背景和意義,詳細(xì)闡述了國(guó)內(nèi)外的研究現(xiàn)狀,包括主流的步態(tài)識(shí)別算法,并對(duì)當(dāng)前技術(shù)存在的問(wèn)題進(jìn)行了分析;隨著卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)在計(jì)算機(jī)領(lǐng)域的大放光彩,論文仔細(xì)介紹了深度學(xué)習(xí)的基本理論知識(shí)和重要概念。本文主要展開(kāi)了以下兩方面的工作和創(chuàng)新:(1)首先提出了基于YOLOv3(You Only Look Once v3)的多人姿態(tài)估計(jì)算法(YOLO Pose Estimator,YLPE),針對(duì)算法存在的參數(shù)量過(guò)大和計(jì)算冗余等問(wèn)題,進(jìn)一步提出了基于模型剪... 

【文章來(lái)源】:杭州電子科技大學(xué)浙江省

【文章頁(yè)數(shù)】:61 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于YOLOv3剪枝模型的姿態(tài)和步態(tài)識(shí)別算法研究


論文完整內(nèi)容結(jié)構(gòu)框圖

結(jié)構(gòu)圖,神經(jīng)網(wǎng)絡(luò),人工神經(jīng)網(wǎng)絡(luò),神經(jīng)元


7第2章深度學(xué)習(xí)及步態(tài)識(shí)別相關(guān)概念2.1深度學(xué)習(xí)概述深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它的概念起源于人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN),人工神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)、推薦系統(tǒng)、語(yǔ)音識(shí)別及自然語(yǔ)言處理(Naturallanguageprocessing,NLP)領(lǐng)域都發(fā)揮著巨大的作用。上個(gè)世紀(jì)九十年代,隨著計(jì)算機(jī)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)受到了學(xué)術(shù)界與工業(yè)界的關(guān)注與青睞。隨著對(duì)人工神經(jīng)網(wǎng)絡(luò)的進(jìn)一步研究發(fā)現(xiàn),ANN存在著模型參數(shù)過(guò)于龐大、訓(xùn)練極容易出現(xiàn)過(guò)擬合等缺點(diǎn),所以雖然ANN在訓(xùn)練集上能取得較好精度,但在測(cè)試集上表現(xiàn)難以達(dá)到預(yù)期。人工神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖2.1。圖2.1基本神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖中每個(gè)圓形單元代表人工神經(jīng)元,神經(jīng)元包含有3部分,分別為:非線性激活函數(shù)f、權(quán)重W和偏置b。神經(jīng)元輸出值T可以通過(guò)式(2.1)得到,其中x為神經(jīng)元的輸入:T=f(Wx+b)(2.1)2006年,Hinton教授[46]在《Science》上首次提出了深度學(xué)習(xí)的概念。深度學(xué)習(xí)(DeepLearning,DL)的核心也就是深度神經(jīng)網(wǎng)絡(luò),深度神經(jīng)網(wǎng)絡(luò)在保留了人工神經(jīng)網(wǎng)絡(luò)大多數(shù)特點(diǎn)的基礎(chǔ)上進(jìn)行了適當(dāng)改進(jìn),重點(diǎn)在于以下幾方面:(1)網(wǎng)絡(luò)結(jié)構(gòu)層數(shù)較深,神經(jīng)元和隱藏層較多,原則上可以無(wú)限加深網(wǎng)絡(luò)層數(shù)。(2)可以將大量原始數(shù)據(jù)直接輸入。(3)可實(shí)現(xiàn)多層次的表征和概念抽象層次。近年來(lái),隨著計(jì)算機(jī)軟硬件的飛速發(fā)展,使得需要高算力的深度學(xué)習(xí)成為當(dāng)下學(xué)術(shù)界和工業(yè)界的關(guān)注重點(diǎn)。2012年,Alex[47]提出了基于卷積神經(jīng)網(wǎng)絡(luò)的AlexNet,在ILSVRC2012比賽中以低于第二名9.8%的誤檢率奪得冠軍,并開(kāi)辟了卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)識(shí)別領(lǐng)域的應(yīng)用。

卷積,神經(jīng)網(wǎng)絡(luò)


82014年,牛津大學(xué)的VisualGeomentryGroup提出了VGGNet[48],該網(wǎng)絡(luò)較為主流的版本有VGG-16網(wǎng)絡(luò)及VGG-19網(wǎng)絡(luò),通過(guò)反復(fù)疊加22的最大池化層和33的卷積核,在ILSVRC2014取得了第二名的成績(jī),同時(shí)通過(guò)可自定義卷積神經(jīng)網(wǎng)絡(luò)層數(shù)的思想,詳細(xì)探索了網(wǎng)絡(luò)深度與特征提取性能之間的關(guān)系,。He[49]等人在2015年利用殘差模塊(Residual)的思想提出了ResNet,在ILSVRC2015中取得了圖像分類和物體識(shí)別的最優(yōu)錯(cuò)誤率并奪得了冠軍,殘差網(wǎng)絡(luò)的核心思想就是將特征提取過(guò)程中的反復(fù)連乘過(guò)程改變?yōu)檫B加過(guò)程,從而較好的解決了特征退化問(wèn)題。常見(jiàn)的ResNet網(wǎng)絡(luò)有ResNet-50、ResNet-101等。2.1.1卷積神經(jīng)網(wǎng)絡(luò)在基本的人工神經(jīng)網(wǎng)絡(luò)框架中,下一層神經(jīng)元的輸入是上一層所有神經(jīng)元的輸出,但是隨著神經(jīng)網(wǎng)絡(luò)的加深帶來(lái)的計(jì)算性能代價(jià)使基本的人工神經(jīng)網(wǎng)絡(luò)框架不具有現(xiàn)實(shí)可行性。為了解決這個(gè)問(wèn)題,卷積神經(jīng)網(wǎng)絡(luò)引入了卷積層(Convolutional,Cov)從而避免大量計(jì)算消耗,并在圖像識(shí)別領(lǐng)域展現(xiàn)出了非常優(yōu)秀的發(fā)展前景。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖2.2所示。圖2.2含有卷積層的卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)1998年,隨著LeNet-5[50]的提出,標(biāo)志著卷積神經(jīng)網(wǎng)絡(luò)的真正面世,LeNet-5的具體網(wǎng)絡(luò)結(jié)構(gòu)如圖2.3所示。圖2.3LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)


本文編號(hào):3138390

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3138390.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶86756***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com