天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于CNN與OSELM的手勢識別方法

發(fā)布時間:2020-10-12 01:44
   隨著人工智能的不斷深入研究,人機交互越來越火熱,計算機視覺逐漸成為當下研究的主流,越來越多的人加入到研究人機交互的領域。不同的研究者對不同交互手段進行了研究,例如人臉,手勢,身體姿勢等。研究人機交互的主要媒介是研究不同的卷積神經網絡(Convolutional Neural Network,CNN),或是搭配不同的機器學習方法。在手勢識別領域的研究歷程中,傳統的方法是通過對手勢的分割,將手勢從圖片中分割出來,提取手勢的Hu矩特征以及手指個數描述輪廓等信息,將這些提取到的信息置于BP神經網絡進行訓練識別。這種方法在識別的準確率上稍微有所欠缺。本文提出將卷積神經網絡與在線順序極限學習機(Online Sequential Extreme Learning Machine,OSELM)相結合的方法,以達到高識別率的效果。為此做出以下的工作:首先,對需要研究的課題準備好訓練數據集,研究的內容采用自制手勢訓練集,同時在JTD靜態(tài)手勢數據集上做驗證實驗,提高算法的魯棒性。在手勢的特征提取方面,采用類似VGG16的卷積神經網絡模型,對手勢數據集做訓練同時提取手勢特征。其次,將提取到的手勢特征值置于在線順序極限學習機中訓練識別,對比了不同的分類算法,比較不同分類算法在識別正確率方面的高低。同時分析了在線順序極限學習機在不同大小樣本上相對于其他分類算法有著更快的訓練速度和更高的識別率,為手勢識別提供了更加豐富的數據形式。通過實驗數據的對比,本文提出將卷積神經網絡與在線順序極限學習機相結合的方法應用到手勢識別中比單純的使用卷積神經網絡具有更高的識別準確率,在不同大小的數據上也具有更強的適用性。最后,基于本文提出的算法,開發(fā)了手勢識別系統。將算法應用到實際生活中,實現算法的落地應用。將算法與游戲動畫相結合,以實際應用驗證本文提出算法的實用性。
【學位單位】:合肥工業(yè)大學
【學位級別】:碩士
【學位年份】:2019
【中圖分類】:TP391.41;TP18
【部分圖文】:

網絡結構圖,網絡結構


2.4 神經網絡模型舉例卷積神經網絡經過數十年的發(fā)展,網絡的結果也在不斷的改進,識別的準確率也在不斷的增加。同時帶來的網絡的復雜度也在不斷增加,我們在實際應用中,需要根據自己的數據集采用適合自己的網絡結果。深度太深,網絡太過復雜帶來的計算量也是巨大的,得到的效果適得其反。下面簡單介紹幾個常見的卷積神經網絡模型:(1) LeNet 網絡LeCun[49]等人 1998 年在 IEEE 上發(fā)表的論文,正式拉開了卷積神經網絡的序幕。LeCun 提出這個網絡的初始作用是用來識別像素為 32x32 的手寫數字圖像。該網絡包含輸入層,以及其他的七層網絡層。如圖 2.7 所示,輸入的手寫字母“A”的初始大小為 32x32,經過卷積層(Convolutions)計算,池化層作用(Subsamping)輸出特征值矩陣的大小為 14x14。再經過一輪卷積池化的作用特征矩陣的大小變?yōu)?5x5。最后將矩陣“平鋪”成一維數據放入全連接層訓練。這種網絡結構在手寫數據訓練集上取得了相當好的結果,為后來卷積神經網絡的發(fā)展奠定了基礎。

網絡結構圖,網絡結構


圖 2. 8AlexNet 網絡結構Fig 2. 8 AlexNet network structure如圖 2.8所示,AlexNet 網絡與 LeNet 網絡在一定程度上有很多相似的地方。從結構上可以直觀的看出 AlexNet 網絡有兩條通道,這是由于當時顯卡容量的問題,無法滿足 AlexNet 網絡的 60M 個參數在同一張顯卡上運算。從圖中的第二個最大池化層(Max pooling)可以看出上下兩部分進行了數據的交互,在最后匯總到大小為 1000 的 SoftMax 層輸出。由于 AlexNet 網絡在 ILSVRC 數據集上做 1000 分類,涉及數據量之大,參數之多。在訓練的時候必然會遇到過擬合的問題。在這個問題上 AlexNet 網絡采用了數據增強和隨機失活(Dropout)手段。數據增強的方式一般是增大數據量。Dropout 的原理就是以 0.5 的概率將每個隱層神經元的輸出設置為零。以這種方式“dropped out”的神經元既不參與前向傳播,也不參與反向傳播。所以每次提出一個輸入,該神經網絡就嘗試一個不同的結構,但是所有這些結構之間共享權重。因為神經元不能依賴于其他特定神經元而存在,所以這種技術降低了神經元復雜的互適應關系。

手勢,訓練集


圖 3.5 手勢訓練集Fig 3.5 Gesture Training Set.2 卷積神經網絡模型介紹卷積神經網絡在圖像的分類上具有優(yōu)秀的表現[56],采用神經網絡提取圖像征具有深刻的研究價值。神經網絡對圖像特征提取以及后面的對特征值的訓類識別都具有良好的表現。.2.1 網絡結構本文對手勢識別方法中神經網絡結構采用類似 VGGNet 網絡模型,這種模優(yōu)良性能在第二章的 2.4 小節(jié)中已介紹。VGGNet 網絡的優(yōu)勢在于雙卷積模以極大程度的解決過擬合問題[57]。本文采用的神經網絡框架借鑒 VGGNet模型,如圖3.6所示,從圖中可以清楚的看出由紅藍兩個虛線平行四邊形組成色虛線平行四邊形采用的類似 VGGNet 網絡結構,兩個卷積層和一個池化層組,共三組,包含六層卷積層(Conv)、三層最大池化層(Pooling)和一個
【參考文獻】

相關期刊論文 前6條

1 VanBang L E;朱煜;趙江坤;陳寧;;基于深度圖像HOG特征的實時手勢識別方法[J];華東理工大學學報(自然科學版);2015年05期

2 蔡娟;蔡堅勇;廖曉東;黃海濤;丁僑俊;;基于卷積神經網絡的手勢識別初探[J];計算機系統應用;2015年04期

3 劉云龍;高存臣;任啟峰;郭真真;;水下機器人基于sigmoid函數的軟變結構控制[J];電機與控制學報;2012年02期

4 李潔;柴天佑;宮經寬;;基于交叉熵算法的PID控制器設計[J];控制與決策;2011年05期

5 陳小平,石玉,于盛林;遺傳算法在前向神經網絡參數估計中的應用[J];電子測量與儀器學報;2001年02期

6 張衛(wèi)東,孫優(yōu)賢;基于Taylor展開的Smith預估器優(yōu)化設計[J];儀器儀表學報;1997年02期



本文編號:2837446

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2837446.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶234d8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com