基于關節(jié)數(shù)據(jù)和極限學習機的人體動作識別
1緒論
隨著計算機圖形學的快速發(fā)展,以及對物理學應用的進一步完善,人們制作出越來越多的和人體動作相關的視頻數(shù)據(jù),對視頻分類技術的需求也不斷增長。近年來,人體動作的識別在多個領域表現(xiàn)出廣闊的應用前景和研宄價值,其中基于關節(jié)數(shù)據(jù)的人體動作識別更是成為計算機視覺領域的研究熱點。在計算機視覺領域,人的動作和姿態(tài)由于其復雜性和多變性,一直得到重點關注。雖然視頻檢索和分類技術己經得到廣泛應用,但是人體動作的識別問題一直沒有得到很好的解決。首先人體骨豁數(shù)太多,每個骨豁又有多個自由度,使得人體動作的表現(xiàn)極其復雜,另外人體不同的活動可能有相似的動作,例如投籃和揮手這兩個動作,人的主觀判斷可以輕松地分辨出來,但是如果僅從肢體動作看,現(xiàn)有識別算法可能很難區(qū)分,上述問題亟待解決。本文基于兩種動作特征提取算法提出了一種新的組合特征,并結合極限學習機及其多種改進的變體,使人體動作的識別效果得到改善。本章后續(xù)內容將介紹本文實驗使用的數(shù)據(jù)的兩種捕捉技術、人體動作識別的研宄現(xiàn)狀、極限學習機的基本思想及文章組織結構。
........
2運動捕捉數(shù)據(jù)的表示及動作特征的提取
2.1本文使用的數(shù)據(jù)集
ASF文件定義了運動數(shù)據(jù)起始幀的基本骨架姿態(tài),每個骨豁段包含該段的繪制信息。ASF文件必須滿足在骨架中沒有間隔的要求,即每個關節(jié)點都必須有數(shù)據(jù),另外,每個子節(jié)點必須相對其父節(jié)點有偏移,直觀理解就是不能出現(xiàn)長度為0的骨骼段。因此,相較于其他文件格式,ASF更便于生成新的骨豁段。AMC文件包含了由ASF文件所定義的骨架的運動數(shù)據(jù)。這些運動數(shù)據(jù)每隔一段時間進行一次采樣,每一頓由一系列線段構成,每個線段代表一個骨賂段。AMC文件首先記錄了根節(jié)點在世界坐標系中的絕對位置坐標和旋轉數(shù)據(jù),然后記錄其他每個節(jié)點相對其父節(jié)點的旋轉數(shù)據(jù),根據(jù)關節(jié)的實際情況,每個關節(jié)有不同的自由度。
2.2兩種動作特征提取算法
為解決上述問題,引入了時序分層結構模型,該模型在2D圖像中的空間金字塔匹配,該時序分層結構模型如圖2.4所示。第一層協(xié)方差矩陣計算了整個運動序列,后面的各層在比上一層小一些的窗口上計算,并且分有交疊和無交疊兩種情況,圖2.4只顯示了分兩層時的情況。每個協(xié)方差矩陣由兩個索引來標記,前一個標示了層數(shù),后一個標示了在該層中的位置,例如第一層標記。第1層中的一個協(xié)方差矩陣。從一個窗口到下一個窗口的步長可以是整個窗口的長度,也可以是窗口長度的一半,如果是后者,那么各窗口之間就產生了交疊。3基于組合特征和極限學習機的動作識別....13
3.1特征組合......133.2極限學習機和基于投票的極限學習機....13
4基于線性回歸的ELM動作識別...22
4.1線性回歸及線性回歸分類....22
4.2基于線性回歸的極限學習機...24
4.3實驗及分析.....25
5基于稀疏表示的ELM動作識別....30
5.1基于稀疏表示的分類器......30
5.2基于稀疏表示的極限學習機....32
5.3實驗及分析....32
5.4本章小結......35
6基于Dropout學習策略的ELM動作識別
6.1Dropout學習策略簡介
一種合理的解釋是有性繁殖的優(yōu)勢是在較長時間尺度下,自然選擇的尺度并不在獨立基因層面,而是多基因的協(xié)同表達。一組基因能夠和隨機的另一組基因完美合作,這使得整個繁殖系統(tǒng)的魯棒性更強。因為一個基因不可能總是依賴于一大批的匹配基因來表現(xiàn),所以它必須要做一些對自己有用或者對與其他一小部分基因組合有用的事。根據(jù)這個理論,有性繁殖的作用就不僅僅是讓新的有用基因傳遍整個群體,而且還通過降低復雜的同化來促進這個過程,而這些同化會降低新基因改善個體適應性的機會。類似地,神經網絡中的每個隱藏單元在Dropout訓練時都要學習和其他隨機選擇的節(jié)點合作。這可以使每個隱藏層節(jié)點有更強的魯棒性,并且促使它獨立產生有用特征,而不是依賴于其他隱藏層節(jié)點來糾正錯誤,并且同一隱藏層的節(jié)點還是要完成相互不同的工作。6.2Dropout模型描述
人體動作的數(shù)據(jù)由于記錄內容復雜,且記錄的數(shù)據(jù)樣本有限,再加上噪聲的存在,極易產生過擬合。所以將Dropout學習策略引入到極限學習機中,可以有效防止信號噪聲產生的過擬合,以提高動作識別率;贒ropout學習策略的極限學習機(D-ELM)的基本方法是保留原始極限學習機的輸入層和隱藏層算法,在計算輸出層權重時采用Dropout策略以提高抗過擬合性。實現(xiàn)方法為每次調參從中間層的輸出矩陣中隨機抽取若干列構成,釆用Dropout策略隨機丟棄掉部分節(jié)點數(shù)據(jù),采用廣義逆方法求得輸出層權向量,并以此對前一次調參所得權向量進行更新,更新方法為用新的權向量替換前一次所得權向量的對應元素,達到收斂條件后,形成最終的輸出層權向量。........
7總結與展望
7.1論文總結
對比這四項工作,得出如下結論:(1)改進的組合特征描述符在ELM及其各種變體上能HOD得到比原始特征更好的識別效果。(2)當隱藏層節(jié)點數(shù)為100000時,基于線性回歸的ELM在這種情況下識別效果較原始ELM有所降低,基于稀疏表示和基于Dropout學習策略的ELM都可以得到優(yōu)于原始ELM算法的識別效果,其中基于Dropout策略的ELM得到的識別效果最好。(3)當隱藏層節(jié)點數(shù)為10000時,基于Dropout的ELM識別率較沒有提高,而基于線性回歸和基于稀疏表示的ELM較原始ELM均有提高,其中基于線性回歸的ELM對特征識別效果更好,基于稀疏表示的ELM對協(xié)方差特征和組合特征的識別效果更好。7.2未來工作展望
在后期的工作中,希望可以實現(xiàn)如下目標:(1)對子關節(jié)相對父關節(jié)的旋轉角度提取特征,以實現(xiàn)旋轉、縮放、平移和尺度的不變性,來進一步改善分類效果。(2)對于低精度的人體運動捕捉數(shù)據(jù),可以首先對運動序列中的各關節(jié)點采用球面或樣條差值,以這種方式減少噪聲,然后再進行后續(xù)的特征提取和分類。(3)目前使用ELM對人體動作進行的識別都是建立在大量隱藏層節(jié)點的情況下,對實驗機器內存的要求非常高,后期工作中,,希望能夠找到新的方法減少隱藏層節(jié)點的需求量,以提高算法的實用性。(4)將本文中的分類方法應用到更多領域,以驗證其普適性。........
參考文獻(略)
本文編號:63706
本文鏈接:http://sikaile.net/wenshubaike/lwfw/63706.html