天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于人體骨架圖卷積和圖像卷積融合的行為識別

發(fā)布時間:2022-01-04 07:10
  計算機視覺是人工智能中一個重要的組成部分,而人體行為識別作為計算機視覺領域的熱門研究方向,受到了越來越多人的關注,具有廣泛的應用前景。近年來,隨著深度神經網絡的發(fā)展和計算機運算能力的提升,深度學習已經成為解決計算機視覺領域問題最重要的手段。其中,卷積神經網絡在靜止圖像上的識別與分類上取得了巨大成功,但是對于視頻中的行為識別問題卻無法體現(xiàn)出其明顯的優(yōu)越性。目前的行為識別方法主要有雙流法,三維卷積法和基于人體骨架的方法等,但都存在各自的優(yōu)缺點,比如雙流法雖然識別率較高,但是特征來源是視頻幀的整個圖像信息,對人體行為的關注度不夠,所以識別率一般針對特定數(shù)據(jù)集而言;三維卷積法雖然模型簡單,實時性好,但是識別率不足;基于骨架的方法優(yōu)勢在于剔除視頻中的其他信息,只關注人體運動,提取的特征雖然少但更具有針對性和說服力,缺點是提取的骨架并非完全精準,導致這類方法識別率普遍較低。因此,本文針對上述問題,研究通過融合人體骨架和視頻圖像信息的行為識別方法,在保留基于骨架方法對動作的針對性的同時,通過與圖像信息結合,提高行為識別的準確率。首先本文從行為識別的研究背景及其在人工智能大環(huán)境發(fā)展中的理論研究意義和現(xiàn)... 

【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【部分圖文】:

基于人體骨架圖卷積和圖像卷積融合的行為識別


圖2-4池化操作示意圖??

特征圖,卷積運算,卷積,卷積核


?山東大學碩士學位論文???一個完整的卷積神經網絡結構一般由卷積層(convolutional?layer)、池化??層(pooling?layer)和全連接層(folly?connected?layer)組成。卷積層的具體卷積操??作如圖2-3所示,圖中原輸入圖像為單通道的4*4圖像,為使卷積結果與輸??入圖像尺寸保持一致,對輸入圖像進行填充(padding),卷積核大小為3*3,??步長為1,卷積核將會根據(jù)步長在輸入圖像上從左到右,從上到下進行遍歷,??最終得出一個尺寸4*4的特征圖。??葉》1:吁葉:::::::????T ̄T ̄2?\?2?2?0?\?〇?\?l\?〇??To?3?o?o?o?ill?rTTiTTrr??i?i???_____?____?_____??^?2?:&2:?;�。�;?;:??0?1?0?6?5?7?4?? ̄0?1?■?0?0?0^ ̄0?3?m?? ̄ ̄0?〇?\?0? ̄0 ̄0? ̄0?3?12?2??圖2-3卷積運算圖??卷積層一般與池化層互相堆疊,通過多個卷積池化操作,將原始輸入圖??像轉化為深層特征圖。池化層也叫下采樣層,其具體操作與卷積層的操作基??本相同,只不過池化層的卷積核內部是固定的,而非可學習的權重,一般是??取對應區(qū)域的最大值(最大池化)或者平均值(平均池化),如圖2-4所示,圖中??池化卷積核大小均為2*2,步長均為2。池化層的主要作用是于保留關鍵性??特征,減少模型參數(shù),降低網絡計算量,能夠防止過擬合,提高模型泛化能??力。??J?|?叫?6?丨^?|?|?■??|?S?|?6?卜??6?5?7?4?|?5?|?

結構圖,結構圖,卷積


?山東大學碩士學位論文???數(shù))的特征向量,該向量將圖像中最具有特點的圖像特征保留了下來以此完??成圖像分類任務。??最早的卷積網絡是lecun在1998年提出的LeNet-5[27],其結構如圖2-5??所不。除輸入層和輸出層外,共/、層網絡,包括二個卷積層(Cl,C3,C5),??兩個池化層(S2,?S4),一個全連接層(F6)。淺層負責提取顏色和圖像邊緣這??種低級特征,高層負責整合這些淺層特征,提取出高層語義特征,實現(xiàn)從輸??入到輸出的映射,然后通過有監(jiān)督學習的方法不斷擬合訓練數(shù)據(jù)。后來涌現(xiàn)??出來的各種優(yōu)秀的CNN模型例如GooLeNet[28]、VGGNet[29]、ResNet[3G]等都??是在LeNet-5的基礎架構上改進出來的。??C3:?f.?maps?16@10xl0??INPUT?6@21Se?^?S4:f.mapsl6@5x5??32X32?fr"?F6:?layer?OUTPUT??I?|?Full?connection?|?Gaussian?connections??Convolutions?Subsampling?Convolutions?Subsampling?Full?connection??圖2-5?LeNet-5結構圖??本文在實現(xiàn)基于圖像信息的行為識別時采用的是ResNet卷積神經網絡,??ResNet模型的出現(xiàn)是為了解決網絡降級的問題,即隨著網絡深度的增加,網??絡的性能越來越差,直接體現(xiàn)為在訓練集上的準確率下降。當網絡進行簡單??的堆疊到特別長時,網絡內部的特征在其中某一層己經達到了最佳的情況,??這時候剩下層應該不對該特征做任何改變,自動學成恒等

【參考文獻】:
期刊論文
[1]基于CNN/LSTM和稀疏下采樣的人體行為識別[J]. 陳煜平,邱衛(wèi)根.  計算機工程與設計. 2019(05)
[2]基于改進和積網絡的雙人交互行為識別[J]. 陳昌紅,劉園.  計算機技術與發(fā)展. 2019(10)
[3]基于深度運動圖和密集軌跡的行為識別算法[J]. 李元祥,謝林柏.  計算機工程與應用. 2020(03)
[4]光照變化條件下的光流估計[J]. 劉駿,祖靜,張瑜,張紅艷.  中國圖象圖形學報. 2014(10)
[5]圖像特征提取方法的綜述[J]. 王志瑞,閆彩良.  吉首大學學報(自然科學版). 2011(05)
[6]神經網絡信息傳輸函數(shù)Sigm oid與tanh比較論證[J]. 李曦.  武漢理工大學學報(交通科學與工程版). 2004(02)



本文編號:3567917

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3567917.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶084a5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
内射精品欧美一区二区三区久久久 | 日韩丝袜诱惑一区二区| 99久久国产精品亚洲| 色婷婷日本视频在线观看| 亚洲欧美日本成人在线| 91香蕉国产观看免费人人| 国产又粗又爽又猛又黄的 | 国产一区在线免费国产一区| 国产一级内射麻豆91| 亚洲中文字幕熟女丝袜久久| 国产三级视频不卡在线观看| 精品少妇一区二区三区四区| 办公室丝袜高跟秘书国产| 亚洲欧美中文日韩综合| 中文字幕日韩无套内射| 丝袜诱惑一区二区三区| 日韩精品中文在线观看| 最近最新中文字幕免费| 免费观看成人免费视频| 搡老熟女老女人一区二区| 午夜资源在线观看免费高清| 久久亚洲精品中文字幕| 亚洲中文字幕剧情在线播放| 日韩精品视频香蕉视频| 麻豆视传媒短视频免费观看| 不卡一区二区高清视频| 日本精品视频一二三区| 国产成人精品在线播放| 亚洲视频一区自拍偷拍另类| 久久精视频免费视频观看| 高清亚洲精品中文字幕乱码| 久久夜色精品国产高清不卡| 亚洲国产性感美女视频| 男人的天堂的视频东京热| 色综合视频一区二区观看| 东京热加勒比一区二区| 亚洲精品一二三区不卡| 国产精品一区二区高潮| 最新午夜福利视频偷拍| 亚洲一区二区精品国产av| 国产精品99一区二区三区|