基于深度學習的異常行為檢測技術及其應用
發(fā)布時間:2021-06-24 10:21
隨著計算機計算能力的提高和相關數據集的愈加豐富,深度學習在計算機視覺領域的圖像分類、語義分割、目標檢測等任務上取得了巨大的成功。在視頻動作識別任務中,一些主流的卷積神經網絡架構已經取得了良好的性能。但是這些常用的網絡結構不能很好的學習視頻中的上下文信息和視覺屬性,這就使得這些深度學習算法對視頻圖像中具有重要影響作用的區(qū)域或信息建模不足。另外動作在視頻中的發(fā)生時間是不固定的,如何有效地將網絡的注意力放到有動作的區(qū)域,這一個需要視頻動作識別中解決的問題,本文針對基于視頻的人體行為識別方法中出現的一些問題進行研究,論文的主要研究內容包括:首先,為了準確檢測視頻中的異常行為,本文提出了一種基于生成對抗網絡的模型。模型首先通過一個生成器對未來的幀進行預測,然后通過判別器將生成的預測幀和真實的幀進行比對,根據比對的結果判斷是否出現了異常行為。但是生成對抗網絡的訓練難度較大,并且生成的圖像有時候會出現失真嚴重,這就導致圖像的生成失去了意義,更嚴重的是會出現模型崩潰的現象。所以本文采用了Wasserstein生成對抗網絡,另外考慮原始生成對抗網絡的固有缺點,模型仍然無法達到非常好的效果,所以特地引入了...
【文章來源】:南京郵電大學江蘇省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
LeNet層級結構
圖 2.1 LeNet 層級結構et-5 網絡模型包含了深度學習中的基本模塊:卷積層、池化層和全連接層,這些他深度學習模型的基礎。LeNet-5 網絡共有 7 層網絡結構,每層都包含了多個可層有多個特征圖,輸入特征由卷積濾波器提取,每個特征圖都有多個神經元,片作為數據并通過反向傳播算法訓練整個神經網絡。操作是整個 CNNs 網絡中核心操作。卷積操作過程可以用如下的公式進行表示 ( )( ) = ( ) ( ) πππ ( ) = ( ( ) ) ( k 指的是第 k 層的卷積層,i 表示卷積核的第 i 行,j 表示卷積核的第 j 列,n 表元素的數量,W 表示卷積核。卷積過程如圖 2.2 所示:
學位碩士研究生學位論文 第二章 相用卷積核將上層輸出中的低級特征組合成更高級的特征。輸入是 作就變成了 3×3 的 feature map,其中步長為 1,卷積核為 3×3。ng)的本質是“對局部信息的總結”,常見的池化極大池化和平均池x Pooling)會輸出接收到的所有輸入中的最大值;而平均池化(Ave的所有輸入的均值。似于卷積過程,池化和卷積都是布局視野對輸入信息的轉換,只而池化過程做的是極大或者平均運算。極大池化的操作如下圖 2
本文編號:3246909
【文章來源】:南京郵電大學江蘇省
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
LeNet層級結構
圖 2.1 LeNet 層級結構et-5 網絡模型包含了深度學習中的基本模塊:卷積層、池化層和全連接層,這些他深度學習模型的基礎。LeNet-5 網絡共有 7 層網絡結構,每層都包含了多個可層有多個特征圖,輸入特征由卷積濾波器提取,每個特征圖都有多個神經元,片作為數據并通過反向傳播算法訓練整個神經網絡。操作是整個 CNNs 網絡中核心操作。卷積操作過程可以用如下的公式進行表示 ( )( ) = ( ) ( ) πππ ( ) = ( ( ) ) ( k 指的是第 k 層的卷積層,i 表示卷積核的第 i 行,j 表示卷積核的第 j 列,n 表元素的數量,W 表示卷積核。卷積過程如圖 2.2 所示:
學位碩士研究生學位論文 第二章 相用卷積核將上層輸出中的低級特征組合成更高級的特征。輸入是 作就變成了 3×3 的 feature map,其中步長為 1,卷積核為 3×3。ng)的本質是“對局部信息的總結”,常見的池化極大池化和平均池x Pooling)會輸出接收到的所有輸入中的最大值;而平均池化(Ave的所有輸入的均值。似于卷積過程,池化和卷積都是布局視野對輸入信息的轉換,只而池化過程做的是極大或者平均運算。極大池化的操作如下圖 2
本文編號:3246909
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3246909.html