基于生成對抗網(wǎng)絡的異常檢測方法的研究
發(fā)布時間:2021-11-20 12:21
異常檢測,顧名思義,是對與預期模式不相匹配的數(shù)據(jù)、事件或觀測值的識別。作為計算機視覺領域中熱門的研究方向,異常檢測在許多領域具有良好的應用前景。例如與網(wǎng)絡安全相關的信息傳輸檢測、與制造業(yè)相關的材料紋理檢測、以及在醫(yī)學領域的醫(yī)學影像檢測等等。然而,受制于數(shù)據(jù)標記耗時耗力以及數(shù)據(jù)不均衡等問題,基于監(jiān)督學習的異常檢測模型在某些方面難以達到預定期望。為了解決上述問題,本文將介紹一種新的結合一分類思想的無監(jiān)督學習模型,即基于生成對抗網(wǎng)絡的異常檢測模型。該模型通過對單一類數(shù)據(jù)進行無監(jiān)督學習來識別相關異常,無需對數(shù)據(jù)詳細標注,避免了數(shù)據(jù)不均衡的問題。并利用生成對抗網(wǎng)絡強大的擬合能力重構數(shù)據(jù),進而通過比較重構數(shù)據(jù)與測試數(shù)據(jù)間的距離來區(qū)分異常的圖像或音頻?傊,本文主要研究內(nèi)容如下:1.通過引入Ano GAN模型,詳細介紹了基于生成對抗網(wǎng)絡的異常檢測方法的原理。并指出該模型存在的問題,進而在此基礎上介紹了編碼器與生成對抗網(wǎng)絡相結合的兩個模型Efficient-GAN與GANomaly。除此之外,還通過上述模型的實驗結果對比,提出了在不同圖像復雜度下異常評分設計應該不一致的觀點,并在之后的實驗中驗證了上述...
【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
異常模型
的神經(jīng)網(wǎng)絡,本節(jié)將主要介紹三種常用于異常檢測的相關自編碼器網(wǎng)絡。2.2.1自編碼器網(wǎng)絡及原理自編碼器是一種較為基礎的神經(jīng)網(wǎng)絡,該網(wǎng)絡通過編碼這一過程學習得到較小維度的數(shù)據(jù)特征,并通過解碼過程重構所需數(shù)據(jù)。即輸入一個高維向量,并期望輸出相同尺寸的向量。換句話說,自動編碼器的整個過程就是重構輸入數(shù)據(jù)。由于存在編碼這一過程,自編碼器也常常作為一種數(shù)據(jù)的壓縮或降維方法,與線性的主成分分析(PrincipalComponentsAnalysis,PCA)[38]這類降維方法相比,非線性降維效果更有優(yōu)勢。同理也可用于特征提齲圖2.1自編碼器流程圖Fig2.1Flow-chartofautoencoder圖2.1展示了自編碼器的基本流程。流程的主體是自編碼器的兩個子網(wǎng)絡:編碼器(Encoder)與解碼器(Decoder)。編碼器和解碼器的結構并非固定,通常使用多層全連接層相互連接而成。輸入數(shù)據(jù)X經(jīng)過編碼器降維得到低維特征編碼Z,低維特征編碼再通過解碼器解碼得到與輸入數(shù)據(jù)相同尺寸的重構數(shù)據(jù)X′。通過合適的約束條件/損失函數(shù)來訓練編碼器和解碼器的相關參數(shù),從而拉近輸入數(shù)據(jù)與重構數(shù)據(jù)間的距離,最小化二者之間的差異。一般情況下,自編碼器使用均方誤差(MeanSquaredError,MSE)作為網(wǎng)絡的損失函數(shù):LMSE=1NNi=1(xix′i)2(2.1)其中N為輸入數(shù)據(jù)數(shù)量,xi∈X為單個輸入數(shù)據(jù),x′∈X′為單個輸入相對應的重構數(shù)據(jù)。模型訓練時利用MSE可以拉近輸入數(shù)據(jù)與重構數(shù)據(jù)間的歐式距離,使得重構出的新數(shù)據(jù)與原始輸入數(shù)據(jù)盡量相似。7
合肥工業(yè)大學學術碩士研究生學位論文正是由于自編碼器可以對輸入數(shù)據(jù)進行重構,自編碼器也被應用于時序異常檢測這類問題中。在訓練網(wǎng)絡模型時,利用自編碼器將從傳感器得到的正常數(shù)據(jù)進行壓縮,將高維數(shù)據(jù)映射到低維空間,在降維過程中網(wǎng)絡會學習到正常數(shù)據(jù)中不同變量間的相互聯(lián)系。之后再將隱變量重構得到預測的重構數(shù)據(jù)。驗證時,由于異常數(shù)據(jù)屬于突變行為,自編碼器重構得到的數(shù)據(jù)就會與輸入數(shù)據(jù)差距過大,從而判定為異常。2.2.2變分自編碼器網(wǎng)絡及原理在上一小節(jié)中,我們簡單的介紹了自編碼器的基本原理與構造,介紹了隱變量與輸入數(shù)據(jù)之間的聯(lián)系。但是自編碼器本身存在這一些不足:1)由于自編碼器本身是一種有損的數(shù)據(jù)壓縮算法,在進行降維時得到的隱變量并不一定合適,進而在數(shù)據(jù)重構時不會得到效果最佳的重構數(shù)據(jù)。2)由于輸入數(shù)據(jù)是離散的,導致隱變量間也是離散的。當從連續(xù)分布中提取連續(xù)的向量作為隱變量輸入到解碼器中時,得到的重構數(shù)據(jù)可能并不具有連續(xù)性。為了改進上述模型的缺點與不足,變分自編碼器VAE應運而生。VAE是由Kingma等人于2014年提出的基于變分貝葉斯(VariationalBayes,VB)推斷的生成式網(wǎng)絡結構。VAE的主體結構與AE差別不大,但是與標準自編碼器通過數(shù)值的方式描述隱空間不同,它以概率分布的方式描述隱空間的變量。圖2.2VAE原理圖Fig2.2TheschematicofVAE根據(jù)圖2.2,我們可以簡單描述VAE的流程:1)輸入圖像經(jīng)過編碼器降維,輸出一組可以描述隱空間中某個正太分布的參數(shù):均值和方差。2)從這組正態(tài)分布中進行隨機采樣。3)采樣點經(jīng)過解碼器映射重構為原始圖像。以上三步便是VAE的主8
本文編號:3507313
【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
異常模型
的神經(jīng)網(wǎng)絡,本節(jié)將主要介紹三種常用于異常檢測的相關自編碼器網(wǎng)絡。2.2.1自編碼器網(wǎng)絡及原理自編碼器是一種較為基礎的神經(jīng)網(wǎng)絡,該網(wǎng)絡通過編碼這一過程學習得到較小維度的數(shù)據(jù)特征,并通過解碼過程重構所需數(shù)據(jù)。即輸入一個高維向量,并期望輸出相同尺寸的向量。換句話說,自動編碼器的整個過程就是重構輸入數(shù)據(jù)。由于存在編碼這一過程,自編碼器也常常作為一種數(shù)據(jù)的壓縮或降維方法,與線性的主成分分析(PrincipalComponentsAnalysis,PCA)[38]這類降維方法相比,非線性降維效果更有優(yōu)勢。同理也可用于特征提齲圖2.1自編碼器流程圖Fig2.1Flow-chartofautoencoder圖2.1展示了自編碼器的基本流程。流程的主體是自編碼器的兩個子網(wǎng)絡:編碼器(Encoder)與解碼器(Decoder)。編碼器和解碼器的結構并非固定,通常使用多層全連接層相互連接而成。輸入數(shù)據(jù)X經(jīng)過編碼器降維得到低維特征編碼Z,低維特征編碼再通過解碼器解碼得到與輸入數(shù)據(jù)相同尺寸的重構數(shù)據(jù)X′。通過合適的約束條件/損失函數(shù)來訓練編碼器和解碼器的相關參數(shù),從而拉近輸入數(shù)據(jù)與重構數(shù)據(jù)間的距離,最小化二者之間的差異。一般情況下,自編碼器使用均方誤差(MeanSquaredError,MSE)作為網(wǎng)絡的損失函數(shù):LMSE=1NNi=1(xix′i)2(2.1)其中N為輸入數(shù)據(jù)數(shù)量,xi∈X為單個輸入數(shù)據(jù),x′∈X′為單個輸入相對應的重構數(shù)據(jù)。模型訓練時利用MSE可以拉近輸入數(shù)據(jù)與重構數(shù)據(jù)間的歐式距離,使得重構出的新數(shù)據(jù)與原始輸入數(shù)據(jù)盡量相似。7
合肥工業(yè)大學學術碩士研究生學位論文正是由于自編碼器可以對輸入數(shù)據(jù)進行重構,自編碼器也被應用于時序異常檢測這類問題中。在訓練網(wǎng)絡模型時,利用自編碼器將從傳感器得到的正常數(shù)據(jù)進行壓縮,將高維數(shù)據(jù)映射到低維空間,在降維過程中網(wǎng)絡會學習到正常數(shù)據(jù)中不同變量間的相互聯(lián)系。之后再將隱變量重構得到預測的重構數(shù)據(jù)。驗證時,由于異常數(shù)據(jù)屬于突變行為,自編碼器重構得到的數(shù)據(jù)就會與輸入數(shù)據(jù)差距過大,從而判定為異常。2.2.2變分自編碼器網(wǎng)絡及原理在上一小節(jié)中,我們簡單的介紹了自編碼器的基本原理與構造,介紹了隱變量與輸入數(shù)據(jù)之間的聯(lián)系。但是自編碼器本身存在這一些不足:1)由于自編碼器本身是一種有損的數(shù)據(jù)壓縮算法,在進行降維時得到的隱變量并不一定合適,進而在數(shù)據(jù)重構時不會得到效果最佳的重構數(shù)據(jù)。2)由于輸入數(shù)據(jù)是離散的,導致隱變量間也是離散的。當從連續(xù)分布中提取連續(xù)的向量作為隱變量輸入到解碼器中時,得到的重構數(shù)據(jù)可能并不具有連續(xù)性。為了改進上述模型的缺點與不足,變分自編碼器VAE應運而生。VAE是由Kingma等人于2014年提出的基于變分貝葉斯(VariationalBayes,VB)推斷的生成式網(wǎng)絡結構。VAE的主體結構與AE差別不大,但是與標準自編碼器通過數(shù)值的方式描述隱空間不同,它以概率分布的方式描述隱空間的變量。圖2.2VAE原理圖Fig2.2TheschematicofVAE根據(jù)圖2.2,我們可以簡單描述VAE的流程:1)輸入圖像經(jīng)過編碼器降維,輸出一組可以描述隱空間中某個正太分布的參數(shù):均值和方差。2)從這組正態(tài)分布中進行隨機采樣。3)采樣點經(jīng)過解碼器映射重構為原始圖像。以上三步便是VAE的主8
本文編號:3507313
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3507313.html
最近更新
教材專著