基于關(guān)聯(lián)感知的無監(jiān)督深度異常檢測模型研究
發(fā)布時間:2021-06-05 09:47
異常檢測已經(jīng)被廣泛應(yīng)用于網(wǎng)絡(luò)安全、模式識別、數(shù)據(jù)挖掘等應(yīng)用領(lǐng)域。異常檢測旨在發(fā)現(xiàn)正常模式中的異常模式。無監(jiān)督異常檢測方法通過對樣本的概率分布估計來發(fā)現(xiàn)異常數(shù)據(jù),是當今異常檢測主要采用的方法之一。已有的無監(jiān)督異常檢測方法通常只對數(shù)據(jù)的原始特征進行分析,忽略了數(shù)據(jù)間隱含的關(guān)聯(lián)性信息,導(dǎo)致異常檢測效果不甚理想。本文針對此問題提出了基于關(guān)聯(lián)感知的無監(jiān)督深度異常檢測模型。為了提取數(shù)據(jù)的關(guān)聯(lián)性信息,本文通過圖結(jié)構(gòu)對數(shù)據(jù)間關(guān)聯(lián)性進行建模。首先,在數(shù)據(jù)的原始特征空間中,使用k最近鄰算法(k-nearest neighbor,k-NN)來對數(shù)據(jù)的相似性進行分析;然后,根據(jù)數(shù)據(jù)之間的相似性來構(gòu)建無向圖,以此表示數(shù)據(jù)間關(guān)聯(lián)性;最后,設(shè)計數(shù)據(jù)間關(guān)聯(lián)性挖掘方法,對數(shù)據(jù)之間關(guān)聯(lián)性信息進行深入挖掘。為了利用數(shù)據(jù)的關(guān)聯(lián)性信息,本文設(shè)計了基于關(guān)聯(lián)感知自編碼器的高斯混合模型(Correlation-aware autoencoders in Gaussian mixed model,CAAE-GMM),設(shè)計基于高斯混合模型的估計網(wǎng)絡(luò),以深入挖掘的數(shù)據(jù)間關(guān)聯(lián)性信息為輸入,估計數(shù)據(jù)的概率分布,并基于此進行異常檢測;然后,在C...
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖卷積神經(jīng)網(wǎng)絡(luò)Fig.2-1Graphconvolutionalneuralnetwork
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-9-neuralnetwork,CNN),用于抽取圖數(shù)據(jù)中的局部空間信息,并將其融合構(gòu)建為新的特征表示。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)必須以圖數(shù)據(jù)所有可能的節(jié)點排列作為輸入,然而圖數(shù)據(jù)的節(jié)點之間無順序性,即圖數(shù)據(jù)經(jīng)旋轉(zhuǎn)、翻折操作不影響數(shù)據(jù)本身,如圖2-2(a)中,數(shù)據(jù)必須從左上開始依次輸入,而圖2-2(b)中,以數(shù)據(jù)所有可能的節(jié)點排列作為輸入。因此,圖數(shù)據(jù)會導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難。為解決此問題,圖卷積神經(jīng)網(wǎng)絡(luò)采用在節(jié)點上進行信息傳播,從而使模型輸出不隨節(jié)點的輸入順序而發(fā)生變化。除此之外,圖數(shù)據(jù)中的邊也可表示兩個節(jié)點之間的依賴關(guān)系,可以利用節(jié)點周圍的狀態(tài)來對節(jié)點的狀態(tài)進行更新,從而利用數(shù)據(jù)之間的關(guān)聯(lián)性進行推理學(xué)習(xí),使模型具有與人類相似的推理能力。而在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中,這種依賴關(guān)系只能通過節(jié)點的特征表示來體現(xiàn),只能通過大量的經(jīng)驗數(shù)據(jù)學(xué)習(xí)信息。因此,圖卷積神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)關(guān)聯(lián)性信息上,具有傳統(tǒng)方法無法比擬的優(yōu)勢。(a)傳統(tǒng)數(shù)據(jù)(b)圖數(shù)據(jù)(a)Traditionaldata(b)Graphdata圖2-2傳統(tǒng)數(shù)據(jù)與圖數(shù)據(jù)區(qū)別FIG.2-2Differencesbetweentraditionaldataandgraphdata圖卷積神經(jīng)網(wǎng)絡(luò)的主要目標是訓(xùn)練一個函數(shù),此函數(shù)的輸入包含了節(jié)點與節(jié)點之間的信息,如圖2-3所示。具體工作原理如下:在圖數(shù)據(jù)中,節(jié)點是由節(jié)點特征與鄰居節(jié)點共同表示的。圖卷積神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練,得到節(jié)點高質(zhì)量的低維表示。其中圖卷積神經(jīng)網(wǎng)絡(luò)層與層之間的傳播方式如公式2-1。)~~~(2121ll1lWHDADH(2-1)其中,D~表示A~度矩陣,LAD~~,L表示Laplacian矩陣;IAA~,A表示鄰接矩陣;H表示每一層的輸出,當為輸入層時,H為輸入數(shù)據(jù);W表示每層
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-10-的權(quán)重;表示非線性激活函數(shù)。圖卷積神經(jīng)網(wǎng)絡(luò)通過多層的迭代,最終得到節(jié)點的高質(zhì)量表示。圖2-3圖卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程Fig.2-3ThetrainingprocessofGraphconvolutionalneuralnetwork由以上分析可以看出,圖神經(jīng)網(wǎng)絡(luò)可利用圖結(jié)構(gòu)挖掘數(shù)據(jù)間的關(guān)聯(lián)性信息,符合本文核心研究內(nèi)容的需要。因此,本文將對數(shù)據(jù)進行圖結(jié)構(gòu)建模,并選擇圖卷積神經(jīng)網(wǎng)絡(luò)作為挖掘數(shù)據(jù)關(guān)聯(lián)性信息的基本方法。2.3自編碼器自編碼器作為生成模型的一種,早在1986年被Hinton等人提出,是一種能夠通過無監(jiān)督方式學(xué)習(xí)到數(shù)據(jù)的高質(zhì)量低維表示的人工神經(jīng)網(wǎng)絡(luò)。在自編碼器中,將輸入數(shù)據(jù)降維并生成高質(zhì)量的低維表示的過程稱為編碼過程。另外,自編碼器作為一種強大的特征檢測器,能夠應(yīng)用于深度學(xué)習(xí)的預(yù)訓(xùn)練中,從而提高模型的學(xué)習(xí)性能。作為生成模型的一種,自編碼器可以隨機生成與輸入數(shù)據(jù)相似的數(shù)據(jù),從而實現(xiàn)對數(shù)據(jù)的建模。圖2-4自編碼器框架Fig.2-4FrameofAutoEncoders自編碼器通常學(xué)習(xí)輸入數(shù)據(jù),并將輸入數(shù)據(jù)簡單地重構(gòu)到輸出中。如圖2-4所示。其中,X表示輸入數(shù)據(jù),X"表示自編碼器輸出數(shù)據(jù),f表示編碼函數(shù),g
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)目標檢測方法綜述[J]. 趙永強,饒元,董世鵬,張君毅. 中國圖象圖形學(xué)報. 2020(04)
[2]基于圖神經(jīng)網(wǎng)絡(luò)的動態(tài)網(wǎng)絡(luò)異常檢測算法[J]. 郭嘉琰,李榮華,張巖,王國仁. 軟件學(xué)報. 2020(03)
[3]深度自編碼器在數(shù)據(jù)異常檢測中的應(yīng)用研究[J]. 張常華,周雄圖,張永愛,姚劍敏,郭太良,嚴群. 計算機工程與應(yīng)用. 2020(17)
[4]基于鄰域保持嵌入-主成分分析的高壓電纜狀態(tài)數(shù)據(jù)異常檢測及分析[J]. 劉敏,方義治,孫廷璽,羅思琴,王升,周念成,蘭雪珂. 科學(xué)技術(shù)與工程. 2019(27)
[5]基于無監(jiān)督學(xué)習(xí)的圖像風(fēng)格遷移方法[J]. 簡麗瓊,高翔. 信息與電腦(理論版). 2019(17)
[6]融合時空興趣點和多元廣義高斯混合模型的人體動作識別[J]. 何冰倩,魏維,宋巖貝,高聯(lián)欣,張斌. 成都信息工程大學(xué)學(xué)報. 2019(04)
[7]基于自編碼器的分組光網(wǎng)絡(luò)監(jiān)測數(shù)據(jù)分析與優(yōu)化方法研究[J]. 趙星,呂博. 信息通信技術(shù)與政策. 2019(07)
[8]基于深度信念網(wǎng)絡(luò)的高維傳感器數(shù)據(jù)異常檢測算法[J]. 金鵬,夏曉峰,喬焰,崔信紅. 傳感技術(shù)學(xué)報. 2019(06)
[9]基于深度學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測研究綜述[J]. 張勇東,陳思洋,彭雨荷,楊堅. 廣州大學(xué)學(xué)報(自然科學(xué)版). 2019(03)
[10]基于自適應(yīng)人工魚群FCM的異常檢測算法[J]. 席亮,王勇,張鳳斌. 計算機研究與發(fā)展. 2019(05)
本文編號:3211933
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖卷積神經(jīng)網(wǎng)絡(luò)Fig.2-1Graphconvolutionalneuralnetwork
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-9-neuralnetwork,CNN),用于抽取圖數(shù)據(jù)中的局部空間信息,并將其融合構(gòu)建為新的特征表示。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)必須以圖數(shù)據(jù)所有可能的節(jié)點排列作為輸入,然而圖數(shù)據(jù)的節(jié)點之間無順序性,即圖數(shù)據(jù)經(jīng)旋轉(zhuǎn)、翻折操作不影響數(shù)據(jù)本身,如圖2-2(a)中,數(shù)據(jù)必須從左上開始依次輸入,而圖2-2(b)中,以數(shù)據(jù)所有可能的節(jié)點排列作為輸入。因此,圖數(shù)據(jù)會導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難。為解決此問題,圖卷積神經(jīng)網(wǎng)絡(luò)采用在節(jié)點上進行信息傳播,從而使模型輸出不隨節(jié)點的輸入順序而發(fā)生變化。除此之外,圖數(shù)據(jù)中的邊也可表示兩個節(jié)點之間的依賴關(guān)系,可以利用節(jié)點周圍的狀態(tài)來對節(jié)點的狀態(tài)進行更新,從而利用數(shù)據(jù)之間的關(guān)聯(lián)性進行推理學(xué)習(xí),使模型具有與人類相似的推理能力。而在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中,這種依賴關(guān)系只能通過節(jié)點的特征表示來體現(xiàn),只能通過大量的經(jīng)驗數(shù)據(jù)學(xué)習(xí)信息。因此,圖卷積神經(jīng)網(wǎng)絡(luò)在處理數(shù)據(jù)關(guān)聯(lián)性信息上,具有傳統(tǒng)方法無法比擬的優(yōu)勢。(a)傳統(tǒng)數(shù)據(jù)(b)圖數(shù)據(jù)(a)Traditionaldata(b)Graphdata圖2-2傳統(tǒng)數(shù)據(jù)與圖數(shù)據(jù)區(qū)別FIG.2-2Differencesbetweentraditionaldataandgraphdata圖卷積神經(jīng)網(wǎng)絡(luò)的主要目標是訓(xùn)練一個函數(shù),此函數(shù)的輸入包含了節(jié)點與節(jié)點之間的信息,如圖2-3所示。具體工作原理如下:在圖數(shù)據(jù)中,節(jié)點是由節(jié)點特征與鄰居節(jié)點共同表示的。圖卷積神經(jīng)網(wǎng)絡(luò)通過訓(xùn)練,得到節(jié)點高質(zhì)量的低維表示。其中圖卷積神經(jīng)網(wǎng)絡(luò)層與層之間的傳播方式如公式2-1。)~~~(2121ll1lWHDADH(2-1)其中,D~表示A~度矩陣,LAD~~,L表示Laplacian矩陣;IAA~,A表示鄰接矩陣;H表示每一層的輸出,當為輸入層時,H為輸入數(shù)據(jù);W表示每層
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-10-的權(quán)重;表示非線性激活函數(shù)。圖卷積神經(jīng)網(wǎng)絡(luò)通過多層的迭代,最終得到節(jié)點的高質(zhì)量表示。圖2-3圖卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程Fig.2-3ThetrainingprocessofGraphconvolutionalneuralnetwork由以上分析可以看出,圖神經(jīng)網(wǎng)絡(luò)可利用圖結(jié)構(gòu)挖掘數(shù)據(jù)間的關(guān)聯(lián)性信息,符合本文核心研究內(nèi)容的需要。因此,本文將對數(shù)據(jù)進行圖結(jié)構(gòu)建模,并選擇圖卷積神經(jīng)網(wǎng)絡(luò)作為挖掘數(shù)據(jù)關(guān)聯(lián)性信息的基本方法。2.3自編碼器自編碼器作為生成模型的一種,早在1986年被Hinton等人提出,是一種能夠通過無監(jiān)督方式學(xué)習(xí)到數(shù)據(jù)的高質(zhì)量低維表示的人工神經(jīng)網(wǎng)絡(luò)。在自編碼器中,將輸入數(shù)據(jù)降維并生成高質(zhì)量的低維表示的過程稱為編碼過程。另外,自編碼器作為一種強大的特征檢測器,能夠應(yīng)用于深度學(xué)習(xí)的預(yù)訓(xùn)練中,從而提高模型的學(xué)習(xí)性能。作為生成模型的一種,自編碼器可以隨機生成與輸入數(shù)據(jù)相似的數(shù)據(jù),從而實現(xiàn)對數(shù)據(jù)的建模。圖2-4自編碼器框架Fig.2-4FrameofAutoEncoders自編碼器通常學(xué)習(xí)輸入數(shù)據(jù),并將輸入數(shù)據(jù)簡單地重構(gòu)到輸出中。如圖2-4所示。其中,X表示輸入數(shù)據(jù),X"表示自編碼器輸出數(shù)據(jù),f表示編碼函數(shù),g
【參考文獻】:
期刊論文
[1]深度學(xué)習(xí)目標檢測方法綜述[J]. 趙永強,饒元,董世鵬,張君毅. 中國圖象圖形學(xué)報. 2020(04)
[2]基于圖神經(jīng)網(wǎng)絡(luò)的動態(tài)網(wǎng)絡(luò)異常檢測算法[J]. 郭嘉琰,李榮華,張巖,王國仁. 軟件學(xué)報. 2020(03)
[3]深度自編碼器在數(shù)據(jù)異常檢測中的應(yīng)用研究[J]. 張常華,周雄圖,張永愛,姚劍敏,郭太良,嚴群. 計算機工程與應(yīng)用. 2020(17)
[4]基于鄰域保持嵌入-主成分分析的高壓電纜狀態(tài)數(shù)據(jù)異常檢測及分析[J]. 劉敏,方義治,孫廷璽,羅思琴,王升,周念成,蘭雪珂. 科學(xué)技術(shù)與工程. 2019(27)
[5]基于無監(jiān)督學(xué)習(xí)的圖像風(fēng)格遷移方法[J]. 簡麗瓊,高翔. 信息與電腦(理論版). 2019(17)
[6]融合時空興趣點和多元廣義高斯混合模型的人體動作識別[J]. 何冰倩,魏維,宋巖貝,高聯(lián)欣,張斌. 成都信息工程大學(xué)學(xué)報. 2019(04)
[7]基于自編碼器的分組光網(wǎng)絡(luò)監(jiān)測數(shù)據(jù)分析與優(yōu)化方法研究[J]. 趙星,呂博. 信息通信技術(shù)與政策. 2019(07)
[8]基于深度信念網(wǎng)絡(luò)的高維傳感器數(shù)據(jù)異常檢測算法[J]. 金鵬,夏曉峰,喬焰,崔信紅. 傳感技術(shù)學(xué)報. 2019(06)
[9]基于深度學(xué)習(xí)的網(wǎng)絡(luò)入侵檢測研究綜述[J]. 張勇東,陳思洋,彭雨荷,楊堅. 廣州大學(xué)學(xué)報(自然科學(xué)版). 2019(03)
[10]基于自適應(yīng)人工魚群FCM的異常檢測算法[J]. 席亮,王勇,張鳳斌. 計算機研究與發(fā)展. 2019(05)
本文編號:3211933
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3211933.html
最近更新
教材專著