深度隨機(jī)神經(jīng)網(wǎng)絡(luò)單分類器理論、算法與應(yīng)用研究
發(fā)布時(shí)間:2021-01-24 19:10
單分類(One-Class Classification)算法旨在建立針對(duì)目標(biāo)數(shù)據(jù)的分類模型,學(xué)習(xí)目標(biāo)數(shù)據(jù)的特征并得到識(shí)別模型,用來(lái)檢測(cè)異常樣本。它在許多應(yīng)用場(chǎng)景有著優(yōu)越的性能,如異常檢測(cè)、不均衡數(shù)據(jù)集分類識(shí)別等。代表性的單分類算法主要有支撐向量機(jī)單分類算法(OC-SVM),支撐向量數(shù)據(jù)描述(SVDD),樸素帕森密度估計(jì)(Naive Parzen density estimation),自編碼器(Autoencoder)等。但現(xiàn)有的單分類算法,在復(fù)雜或高維大數(shù)據(jù)集等分類場(chǎng)景中性能較差。因此,如何提升現(xiàn)有單分類算法的性能以便于為將來(lái)的實(shí)際應(yīng)用提供可能性,是亟待解決的問題。近年來(lái),由于基于超限學(xué)習(xí)機(jī)單分類算法(One-Class Extreme Learning Machine,OC-ELM)的優(yōu)異性能。本文深入研究了OC-ELM并對(duì)其進(jìn)行改進(jìn),論文的創(chuàng)新主要圍繞提升單分類器對(duì)復(fù)雜數(shù)據(jù)集的表征能力,模型泛化能力以及抗干擾噪聲能力等方面展開。主要工作和成果如下:1.針對(duì)淺層網(wǎng)絡(luò)對(duì)復(fù)雜或高維大數(shù)據(jù)集表征能力不足的缺點(diǎn),構(gòu)建基于多層堆疊自編碼器的深度神經(jīng)網(wǎng)絡(luò)模型。同時(shí)為了加快學(xué)習(xí)速度,采用基于超...
【文章來(lái)源】:杭州電子科技大學(xué)浙江省
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高斯分布
杭州電子科技大學(xué)碩士學(xué)位論文基于深度的方法,即從點(diǎn)空間的邊緣定位異常點(diǎn),按照實(shí)際需求決定層數(shù)及異常點(diǎn)的個(gè)數(shù)。如下圖所示,圈中密密麻麻的黑點(diǎn)代表一個(gè)個(gè)數(shù)據(jù)點(diǎn),基于的假設(shè)是點(diǎn)空間中心這些分布比較集中、密度較高的點(diǎn)都是正常點(diǎn),而異常點(diǎn)都位于外層,即分布比較稀疏的地方。如下圖所示,最外層點(diǎn)圖1.2:點(diǎn)空間分布的深度為1,再往內(nèi)幾層深度一次為2、3、4...若設(shè)置閾值k=2,那么深度小于等于2的點(diǎn)就全部為異常點(diǎn)。這一方法最早由Tukey在1997年首次提出[56]。但這個(gè)基礎(chǔ)模型僅適用于二維、三圖1.3:點(diǎn)空間深度維空間,F(xiàn)在有很多流行的算法都借鑒了這種模型的思想,通過(guò)改變計(jì)算深度的方式,可以實(shí)現(xiàn)高維空間的異常檢測(cè),如孤立森林算法[60]。(3)基于偏差的方法這是一種比較簡(jiǎn)單的統(tǒng)計(jì)方法,最初是為一維異常檢測(cè)設(shè)計(jì)的。給定一個(gè)數(shù)據(jù)集,對(duì)每個(gè)點(diǎn)進(jìn)行檢測(cè),如果一個(gè)點(diǎn)自身的值與整個(gè)集合的指標(biāo)存在過(guò)大的偏差,則該點(diǎn)為異常點(diǎn)。具體的實(shí)現(xiàn)方法是,定義一個(gè)指標(biāo)SF(SmoothFactor),這個(gè)指標(biāo)就是把某個(gè)點(diǎn)從集合剔除后方差所降低的差值。通過(guò)設(shè)定一個(gè)閾值,與這些偏差值進(jìn)行比較來(lái)確定哪些點(diǎn)存在異常。這個(gè)方法是由Arning在1996年首次提出的[5]。-3-
杭州電子科技大學(xué)碩士學(xué)位論文基于深度的方法,即從點(diǎn)空間的邊緣定位異常點(diǎn),按照實(shí)際需求決定層數(shù)及異常點(diǎn)的個(gè)數(shù)。如下圖所示,圈中密密麻麻的黑點(diǎn)代表一個(gè)個(gè)數(shù)據(jù)點(diǎn),基于的假設(shè)是點(diǎn)空間中心這些分布比較集中、密度較高的點(diǎn)都是正常點(diǎn),而異常點(diǎn)都位于外層,即分布比較稀疏的地方。如下圖所示,最外層點(diǎn)圖1.2:點(diǎn)空間分布的深度為1,再往內(nèi)幾層深度一次為2、3、4...若設(shè)置閾值k=2,那么深度小于等于2的點(diǎn)就全部為異常點(diǎn)。這一方法最早由Tukey在1997年首次提出[56]。但這個(gè)基礎(chǔ)模型僅適用于二維、三圖1.3:點(diǎn)空間深度維空間,F(xiàn)在有很多流行的算法都借鑒了這種模型的思想,通過(guò)改變計(jì)算深度的方式,可以實(shí)現(xiàn)高維空間的異常檢測(cè),如孤立森林算法[60]。(3)基于偏差的方法這是一種比較簡(jiǎn)單的統(tǒng)計(jì)方法,最初是為一維異常檢測(cè)設(shè)計(jì)的。給定一個(gè)數(shù)據(jù)集,對(duì)每個(gè)點(diǎn)進(jìn)行檢測(cè),如果一個(gè)點(diǎn)自身的值與整個(gè)集合的指標(biāo)存在過(guò)大的偏差,則該點(diǎn)為異常點(diǎn)。具體的實(shí)現(xiàn)方法是,定義一個(gè)指標(biāo)SF(SmoothFactor),這個(gè)指標(biāo)就是把某個(gè)點(diǎn)從集合剔除后方差所降低的差值。通過(guò)設(shè)定一個(gè)閾值,與這些偏差值進(jìn)行比較來(lái)確定哪些點(diǎn)存在異常。這個(gè)方法是由Arning在1996年首次提出的[5]。-3-
本文編號(hào):2997777
【文章來(lái)源】:杭州電子科技大學(xué)浙江省
【文章頁(yè)數(shù)】:88 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高斯分布
杭州電子科技大學(xué)碩士學(xué)位論文基于深度的方法,即從點(diǎn)空間的邊緣定位異常點(diǎn),按照實(shí)際需求決定層數(shù)及異常點(diǎn)的個(gè)數(shù)。如下圖所示,圈中密密麻麻的黑點(diǎn)代表一個(gè)個(gè)數(shù)據(jù)點(diǎn),基于的假設(shè)是點(diǎn)空間中心這些分布比較集中、密度較高的點(diǎn)都是正常點(diǎn),而異常點(diǎn)都位于外層,即分布比較稀疏的地方。如下圖所示,最外層點(diǎn)圖1.2:點(diǎn)空間分布的深度為1,再往內(nèi)幾層深度一次為2、3、4...若設(shè)置閾值k=2,那么深度小于等于2的點(diǎn)就全部為異常點(diǎn)。這一方法最早由Tukey在1997年首次提出[56]。但這個(gè)基礎(chǔ)模型僅適用于二維、三圖1.3:點(diǎn)空間深度維空間,F(xiàn)在有很多流行的算法都借鑒了這種模型的思想,通過(guò)改變計(jì)算深度的方式,可以實(shí)現(xiàn)高維空間的異常檢測(cè),如孤立森林算法[60]。(3)基于偏差的方法這是一種比較簡(jiǎn)單的統(tǒng)計(jì)方法,最初是為一維異常檢測(cè)設(shè)計(jì)的。給定一個(gè)數(shù)據(jù)集,對(duì)每個(gè)點(diǎn)進(jìn)行檢測(cè),如果一個(gè)點(diǎn)自身的值與整個(gè)集合的指標(biāo)存在過(guò)大的偏差,則該點(diǎn)為異常點(diǎn)。具體的實(shí)現(xiàn)方法是,定義一個(gè)指標(biāo)SF(SmoothFactor),這個(gè)指標(biāo)就是把某個(gè)點(diǎn)從集合剔除后方差所降低的差值。通過(guò)設(shè)定一個(gè)閾值,與這些偏差值進(jìn)行比較來(lái)確定哪些點(diǎn)存在異常。這個(gè)方法是由Arning在1996年首次提出的[5]。-3-
杭州電子科技大學(xué)碩士學(xué)位論文基于深度的方法,即從點(diǎn)空間的邊緣定位異常點(diǎn),按照實(shí)際需求決定層數(shù)及異常點(diǎn)的個(gè)數(shù)。如下圖所示,圈中密密麻麻的黑點(diǎn)代表一個(gè)個(gè)數(shù)據(jù)點(diǎn),基于的假設(shè)是點(diǎn)空間中心這些分布比較集中、密度較高的點(diǎn)都是正常點(diǎn),而異常點(diǎn)都位于外層,即分布比較稀疏的地方。如下圖所示,最外層點(diǎn)圖1.2:點(diǎn)空間分布的深度為1,再往內(nèi)幾層深度一次為2、3、4...若設(shè)置閾值k=2,那么深度小于等于2的點(diǎn)就全部為異常點(diǎn)。這一方法最早由Tukey在1997年首次提出[56]。但這個(gè)基礎(chǔ)模型僅適用于二維、三圖1.3:點(diǎn)空間深度維空間,F(xiàn)在有很多流行的算法都借鑒了這種模型的思想,通過(guò)改變計(jì)算深度的方式,可以實(shí)現(xiàn)高維空間的異常檢測(cè),如孤立森林算法[60]。(3)基于偏差的方法這是一種比較簡(jiǎn)單的統(tǒng)計(jì)方法,最初是為一維異常檢測(cè)設(shè)計(jì)的。給定一個(gè)數(shù)據(jù)集,對(duì)每個(gè)點(diǎn)進(jìn)行檢測(cè),如果一個(gè)點(diǎn)自身的值與整個(gè)集合的指標(biāo)存在過(guò)大的偏差,則該點(diǎn)為異常點(diǎn)。具體的實(shí)現(xiàn)方法是,定義一個(gè)指標(biāo)SF(SmoothFactor),這個(gè)指標(biāo)就是把某個(gè)點(diǎn)從集合剔除后方差所降低的差值。通過(guò)設(shè)定一個(gè)閾值,與這些偏差值進(jìn)行比較來(lái)確定哪些點(diǎn)存在異常。這個(gè)方法是由Arning在1996年首次提出的[5]。-3-
本文編號(hào):2997777
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2997777.html
最近更新
教材專著