基于深度變分學(xué)習(xí)的異常檢測(cè)模型研究
發(fā)布時(shí)間:2021-08-18 14:32
異常檢測(cè)是數(shù)據(jù)挖掘中的重要任務(wù),其基本目標(biāo)是檢測(cè)出偏離整體數(shù)據(jù)特征的數(shù)據(jù)值,同時(shí)隨著信息技術(shù)的發(fā)展,現(xiàn)有的異常檢測(cè)模型已經(jīng)無(wú)法滿足當(dāng)下的異常檢測(cè)需求,基于深度學(xué)習(xí)的異常檢測(cè)模型逐漸成為了一個(gè)新的研究方向。在深度異常檢測(cè)領(lǐng)域中主要兩類模型,一是混合模型,混合模型是將傳統(tǒng)的異常檢測(cè)算法和深度學(xué)習(xí)降維算法相結(jié)合,從而提高檢測(cè)效率的模型。二是生成模型,生成模型通過(guò)訓(xùn)練數(shù)據(jù)直接對(duì)數(shù)據(jù)進(jìn)行建模,通過(guò)觀測(cè)樣本估計(jì)其分布特征,同時(shí)結(jié)合判別模型進(jìn)行高維數(shù)據(jù)的異常檢測(cè)。針對(duì)目前異常檢測(cè)模型的優(yōu)缺點(diǎn),提出了一種混合檢測(cè)模型,通過(guò)結(jié)合深度學(xué)習(xí)降維算法和改進(jìn)的傳統(tǒng)檢測(cè)模型進(jìn)行異常檢測(cè),本文的主要工作如下:(1).對(duì)異常檢測(cè)相關(guān)工作的討論和分析概述了深度學(xué)習(xí)在異常檢測(cè)領(lǐng)域中現(xiàn)階段的發(fā)展情況,總結(jié)了在異常檢測(cè)領(lǐng)域中相關(guān)技術(shù)以及數(shù)據(jù)降維的研究現(xiàn)狀。提出了基于深度變分降維的混合模型并用于異常檢測(cè),并概述了其優(yōu)勢(shì)與不足,同時(shí)闡明了研究方向。(2).基于雙向鄰居修正的局部異常因子算法提出基于雙向鄰居修正的局部異常因子算法,利用雙向鄰居搜索算法選取較優(yōu)參數(shù)用于計(jì)算異常值,結(jié)合所提剪枝算法減少了鄰域搜索時(shí)間和不必要的異常值計(jì)算...
【文章來(lái)源】:河北大學(xué)河北省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
離群點(diǎn)
河北大學(xué)碩士學(xué)位論文8下面是LOF算法的主要概念:1)d(p,o)表示p和o兩點(diǎn)之間的距離;2)kdistance表示第k距離。對(duì)于點(diǎn)p的第k距離dk(p)=d(p,o),并且滿足a)在集合中至少有不包括p在內(nèi)的k個(gè)點(diǎn)o′∈C{x≠p},滿足d(p,o′)≤d(p,o)b)在集合中最多有不包括p在內(nèi)的k1個(gè)點(diǎn)o′∈C{x≠p},滿足d(p,o′)<d(p,o)p的第k距離,即距離p第k遠(yuǎn)的點(diǎn)的距離,不包括p。如圖2-2圖2-2第k距離3)第k距離鄰域:kdistanceneighborhoodofp表示p的第k距離鄰域點(diǎn)p的第k距離鄰域Nk(p)表示距離小于p的第k距離內(nèi)的所有數(shù)據(jù)點(diǎn),包括第k距離的數(shù)據(jù)點(diǎn)。因此p的第k鄰域點(diǎn)的個(gè)數(shù)∣Nk(p)∣≥k4)reachdistance表示可達(dá)距離,點(diǎn)o到點(diǎn)p的第k可達(dá)距離定義為:reachdistance(p,o)max{kdistance(o),d(p,o)}(2.1)即點(diǎn)O到點(diǎn)p的第k可達(dá)距離,至少是O的第k距離,或者為O,p間的真實(shí)距離。這意味著,離點(diǎn)O最近的k個(gè)點(diǎn),O到他們的可達(dá)距離被認(rèn)為相等,且都等于dkO)如圖,O1到p的第5可達(dá)距離為d(p,O1),O2到p的第5可達(dá)距離為d5(O2),如圖2-3所示。圖2-3可達(dá)距離
可達(dá)距離
【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)通信異常識(shí)別的多步攻擊檢測(cè)方法[J]. 琚安康,郭淵博,李濤,葉子維. 通信學(xué)報(bào). 2019(07)
[2]基于密度偏倚抽樣的局部距離異常檢測(cè)方法[J]. 付培國(guó),胡曉惠. 軟件學(xué)報(bào). 2017(10)
本文編號(hào):3350066
【文章來(lái)源】:河北大學(xué)河北省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
離群點(diǎn)
河北大學(xué)碩士學(xué)位論文8下面是LOF算法的主要概念:1)d(p,o)表示p和o兩點(diǎn)之間的距離;2)kdistance表示第k距離。對(duì)于點(diǎn)p的第k距離dk(p)=d(p,o),并且滿足a)在集合中至少有不包括p在內(nèi)的k個(gè)點(diǎn)o′∈C{x≠p},滿足d(p,o′)≤d(p,o)b)在集合中最多有不包括p在內(nèi)的k1個(gè)點(diǎn)o′∈C{x≠p},滿足d(p,o′)<d(p,o)p的第k距離,即距離p第k遠(yuǎn)的點(diǎn)的距離,不包括p。如圖2-2圖2-2第k距離3)第k距離鄰域:kdistanceneighborhoodofp表示p的第k距離鄰域點(diǎn)p的第k距離鄰域Nk(p)表示距離小于p的第k距離內(nèi)的所有數(shù)據(jù)點(diǎn),包括第k距離的數(shù)據(jù)點(diǎn)。因此p的第k鄰域點(diǎn)的個(gè)數(shù)∣Nk(p)∣≥k4)reachdistance表示可達(dá)距離,點(diǎn)o到點(diǎn)p的第k可達(dá)距離定義為:reachdistance(p,o)max{kdistance(o),d(p,o)}(2.1)即點(diǎn)O到點(diǎn)p的第k可達(dá)距離,至少是O的第k距離,或者為O,p間的真實(shí)距離。這意味著,離點(diǎn)O最近的k個(gè)點(diǎn),O到他們的可達(dá)距離被認(rèn)為相等,且都等于dkO)如圖,O1到p的第5可達(dá)距離為d(p,O1),O2到p的第5可達(dá)距離為d5(O2),如圖2-3所示。圖2-3可達(dá)距離
可達(dá)距離
【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)通信異常識(shí)別的多步攻擊檢測(cè)方法[J]. 琚安康,郭淵博,李濤,葉子維. 通信學(xué)報(bào). 2019(07)
[2]基于密度偏倚抽樣的局部距離異常檢測(cè)方法[J]. 付培國(guó),胡曉惠. 軟件學(xué)報(bào). 2017(10)
本文編號(hào):3350066
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3350066.html
最近更新
教材專著