天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于密度的局部離群點(diǎn)檢測(cè)算法的改進(jìn)

發(fā)布時(shí)間:2022-01-19 16:38
  近年來(lái),科學(xué)技術(shù)發(fā)展越來(lái)越快,信息知識(shí)的傳播也更加廣泛,數(shù)據(jù)挖掘這門技術(shù)在各方面得到了推廣。數(shù)據(jù)挖掘?yàn)榱嗽诖笠?guī)模的、不確定的數(shù)據(jù)集中,找出人們事先不知道的,但蘊(yùn)含意義的知識(shí)。離群點(diǎn)檢測(cè)作為數(shù)據(jù)挖掘的一個(gè)重要組成部分,主要用來(lái)找出顯著偏離或不滿足一般對(duì)象行為特征的對(duì)象。目前,離群點(diǎn)檢測(cè)在生活中各領(lǐng)域已經(jīng)得到了廣泛地應(yīng)用。傳統(tǒng)的離群點(diǎn)檢測(cè)算法在一定程度上只能檢測(cè)出適用自身算法的異常數(shù)據(jù)對(duì)象,因此均存在一些缺陷,如檢測(cè)效率低、檢測(cè)精度差等。本文針對(duì)傳統(tǒng)的基于密度算法的執(zhí)行效率較低,并只在一定規(guī)模的數(shù)據(jù)集中有效,遇到大規(guī)模數(shù)據(jù)集時(shí),通常查準(zhǔn)率較低,重復(fù)計(jì)算的步驟過(guò)多等問(wèn)題,從而提出了基于方形鄰域和裁剪因子的離群點(diǎn)檢測(cè)方法。首先,采用方形鄰域,吸取網(wǎng)格算法的思想,以擴(kuò)張的方形鄰域代替網(wǎng)格分割,快速地排除聚類點(diǎn),避免了網(wǎng)格算法的“維災(zāi)”問(wèn)題。其次,為了提高算法的精確度,引入裁剪因子的概念對(duì)候選離群點(diǎn)集進(jìn)行精選。然后,給出了新的局部稀疏指數(shù)來(lái)評(píng)估對(duì)象的離群程度。為了驗(yàn)證改進(jìn)算法的性能,實(shí)驗(yàn)選取真實(shí)數(shù)據(jù)集和合成數(shù)據(jù)集進(jìn)行仿真,并與傳統(tǒng)的離群點(diǎn)檢測(cè)算法進(jìn)行比較分析。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的算法能有效的識(shí)別離... 

【文章來(lái)源】:沈陽(yáng)工業(yè)大學(xué)遼寧省

【文章頁(yè)數(shù)】:40 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于密度的局部離群點(diǎn)檢測(cè)算法的改進(jìn)


區(qū)域R中的離群點(diǎn)Fig2.1OutliersinregionR

示意圖,離群點(diǎn),示意圖


[52-53]。圖2.4 離群點(diǎn)的局部示意圖Fig 2.4 Partial schematic of the outliers基于密度算法的重心是一個(gè)對(duì)象周圍的密度。若鄰域內(nèi)數(shù)據(jù)對(duì)象的密度與它成為離群點(diǎn)的幾率成反比。2.4 離群點(diǎn)檢測(cè)方法的評(píng)價(jià)指標(biāo)評(píng)價(jià)離群點(diǎn)檢測(cè)算法的指標(biāo)有很多種,在這里主要分為有F 值( F measure),召回率( recall ),準(zhǔn)確率( precision ),分別用F 、R和P表示。在離群點(diǎn)檢測(cè)中,假設(shè)待檢測(cè)的數(shù)據(jù)集為D,rD 表示數(shù)據(jù)集中正常數(shù)據(jù)的集合,wD 表示異常的數(shù)據(jù)對(duì)象。滿足| | | | | |r w=D D + D。檢測(cè)正常點(diǎn)的數(shù)據(jù)集為 M

密度,最近鄰點(diǎn),離群點(diǎn),數(shù)據(jù)對(duì)象


圖 3.1 可達(dá)距離Fig.3.1 The reach-distance知,數(shù)據(jù)對(duì)象的鄰域內(nèi)數(shù)據(jù)的多少與參數(shù)k 成正比。局部可達(dá)密度[12]:''( )|| ( ) ||( )( )kkkko N oN olrd oreachdist o o∈=∑←離最近鄰點(diǎn)的平均可達(dá)密度的倒數(shù)。。局部離群點(diǎn)因子LOF 的數(shù)學(xué)表達(dá)式[53]:''( )( )( )( )|| ( ) ||kko N o kkklrd olrd oLOF oN o∈=∑o的局部可達(dá)密度與近鄰相除,確定該對(duì)象是否能夠成

【參考文獻(xiàn)】:
期刊論文
[1]基于局部密度的快速離群點(diǎn)檢測(cè)算法[J]. 鄒云峰,張昕,宋世淵,倪巍偉.  計(jì)算機(jī)應(yīng)用. 2017(10)
[2]高維數(shù)據(jù)離群點(diǎn)檢測(cè)的局部線性嵌入方法[J]. 鄧廷權(quán),劉金艷,王寧.  計(jì)算機(jī)工程與應(yīng)用. 2018(06)
[3]一種基于密度的不確定數(shù)據(jù)離群點(diǎn)檢測(cè)算法[J]. 姜元?jiǎng)P,鄭洪源,丁秋林.  計(jì)算機(jī)科學(xué). 2015(04)
[4]基于密度劃分的離群點(diǎn)檢測(cè)算法[J]. 魏龍,王勇.  計(jì)算機(jī)與現(xiàn)代化. 2015(03)
[5]DBSCAN算法中參數(shù)的自適應(yīng)確定[J]. 李宗林,羅可.  計(jì)算機(jī)工程與應(yīng)用. 2016(03)
[6]一種基于多重聚類的離群點(diǎn)檢測(cè)算法[J]. 古平,劉海波,羅志恒.  計(jì)算機(jī)應(yīng)用研究. 2013(03)
[7]一種基于密度的局部離群點(diǎn)檢測(cè)算法DLOF[J]. 胡彩平,秦小麟.  計(jì)算機(jī)研究與發(fā)展. 2010(12)
[8]基于密度的局部離群點(diǎn)檢測(cè)算法[J]. 張衛(wèi)旭,尉宇.  計(jì)算機(jī)與數(shù)字工程. 2010(10)
[9]基于鄰域和密度的異常點(diǎn)檢測(cè)算法[J]. 陶運(yùn)信,皮德常.  吉林大學(xué)學(xué)報(bào)(信息科學(xué)版). 2008(04)
[10]局部離群點(diǎn)挖掘算法研究[J]. 薛安榮,鞠時(shí)光,何偉華,陳偉鶴.  計(jì)算機(jī)學(xué)報(bào). 2007(08)

博士論文
[1]離群檢測(cè)算法研究[D]. 楊茂林.華中科技大學(xué) 2012

碩士論文
[1]局部離群點(diǎn)檢測(cè)算法的研究[D]. 馬菲.淮北師范大學(xué) 2016
[2]基于密度的局部離群點(diǎn)檢測(cè)算法的研究與應(yīng)用[D]. 周云鋒.華中師范大學(xué) 2016
[3]基于密度的局部離群點(diǎn)挖掘及在入侵檢測(cè)中應(yīng)用研究[D]. 秦浩.大連海事大學(xué) 2016
[4]基于密度差異的離群點(diǎn)檢測(cè)研究[D]. 辛麗玲.北京交通大學(xué) 2015
[5]基于密度的局部離群點(diǎn)檢測(cè)算法的研究與改進(jìn)[D]. 趙新想.華中師范大學(xué) 2014
[6]基于密度的局部離群數(shù)據(jù)挖掘方法的研究和改進(jìn)[D]. 劉書志.重慶大學(xué) 2014
[7]基于k近鄰樹的離群檢測(cè)算法研究[D]. 范小剛.重慶大學(xué) 2014
[8]數(shù)據(jù)挖掘中的離群點(diǎn)檢測(cè)算法研究[D]. 胡婷婷.廈門大學(xué) 2014
[9]離群點(diǎn)檢測(cè)及其應(yīng)用研究[D]. 楊福萍.山東師范大學(xué) 2013
[10]基于密度的局部離群點(diǎn)檢測(cè)算法分析與研究[D]. 揭財(cái)明.重慶大學(xué) 2012



本文編號(hào):3597201

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3597201.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5946d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com