基于K-means的數(shù)據(jù)流離群點檢測算法
本文選題:概念漂移 切入點:數(shù)據(jù)流 出處:《計算機工程與應(yīng)用》2017年03期 論文類型:期刊論文
【摘要】:針對數(shù)據(jù)流中離群點挖掘問題,在K-means聚類算法基礎(chǔ)上,提出了基于距離的準(zhǔn)則進行數(shù)據(jù)間離群點判斷的離群點檢測DOKM算法。根據(jù)數(shù)據(jù)流概念漂移檢測結(jié)果來自適應(yīng)地調(diào)整滑動窗口大小,從而實現(xiàn)對數(shù)據(jù)流的離群點檢測,與其他離群點算法的一系列實驗驗證和對比結(jié)果表明,DOKM算法在人工數(shù)據(jù)集和真實數(shù)據(jù)集中均可以實現(xiàn)對離群點的有效檢測。
[Abstract]:Aiming at the problem of outlier mining in data flow, based on K-means clustering algorithm, An outlier detection algorithm based on distance criterion is proposed to detect outliers in data streams. According to the results of data stream conceptual drift detection, the sliding window size is adjusted adaptively to realize outlier detection of data streams. A series of experiments and comparisons with other outliers show that the DOKM algorithm can effectively detect outliers in both artificial and real datasets.
【作者單位】: 南京郵電大學(xué)計算機學(xué)院;南京郵電大學(xué)通達(dá)學(xué)院;
【基金】:江蘇省自然科學(xué)基金(No.BK20150868) 江蘇省交通運輸與安全保障重點實驗室開放課題(No.TTS201502) 江蘇省無線傳感網(wǎng)高技術(shù)研究重點實驗室開放課題(No.WSNLBZY201505) 南京郵電大學(xué)引進人才科研啟動基金(No.NY214013);南京郵電大學(xué)通達(dá)學(xué)院大學(xué)生科技創(chuàng)新訓(xùn)練計劃STITP(No.201513989010Y)
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 薛安榮;姚林;鞠時光;陳偉鶴;馬漢達(dá);;離群點挖掘方法綜述[J];計算機科學(xué);2008年11期
2 李存華;;l_∞度量意義下的離群點檢測[J];淮海工學(xué)院學(xué)報(自然科學(xué)版);2008年02期
3 李昕;顏學(xué)峰;;融合離群點判別的穩(wěn)態(tài)檢測方法及其應(yīng)用[J];華東理工大學(xué)學(xué)報(自然科學(xué)版);2009年01期
4 封海岳;薛安榮;;基于重疊模塊度的社區(qū)離群點檢測[J];計算機應(yīng)用與軟件;2013年05期
5 王柏鈞,王力勤;《穩(wěn)健回歸與離群點檢測》介紹[J];成都?xì)庀髮W(xué)院學(xué)報;1989年04期
6 黃添強;秦小麟;葉飛躍;;基于方形鄰域的離群點查找新方法[J];控制與決策;2006年05期
7 熊君麗;;高維空間下基于密度的離群點探測算法實現(xiàn)[J];現(xiàn)代電子技術(shù);2006年15期
8 黃添強;秦小麟;王欽敏;;空間離群點的模型與跳躍取樣查找算法[J];中國圖象圖形學(xué)報;2006年09期
9 陳光平;葉東毅;;一種改進的離群點檢測方法[J];福州大學(xué)學(xué)報(自然科學(xué)版);2007年03期
10 薛安榮;鞠時光;;基于空間約束的離群點挖掘[J];計算機科學(xué);2007年06期
相關(guān)會議論文 前9條
1 張鋒;常會友;;茫然第三方支持的隱私保持離群點探測協(xié)議[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
2 連鳳娜;吳錦林;薛永生;;一種改進的基于距離的離群挖掘算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
3 梁雪琴;劉紅生;代秀梅;周亞芬;;聚類離群點挖掘技術(shù)在內(nèi)部審計信息化中的應(yīng)用——一個來自商業(yè)銀行信用卡審計的實例[A];全國內(nèi)部審計理論研討優(yōu)秀論文集(2013)[C];2014年
4 于浩;王斌;肖剛;楊曉春;;基于距離的不確定離群點檢測[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
5 許龍飛;熊君麗;段敏;;基于粗糙集的高維空間離群點發(fā)現(xiàn)算法研究[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2003年
6 劉文遠(yuǎn);李振平;王寶文;裴繼輝;;一種多維數(shù)據(jù)的離群點檢測算法[A];2007年全國第十一屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會議論文集[C];2007年
7 魏藜;錢衛(wèi)寧;周傲英;;HOT:尋找高維空間中的離群點[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年
8 周紅福;錢衛(wèi)寧;魏藜;周傲英;;EDOLOIS:高效準(zhǔn)確的子空間局部離群點發(fā)現(xiàn)[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2003年
9 魏藜;錢衛(wèi)寧;周傲英;;SLOT:基于估計的高效子空間局部離群點發(fā)現(xiàn)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2002年
相關(guān)博士學(xué)位論文 前10條
1 Chitrakar Roshan;[D];武漢大學(xué);2015年
2 劉莘;基于時空分析的CCS泄漏預(yù)警關(guān)鍵技術(shù)研究[D];中國礦業(yè)大學(xué);2016年
3 楊鵬;離群檢測及其優(yōu)化算法研究[D];重慶大學(xué);2010年
4 林海;離群檢測及離群釋義空間查找算法研究[D];重慶大學(xué);2012年
5 薛安榮;空間離群點挖掘技術(shù)的研究[D];江蘇大學(xué);2008年
6 楊茂林;離群檢測算法研究[D];華中科技大學(xué);2012年
7 金義富;高維稀疏離群數(shù)據(jù)集延伸知識發(fā)現(xiàn)研究[D];重慶大學(xué);2007年
8 雷大江;離群檢測與離群釋義算法研究[D];重慶大學(xué);2012年
9 萬家強;基于連通性的離群檢測與聚類研究[D];重慶大學(xué);2014年
10 唐向紅;數(shù)據(jù)流離群點檢測研究[D];華中科技大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 韓紅霞;基于距離離群點的分析與研究[D];江蘇大學(xué);2007年
2 黃馨玉;基于鄰域重心變化的離群點檢測算法研究[D];遼寧大學(xué);2015年
3 程百球;基于EP模式的離群點發(fā)現(xiàn)[D];安慶師范學(xué)院;2015年
4 歐陽根平;Hadoop云平臺下基于離群點挖掘的入侵檢測技術(shù)研究[D];電子科技大學(xué);2015年
5 鄧璇;數(shù)據(jù)流挖掘關(guān)鍵技術(shù)研究與實現(xiàn)[D];電子科技大學(xué);2015年
6 周瑩瑩;利用離群點檢測改進協(xié)同過濾推薦算法[D];南京郵電大學(xué);2015年
7 陳娟;基于離群特征提取和能量計算的SVM股市預(yù)測研究[D];合肥工業(yè)大學(xué);2014年
8 文靜云;基于加權(quán)自然鄰域?qū)傩院挽氐碾x群檢測研究[D];重慶大學(xué);2015年
9 梅孝輝;基于聚類的離群點挖掘在入侵檢測中的應(yīng)用研究[D];重慶大學(xué);2015年
10 秦浩;基于密度的局部離群點挖掘及在入侵檢測中應(yīng)用研究[D];大連海事大學(xué);2016年
,本文編號:1617854
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1617854.html