基于密度的不確定數(shù)據(jù)流聚類算法
[Abstract]:With the emergence of uncertainty, the traditional algorithm can not be directly used to cluster uncertain data streams. In this paper, a density-based clustering algorithm in uncertain data flow environment is proposed, in which the concept of uncertainty is proposed to measure the distribution information of uncertain data, and on the basis of improving the clustering algorithm DENCLUE for deterministic data, In order to reduce the influence of data uncertainty on clustering results, a UDENCLUE algorithm is proposed, which can deal with the uncertainty of data. A density-based uncertain data stream clustering algorithm USDENCLUE, based on sliding window is proposed to realize fast pruning by clustering feature index histogram technique, which can process noise data efficiently, evolve data stream and generate clusters of arbitrary shape. The real data set and the synthetic data set are used to compare the USDENCLUE clustering algorithm with the CluStream clustering algorithm. The experimental results show that the proposed algorithm is efficient and effective.
【作者單位】: 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金面上項(xiàng)目(61173029,61672144)
【分類號】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 申德榮;于戈;寇月;聶鐵錚;;可能世界內(nèi)數(shù)值型不確定數(shù)據(jù)匹配模型[J];計(jì)算機(jī)應(yīng)用研究;2008年09期
2 崔斌;盧陽;;基于不確定數(shù)據(jù)的查詢處理綜述[J];計(jì)算機(jī)應(yīng)用;2008年11期
3 徐雪松;;時(shí)間序列不確定數(shù)據(jù)流中異常數(shù)據(jù)檢測方法[J];電子設(shè)計(jì)工程;2011年19期
4 徐雪松;李玲娟;郭立瑋;;基于優(yōu)化策略的不確定數(shù)據(jù)流預(yù)測方法[J];計(jì)算機(jī)工程;2011年21期
5 徐雪松;沈紅紅;陶帆;胡曉璐;崔偉;;基于小波分析的不確定數(shù)據(jù)流異常數(shù)據(jù)檢測[J];軟件導(dǎo)刊;2011年11期
6 錢江波;王志杰;陳華輝;王海斌;;不確定數(shù)據(jù)流自適應(yīng)并行連接算法及應(yīng)用[J];電信科學(xué);2012年02期
7 向劍平;喬少杰;胡劍;;基于不確定數(shù)據(jù)理論的道路相關(guān)度度量方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年06期
8 蔣濤;高云君;張彬;周傲英;樂光學(xué);;不確定數(shù)據(jù)查詢處理[J];電子學(xué)報(bào);2013年05期
9 王爽;楊廣明;朱志良;;基于不確定數(shù)據(jù)的頻繁項(xiàng)查詢算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
10 王意潔;李小勇;祁亞斐;孫偉東;;不確定數(shù)據(jù)查詢技術(shù)研究[J];計(jì)算機(jī)研究與發(fā)展;2012年07期
相關(guān)會(huì)議論文 前6條
1 高聰;申德榮;于戈;聶鐵錚;寇月;;一種基于不確定數(shù)據(jù)的挖掘頻繁集方法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年
2 周遜;李建中;石勝飛;;不確定數(shù)據(jù)上聚集查詢的分布式處理算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
3 王曉偉;黃九鳴;賈焰;;分布式不確定數(shù)據(jù)上的概率Skyline計(jì)算[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
4 艾文凱;張剡;柏文陽;;基于用戶偏好的不確定數(shù)據(jù)閾值輪廓查詢算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
5 陸葉;王麗珍;張曉峰;;從不確定數(shù)據(jù)集中挖掘頻繁Co-location模式[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
6 孫永佼;王國仁;;P2P環(huán)境中不確定數(shù)據(jù)Top-k查詢處理算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
相關(guān)博士學(xué)位論文 前10條
1 陳靜玉;面向不確定數(shù)據(jù)流的聚類和模式挖掘技術(shù)研究[D];西安電子科技大學(xué);2014年
2 曹科研;不確定數(shù)據(jù)的聚類分析與異常點(diǎn)檢測算法[D];東北大學(xué);2014年
3 李佳佳;不確定數(shù)據(jù)的概率近鄰查詢處理技術(shù)研究[D];東北大學(xué);2014年
4 徐傳飛;面向多維不確定數(shù)據(jù)的若干查詢處理關(guān)鍵技術(shù)的研究[D];東北大學(xué);2013年
5 羅昌銀;位置及文本相關(guān)查詢處理及驗(yàn)證策略研究[D];華中科技大學(xué);2015年
6 湯克明;不確定數(shù)據(jù)流中頻繁數(shù)據(jù)挖掘研究[D];南京航空航天大學(xué);2012年
7 梁春泉;不確定數(shù)據(jù)流分類算法研究[D];西北農(nóng)林科技大學(xué);2014年
8 高明;不確定數(shù)據(jù)的世系管理和相似性查詢[D];復(fù)旦大學(xué);2011年
9 董俊;不確定數(shù)據(jù)中數(shù)據(jù)挖掘方法的研究[D];燕山大學(xué);2012年
10 孫永佼;P2P環(huán)境下排序查詢處理和分類技術(shù)的研究[D];東北大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 孫鳳姣;概率XML數(shù)據(jù)文檔的分發(fā)技術(shù)研究[D];大連海事大學(xué);2015年
2 李雨明;不確定數(shù)據(jù)的挖掘算法研究[D];上海交通大學(xué);2015年
3 曹慶傲;不確定性數(shù)據(jù)Top-k查詢算法與實(shí)現(xiàn)[D];貴州大學(xué);2015年
4 李紅;不確定數(shù)據(jù)流查詢處理算法的研究[D];黑龍江大學(xué);2015年
5 甘果;基于不確定數(shù)據(jù)的范圍查詢算法的研究與實(shí)現(xiàn)[D];東北大學(xué);2014年
6 張昕;基于分布式極限學(xué)習(xí)機(jī)的不確定數(shù)據(jù)流分類技術(shù)的研究與實(shí)現(xiàn)[D];東北大學(xué);2014年
7 郎泓鈺;面向不確定數(shù)據(jù)的最近鄰分類方法研究[D];遼寧師范大學(xué);2015年
8 趙超群;不確定數(shù)據(jù)質(zhì)量評估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2014年
9 梁s,
本文編號:2489994
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2489994.html