基于顯露模式的數(shù)據(jù)流貝葉斯分類算法
本文選題:數(shù)據(jù)流 切入點:顯露模式 出處:《軟件學(xué)報》2017年11期
【摘要】:基于模式的貝葉斯分類模型是解決數(shù)據(jù)挖掘領(lǐng)域分類問題的一種有效方法.然而,大多數(shù)基于模式的貝葉斯分類器只考慮模式在目標(biāo)類數(shù)據(jù)集中的支持度,而忽略了模式在對立類數(shù)據(jù)集合中的支持度.此外,對于高速動態(tài)變化的無限數(shù)據(jù)流環(huán)境,在靜態(tài)數(shù)據(jù)集下的基于模式的貝葉斯分類器就不能適用.為了解決這些問題,提出了基于顯露模式的數(shù)據(jù)流貝葉斯分類模型EPDS(Bayesian classifier algorithm based on emerging pattern for data stream).該模型使用一個簡單的混合森林結(jié)構(gòu)來維護內(nèi)存中事務(wù)的項集,并采用一種快速的模式抽取機制來提高算法速度.EPDS采用半懶惰式學(xué)習(xí)策略持續(xù)更新顯露模式,并為待分類事務(wù)在每個類下建立局部分類模型.大量實驗結(jié)果表明,該算法比其他數(shù)據(jù)流分類模型有較高的準(zhǔn)確度.
[Abstract]:However most of the Bayesian classifiers based on schema only consider the support of schema in the target class dataset but ignore the support degree of schema in the set of opposing class data.In addition, for an infinite data flow environment with high speed and dynamic change, a schema-based Bayesian classifier based on static data sets is not applicable.In order to solve these problems, EPDS(Bayesian classifier algorithm based on emerging pattern for data streamer is proposed.This model uses a simple mixed forest structure to maintain the itemsets of in-memory transactions, and adopts a fast pattern extraction mechanism to improve the algorithm speed. EPDS uses semi-lazy learning strategies to continuously update the exposed pattern.A local classification model is established under each class for the transactions to be classified.A large number of experimental results show that the algorithm is more accurate than other data stream classification models.
【作者單位】: 北京交通大學(xué)計算機與信息技術(shù)學(xué)院;
【分類號】:TP18;TP311.13
【相似文獻】
相關(guān)會議論文 前6條
1 袁野;胡邦輝;劉丹軍;蘇宏琛;;基于貝葉斯分類判別方法的雷暴預(yù)報研究[A];第26屆中國氣象學(xué)會年會災(zāi)害天氣事件的預(yù)警、預(yù)報及防災(zāi)減災(zāi)分會場論文集[C];2009年
2 李千目;嚴(yán)悍;劉靜;王宗月;張宏;劉鳳玉;;基于貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)性能診斷系統(tǒng)[A];第16屆中國過程控制學(xué)術(shù)年會暨第4屆全國故障診斷與安全性學(xué)術(shù)會議論文集[C];2005年
3 馬后鋒;樊興華;;一種改進的增量貝葉斯分類算法[A];2007'儀表,,自動化及先進集成技術(shù)大會論文集(一)[C];2007年
4 鄧紅;陳丹;周方;;基于貝葉斯網(wǎng)絡(luò)的多主題對話管理方法研究[A];2010通信理論與技術(shù)新發(fā)展——第十五屆全國青年通信學(xué)術(shù)會議論文集(下冊)[C];2010年
5 周德全;;離散貝葉斯分類算法及分類誤差估計[A];中國儀器儀表學(xué)會第六屆青年學(xué)術(shù)會議論文集[C];2004年
6 陳猛;郭華平;范明;;一種基于貝葉斯的多窗口數(shù)據(jù)流分類模型[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年
相關(guān)博士學(xué)位論文 前3條
1 馮e
本文編號:1685421
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1685421.html