天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于決策樹(shù)的三支決策概念漂移檢測(cè)

發(fā)布時(shí)間:2024-05-10 23:44
  近年來(lái),移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)高速發(fā)展,各種形式的網(wǎng)絡(luò)應(yīng)用走進(jìn)日常生活中,例如移動(dòng)支付,傳感器網(wǎng)絡(luò)等。這些應(yīng)用每天都在處理海量的數(shù)據(jù),并且提供實(shí)時(shí)的網(wǎng)絡(luò)服務(wù),例如數(shù)據(jù)查詢和個(gè)性化推薦,智能服務(wù)等。許多應(yīng)用的數(shù)據(jù)以數(shù)據(jù)流的形式產(chǎn)生。由于數(shù)據(jù)流具有海量、連續(xù)快速產(chǎn)生和隨時(shí)間不斷動(dòng)態(tài)變化的特點(diǎn),數(shù)據(jù)流中的數(shù)據(jù)處理必須滿足實(shí)時(shí)性的要求。傳統(tǒng)的數(shù)據(jù)挖掘算法面臨巨大挑戰(zhàn),需要針對(duì)數(shù)據(jù)流的本身特點(diǎn)和應(yīng)用特點(diǎn)提出相應(yīng)的算法。同時(shí),數(shù)據(jù)流中存在概念漂移問(wèn)題,數(shù)據(jù)中的概念會(huì)隨著時(shí)間和背景環(huán)境發(fā)生改變,數(shù)據(jù)流中的模型需要及時(shí)發(fā)現(xiàn)這些變化,對(duì)這些變化進(jìn)行檢測(cè),使模型能夠及時(shí)對(duì)新概念進(jìn)行學(xué)習(xí)。而傳統(tǒng)的概念漂移檢測(cè)方法一般根據(jù)某些檢測(cè)指標(biāo)將概念劃分為發(fā)生漂移、沒(méi)有發(fā)生漂移兩類。這些方法容易受到噪音等不確定因素的影響,將變化速度較緩慢的概念漂移判定為概念沒(méi)有漂移,將不確定因素造成的檢測(cè)指標(biāo)變化判定為概念發(fā)生漂移,檢測(cè)準(zhǔn)確率較低。針對(duì)這個(gè)問(wèn)題,本文提出一種三支決策的概念漂移檢測(cè)算法,提高了檢測(cè)性。1.本文提出一種三支決策概念漂移檢測(cè)算法。利用決策樹(shù)學(xué)習(xí)數(shù)據(jù)流中的概念,然后不斷檢測(cè)概念是否發(fā)生漂移。決策樹(shù)中的每棵子樹(shù)...

【文章頁(yè)數(shù)】:56 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖3.1三支決策概念漂移檢測(cè)框架

圖3.1三支決策概念漂移檢測(cè)框架

先介紹算法的總體框架,然后介紹算法各部分的詳細(xì)流程。3.1三支決策概念漂移檢測(cè)框架本文算法框架如圖3.1所示。整個(gè)過(guò)程分為兩個(gè)階段:離線計(jì)算階段和在線計(jì)算階段。在離線計(jì)算階段,從數(shù)據(jù)流中取出一部分樣本生成初始概念樹(shù),這里概念樹(shù)是本文提出的一種決策樹(shù)分類器。離線階段學(xué)習(xí)得到數(shù)....


圖3.2t=4根結(jié)點(diǎn)分裂后樹(shù)圖

圖3.2t=4根結(jié)點(diǎn)分裂后樹(shù)圖

圖3.2t=4根結(jié)點(diǎn)分裂后樹(shù)圖圖3.3初始概念樹(shù)的分枝和葉結(jié)點(diǎn)。重復(fù)上述過(guò)程,直到。當(dāng)時(shí),生成如圖3.3所示初始概念樹(shù)。在上述算法中,假設(shè)概念樹(shù)含有個(gè)結(jié)點(diǎn),屬性個(gè)數(shù)為,每個(gè)屬性具有屬性值個(gè)數(shù)最多為,類標(biāo)個(gè)數(shù)為個(gè),則最多需要的空間來(lái)存儲(chǔ)統(tǒng)計(jì)信息。當(dāng)數(shù)據(jù)流....


圖3.3初始概念樹(shù)

圖3.3初始概念樹(shù)

圖3.2t=4根結(jié)點(diǎn)分裂后樹(shù)圖圖3.3初始概念樹(shù)的分枝和葉結(jié)點(diǎn)。重復(fù)上述過(guò)程,直到。當(dāng)時(shí),生成如圖3.3所示初始概念樹(shù)。在上述算法中,假設(shè)概念樹(shù)含有個(gè)結(jié)點(diǎn),屬性個(gè)數(shù)為,每個(gè)屬性具有屬性值個(gè)數(shù)最多為,類標(biāo)個(gè)數(shù)為個(gè),則最多需要的空間來(lái)存儲(chǔ)統(tǒng)計(jì)信息。當(dāng)數(shù)據(jù)流....


圖3.4t=40時(shí)的概念樹(shù)

圖3.4t=40時(shí)的概念樹(shù)

樹(shù)的分類錯(cuò)誤率,設(shè)置概念樹(shù)各子樹(shù)的初始閾值。然后依照算法2對(duì)t=33到t=40的樣本進(jìn)行分類并更新決策樹(shù)。當(dāng)t=40時(shí),生成如圖3.4所示概念樹(shù),計(jì)算分類錯(cuò)誤率并進(jìn)入第一次概念漂移判定,并對(duì)發(fā)生漂移的子樹(shù)進(jìn)行處理。表3.9數(shù)據(jù)流SU1a2a3ac....



本文編號(hào):3969198

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3969198.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶36471***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com