天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

有概念漂移的數(shù)據(jù)流的半監(jiān)督分類(lèi)算法研究

發(fā)布時(shí)間:2021-01-17 03:30
  當(dāng)前,在許多應(yīng)用場(chǎng)景中,數(shù)據(jù)往往以數(shù)據(jù)流的形式出現(xiàn),由此帶來(lái)了一個(gè)新的研究方向——數(shù)據(jù)流機(jī)器學(xué)習(xí)。與傳統(tǒng)的機(jī)器學(xué)習(xí)相比,數(shù)據(jù)流機(jī)器學(xué)習(xí)由于數(shù)據(jù)流自身的特點(diǎn)(實(shí)時(shí)、快速、大量、易變)給傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù),特別是分類(lèi)任務(wù),帶來(lái)了新的挑戰(zhàn)。目前,數(shù)據(jù)流相關(guān)研究主要集中在監(jiān)督環(huán)境下的數(shù)據(jù)流分類(lèi)以及無(wú)監(jiān)督環(huán)境下的數(shù)據(jù)流聚類(lèi),相較而言,半監(jiān)督環(huán)境下的數(shù)據(jù)流分類(lèi)研究工作非常少,至今還沒(méi)有專(zhuān)門(mén)的綜述文章。然而,在實(shí)際中,獲取樣本的標(biāo)記既耗時(shí)又費(fèi)力,數(shù)據(jù)流中數(shù)據(jù)量大以及實(shí)時(shí)、快速的特點(diǎn)導(dǎo)致幾乎不可能完全地且及時(shí)地對(duì)樣本進(jìn)行正確標(biāo)注。例如,在信用卡在線(xiàn)欺詐檢測(cè)場(chǎng)景[10]中,當(dāng)發(fā)生新的交易時(shí),使用當(dāng)前的分類(lèi)器模型預(yù)測(cè)該交易的類(lèi)型是正常還是欺詐。當(dāng)客戶(hù)收到銀行賬單后,會(huì)識(shí)別該交易類(lèi)型的預(yù)測(cè)是否準(zhǔn)確并向銀行反饋,從而銀行可以獲得該交易的真實(shí)類(lèi)型。然而,并非所有用戶(hù)都會(huì)提供反饋,并且此過(guò)程具有時(shí)間上的延遲,所以,分類(lèi)模型通常在半監(jiān)督環(huán)境中被更新。因此,半監(jiān)督環(huán)境下的有概念漂移數(shù)據(jù)流分類(lèi)研究顯得更加符合實(shí)際、更加有意義。半監(jiān)督環(huán)境下的概念漂移數(shù)據(jù)流分類(lèi)研究主要面臨兩個(gè)挑戰(zhàn):1)如何在半監(jiān)督環(huán)... 

【文章來(lái)源】:桂林電子科技大學(xué)廣西壯族自治區(qū)

【文章頁(yè)數(shù)】:93 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

有概念漂移的數(shù)據(jù)流的半監(jiān)督分類(lèi)算法研究


(a)中數(shù)據(jù)集的聚類(lèi)結(jié)果

分塊,分類(lèi)器,聚簇,準(zhǔn)確率


圖 4-7 兩個(gè)不同的分布樣本比例為 20%,然后運(yùn)行實(shí)驗(yàn):首先在第一個(gè)分塊上訓(xùn)練一個(gè)分類(lèi)器1f 并放入分類(lèi)器池中,其中自動(dòng)確定聚簇?cái)?shù)量模塊估計(jì)的聚簇?cái)?shù)量為 5;當(dāng)?shù)诙䝼(gè)分塊到來(lái)后,利用 對(duì)第二個(gè)分塊中的樣本逐個(gè)分類(lèi),分類(lèi)準(zhǔn)確率為 98%;當(dāng)?shù)谌齻(gè)分塊到來(lái)后,先在第二個(gè)分塊上訓(xùn)練一個(gè)分類(lèi)器2f ,其中估計(jì)的聚簇?cái)?shù)量為 4,然后利用第二個(gè)分塊數(shù)據(jù)對(duì) 的拷貝進(jìn)行適應(yīng)并記適應(yīng)后的分類(lèi)器為11f ,然后將 與 進(jìn)行加權(quán)組合(權(quán)重動(dòng)態(tài)確定)并對(duì)第三個(gè)分塊中樣本進(jìn)行分類(lèi),累積分類(lèi)準(zhǔn)確率為 88.88%。接著,由于分類(lèi)器池沒(méi)滿(mǎn),將 放入分類(lèi)器池中;當(dāng)?shù)谒膫(gè)分塊到來(lái)后,先在第三個(gè)分塊上訓(xùn)練一個(gè)分類(lèi)器3f ,其中估計(jì)的聚簇?cái)?shù)量為 6,然后利用第三個(gè)分塊數(shù)據(jù)分別對(duì) 和的拷貝進(jìn)行適應(yīng),并記適應(yīng)后的分類(lèi)器分別為31f 和32f ,然后將 、 與 進(jìn)行動(dòng)態(tài)加權(quán)并對(duì)第三個(gè)分塊中的樣本逐個(gè)進(jìn)行分類(lèi),累積分類(lèi)準(zhǔn)確率為 92.34%。接著,由于分類(lèi)器池沒(méi)滿(mǎn),將 放入分類(lèi)器池中。§4.4.3.2 準(zhǔn)確率(a)(b)

實(shí)例圖,實(shí)例,數(shù)據(jù)集,存儲(chǔ)狀態(tài)


儲(chǔ)行為分析跟蹤所提算法 OLFLSSL 的存儲(chǔ)模型在不同階段的存儲(chǔ)狀 數(shù)據(jù)集為例,通過(guò) PCA 降維技術(shù)可視化存儲(chǔ)模型在不同以清楚地看到,MITFace 數(shù)據(jù)集共包含 2 個(gè)概念,這兩個(gè)現(xiàn),即圖 5-9 a/c/e 中的實(shí)例屬于同一個(gè)概念,圖 5-9 b/d 圖 5-10 是所提出的算法 OLFLSSL 在不同階段存儲(chǔ)狀態(tài)的/c/e 中的存儲(chǔ)狀態(tài)是相同的,圖 5-10 b/d 中的存儲(chǔ)狀態(tài)是的存儲(chǔ)器模型對(duì)概念漂移具有良好的適應(yīng)性,即能夠隨著知識(shí),并且對(duì)每個(gè)概念具有良好的學(xué)習(xí)能力。圖 5-10 中的相同顏色表示相同的類(lèi)別,圖 5-10 a/c/e 中由。通過(guò)比較圖 5-9 和圖 5-10,我們可以看到兩個(gè)類(lèi)別的相已經(jīng)出現(xiàn)一定程度的偏移。原因在于用于繪制圖 5-10 的時(shí)間戳的所有數(shù)據(jù),并且經(jīng)過(guò)了指數(shù)衰減;(2)到目前為止

【參考文獻(xiàn)】:
期刊論文
[1]一種基于局部分類(lèi)精度的多源在線(xiàn)遷移學(xué)習(xí)算法[J]. 唐詩(shī)淇,文益民,秦一休.  軟件學(xué)報(bào). 2017(11)
[2]一種基于Tri-training的數(shù)據(jù)流集成分類(lèi)算法[J]. 胡學(xué)鋼,馬利偉,李培培.  數(shù)據(jù)采集與處理. 2017(05)
[3]半監(jiān)督學(xué)習(xí)方法[J]. 劉建偉,劉媛,羅雄麟.  計(jì)算機(jī)學(xué)報(bào). 2015(08)
[4]一種基于混合模型的數(shù)據(jù)流概念漂移檢測(cè)算法[J]. 郭躬德,李南,陳黎飛.  計(jì)算機(jī)研究與發(fā)展. 2014(04)
[5]概念漂移數(shù)據(jù)流分類(lèi)研究綜述[J]. 文益民,強(qiáng)保華,范志剛.  智能系統(tǒng)學(xué)報(bào). 2013(02)
[6]基于半監(jiān)督學(xué)習(xí)的數(shù)據(jù)流集成分類(lèi)算法[J]. 徐文華,覃征,常揚(yáng).  模式識(shí)別與人工智能. 2012(02)
[7]Clustering feature decision trees for semi-supervised classification from high-speed data streams[J]. Wen-hua XU 1,Zheng QIN 2,Yang CHANG 2 (1 Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China) (2 School of Software,Tsinghua University,Beijing 100084,China).  Journal of Zhejiang University-Science C(Computers & Electronics). 2011(08)

博士論文
[1]數(shù)據(jù)流中概念漂移檢測(cè)與分類(lèi)方法研究[D]. 李培培.合肥工業(yè)大學(xué) 2012

碩士論文
[1]新對(duì)稱(chēng)相對(duì)熵與DNA序列相似性分析[D]. 沈娟.西北農(nóng)林科技大學(xué) 2010



本文編號(hào):2982112

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2982112.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)093ed***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com