天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于粗糙集的多分類(lèi)器集成學(xué)習(xí)方法研究

發(fā)布時(shí)間:2020-03-01 11:25
【摘要】:集成學(xué)習(xí)是當(dāng)前機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn),其通過(guò)組合多個(gè)分類(lèi)器來(lái)解決同一個(gè)問(wèn)題,可以獲得比僅僅使用單一分類(lèi)器更好的性能。由于集成學(xué)習(xí)具有良好的泛化性能,現(xiàn)在已經(jīng)應(yīng)用于多個(gè)領(lǐng)域,如人臉識(shí)別、語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)處理等。粗糙集理論,由波蘭科學(xué)家Z.Pawlak于1982年創(chuàng)立,作為一種主要分析不確定性數(shù)據(jù)的理論,為數(shù)據(jù)的分類(lèi)提供了完整的分析和處理。目前已經(jīng)廣泛應(yīng)用于模式識(shí)別、機(jī)器學(xué)習(xí)、知識(shí)發(fā)現(xiàn)、數(shù)據(jù)挖掘等領(lǐng)域。本文在全面介紹多分類(lèi)器集成學(xué)習(xí)和粗糙集理論國(guó)內(nèi)外研究現(xiàn)狀的基礎(chǔ)上,結(jié)合兩者的特點(diǎn),將粗糙集理論引入到多分類(lèi)器集成,開(kāi)展了基于粗糙集的多分類(lèi)器集成學(xué)習(xí)方法研究,主要內(nèi)容如下:首先,為了將粗糙集理論與集成學(xué)習(xí)進(jìn)行有效地結(jié)合,進(jìn)而提高多分類(lèi)器集成的分類(lèi)性能,提出了一種結(jié)合粗糙集的多分類(lèi)器集成學(xué)習(xí)算法。根據(jù)粗糙集理論,將樣本劃分為正區(qū)域和邊界域兩部分,在此基礎(chǔ)上進(jìn)行樣本抽樣。抽樣過(guò)程中,確保抽樣的每個(gè)數(shù)據(jù)集都包括邊界域內(nèi)的所有樣本。在UCI數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:和一些經(jīng)典的集成算法比較,文中算法在Precision、Recall等多個(gè)指標(biāo)上提高了對(duì)數(shù)據(jù)分類(lèi)的準(zhǔn)確度。其次,針對(duì)動(dòng)態(tài)數(shù)據(jù)的集成學(xué)習(xí),結(jié)合粗糙集理論和增量學(xué)習(xí),提出了一種基于粗糙集的增量式集成方法。該方法將粗糙集理論引入到增量分類(lèi)的過(guò)程中,使得集成后的分類(lèi)器不僅可以適應(yīng)不斷變化的數(shù)據(jù),有效地進(jìn)行增量學(xué)習(xí),而且縮短了訓(xùn)練時(shí)間,降低了存儲(chǔ)資源的消耗。在UCI數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:同一些增量式和非增量式集成方法相比,該方法可以提高分類(lèi)效果。
【圖文】:

整體流,信息熵,決策表,數(shù)據(jù)預(yù)處理


圖 3.1 算法的整體流程3.2.1 數(shù)據(jù)預(yù)處理粗糙集理論研究的元素對(duì)象只能是離散值對(duì)象,因此在數(shù)據(jù)預(yù)處要求對(duì)決策表中的值用離散數(shù)據(jù)表示,因此對(duì)決策表進(jìn)行離散化很關(guān)系到整個(gè)系統(tǒng)的決策能力,是數(shù)據(jù)預(yù)處理階段的核心。針對(duì)此問(wèn)題,的觀點(diǎn)出發(fā),主要通過(guò)對(duì)每一個(gè)候選斷點(diǎn)定義信息熵,并以此作為對(duì)量度。在此先給出信息熵的定義:定義 3.6 設(shè)U 為一個(gè)論域, X U為子集,其實(shí)例個(gè)數(shù)為 X ,j ( j 1, 2,..., r ( d))的實(shí)例個(gè)數(shù)為jk ,此子集的信息熵定義為:( )21( ) log ,r djj j jjkH X p p pX

柱狀圖,指標(biāo),平均值,集成算法


Cmc 0.536 0.536 0.523 0.562 0.508 0.562Car 0.922 0.700 0.700 0.867 0.927 0.971Seismic 0.931 0.934 0.931 0.932 0.921 0.932Chess 0.991 0.938 0.960 0.938 0.987 0.994Wine quality 0.629 0.517 0.621 0.533 0.675 0.654Eye state 0.894 0.668 0.867 0.691 0.912 0.955Average 0.8390 0.7805 0.8095 0.8089 0.8488 0.8566從表3.3到表3.6中可以看出,在大多數(shù)數(shù)據(jù)集上本文算法取得了比較好的效果,其中 Iris、Dermatology、Breast-cancer-w、Cmc、Eye state 等數(shù)據(jù)集的各個(gè)指標(biāo)均明顯高于其它集成算法;Ecoli、Car、ILPD、Chess 等數(shù)據(jù)集的 Precision、Recall、Accuracy等分類(lèi)指標(biāo)均高于其它集成算法,但是 F-value 指標(biāo)不穩(wěn)定,相較 Logit Boost 和Random Forest 集成算法而言,結(jié)果沒(méi)有特別突出;Blood、Wine、Glass、Tic-tac-toe、Seismic、Wine-quality 等數(shù)據(jù)集的某些指標(biāo)就要低于其他幾種算法。同時(shí),為了更為直觀地看出每個(gè)分類(lèi)方法之間的差異,,圖 3.2 將各個(gè)指標(biāo)的平均值用柱狀圖的形式表現(xiàn)出來(lái),如圖 3.2 所示。
【學(xué)位授予單位】:重慶郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP18

【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 鄒權(quán);宋莉;陳文強(qiáng);曾建滄;林琛;;基于集成學(xué)習(xí)和分層結(jié)構(gòu)的多分類(lèi)算法[J];模式識(shí)別與人工智能;2015年09期

2 曾川;何騫;張金榜;;智能信息處理技術(shù)的發(fā)展與應(yīng)用[J];電子技術(shù)與軟件工程;2015年01期

3 王國(guó)胤;姚一豫;于洪;;粗糙集理論與應(yīng)用研究綜述[J];計(jì)算機(jī)學(xué)報(bào);2009年07期

4 謝元澄;楊靜宇;;刪除最差基學(xué)習(xí)器來(lái)層次修剪Bagging集成[J];計(jì)算機(jī)研究與發(fā)展;2009年02期

5 孫亮;韓崇昭;沈建京;戴寧;;集成特征選擇的廣義粗集方法與多分類(lèi)器融合[J];自動(dòng)化學(xué)報(bào);2008年03期

6 張年琴;苗奪謙;李道國(guó);;基于粗糙集和神經(jīng)網(wǎng)絡(luò)的分類(lèi)器及其在LPR中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2005年11期

7 唐偉,周志華;基于Bagging的選擇性聚類(lèi)集成[J];軟件學(xué)報(bào);2005年04期



本文編號(hào):2584023

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2584023.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)84579***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com