【摘要】:計算機(jī)技術(shù)的快速發(fā)展,使得數(shù)據(jù)量迅速地增長。為了利用這些數(shù)據(jù)來指導(dǎo)當(dāng)前的工作及科學(xué)研究,基于數(shù)據(jù)挖掘的應(yīng)用技術(shù)被發(fā)掘出來并快速發(fā)展。許多實(shí)際研究中,數(shù)據(jù)集是類別失衡的,即基于一個類別的數(shù)據(jù)量與屬于另一類別的數(shù)據(jù)量差距較大,且小樣本量類呈現(xiàn)出的信息通常更具價值,故而類別失衡分類問題一直是我們研究數(shù)據(jù)挖掘的一個熱門。傳統(tǒng)的機(jī)器學(xué)習(xí)算法,往往會導(dǎo)致對小樣本量類的識別率較低,而致使分類器分類性能大幅度降低。建立于統(tǒng)計學(xué)習(xí)基礎(chǔ)之上的分類方法—支持向量機(jī),具有堅實(shí)的理論依據(jù),對于類別非失衡數(shù)據(jù)集有比其他分類算法更好的分類效果,但對于兩類失衡樣本分類效果稍有欠缺。本文鑒于類別失衡數(shù)據(jù)集分類難的情況,結(jié)合前人的成果提出了邊界修剪支持向量機(jī)方法。該方法在盡量不降低分類正確率的同時,提高了對小樣本量類樣本的識別率;同時也彌補(bǔ)了支持向量機(jī)在類別失衡數(shù)據(jù)集分類中的不足,并從以下方面做出了改進(jìn)。1.分類邊界混疊數(shù)據(jù)的處理。本文主要是對不同類別的樣本的邊界進(jìn)行處理,由于邊界數(shù)據(jù)對支持向量的重要影響,故而其對分類器的構(gòu)建也比較重要。先前大部分的研究工作主要采用將分類邊界混疊數(shù)據(jù)直接刪除或簡單地添加到小樣本量類中的處理方式,而忽略了邊界混疊數(shù)據(jù)對小樣本量類的分類精度的影響。鑒于此,本文對邊界混疊數(shù)據(jù)進(jìn)行了細(xì)致地劃分與處理。2.不同類別支持向量數(shù)目的修剪。本文根據(jù)小樣本量類樣本量與大樣本量類支持向量數(shù)目的關(guān)系采取相應(yīng)的處理策略。當(dāng)小樣本量類樣本量與大樣本量類支持向量數(shù)目均衡時,通過引入軟間隔來求解最優(yōu)超平面;當(dāng)兩者相差較大時,又提供了 SMOTE算法或仿主成分分析方法,并根據(jù)需要進(jìn)行擇優(yōu)選取;當(dāng)小樣本量類相對稀少且小樣本量類的支持向量與大樣本量類的支持向量的數(shù)量差距較大時,從小樣本量類中抽取樣本權(quán)重較大者,使其與小樣本量類中支持向量數(shù)目之和與大樣本量類的支持向量數(shù)目達(dá)到均衡,再進(jìn)行分類器的構(gòu)建。
【學(xué)位授予單位】:安徽理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 翟云;王樹鵬;馬楠;楊炳儒;張德政;;基于單邊選擇鏈和樣本分布密度融合機(jī)制的非平衡數(shù)據(jù)挖掘方法[J];電子學(xué)報;2014年07期
2 吳慶忠;車峰遠(yuǎn);薛付忠;;基于非平衡數(shù)據(jù)的癲癇發(fā)作預(yù)警模型研究[J];山東大學(xué)學(xué)報(醫(yī)學(xué)版);2012年02期
3 陶新民;童智靖;劉玉;付丹丹;;基于ODR和BSMOTE結(jié)合的不均衡數(shù)據(jù)SVM分類算法[J];控制與決策;2011年10期
4 龐素琳;鞏吉璋;;C5.0分類算法及在銀行個人信用評級中的應(yīng)用[J];系統(tǒng)工程理論與實(shí)踐;2009年12期
5 曾志強(qiáng);吳群;廖備水;高濟(jì);;一種基于核SMOTE的非平衡數(shù)據(jù)集分類方法[J];電子學(xué)報;2009年11期
6 葉志飛;文益民;呂寶糧;;不平衡分類問題研究綜述[J];智能系統(tǒng)學(xué)報;2009年02期
7 李旭升;郭春香;陳凱亞;;最小總風(fēng)險準(zhǔn)則的貝葉斯網(wǎng)絡(luò)個人信用評估模型[J];計算機(jī)應(yīng)用研究;2009年01期
8 李紅蓮,王春花,袁保宗;一種改進(jìn)的支持向量機(jī)NN-SVM[J];計算機(jī)學(xué)報;2003年08期
9 張學(xué)工;關(guān)于統(tǒng)計學(xué)習(xí)理論與支持向量機(jī)[J];自動化學(xué)報;2000年01期
,
本文編號:
2514551
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2514551.html