天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于不平衡數(shù)據(jù)的支持向量機和決策樹算法的研究

發(fā)布時間:2020-04-08 14:30
【摘要】:傳統(tǒng)的機器學習方法通常希望樣本數(shù)量是近似于無限的,而現(xiàn)實生活中,樣本數(shù)量卻是有限的,在這種情況下優(yōu)良的傳統(tǒng)算法訓練的結果卻不易令人接受。以統(tǒng)計學習理論為支撐的支持向量機很好的解決了非線性,局部極值,小樣本,高維數(shù)據(jù)等傳統(tǒng)機器學習方法存在的難題。實際研究中,我們雖然很容易獲得大量的樣本,但由于數(shù)據(jù)本身的性質或者某種外在的原因,真正對我們有用的樣本卻是少之又少,像這種數(shù)據(jù)中的某一類包含了大部分的樣本,其它類包含了極少量樣本的數(shù)據(jù)集叫作不平衡數(shù)據(jù)集。在不平衡數(shù)據(jù)中,由于正類樣本缺乏典型特征,以致描述正類概念的規(guī)則極其少且弱,在對數(shù)據(jù)做任何處理之前,現(xiàn)有的算法總是偏向負類數(shù)據(jù),從而使正類數(shù)據(jù)分類的精度大大降低。而很多時候我們恰好需要研究少類數(shù)據(jù),因為有時候少類數(shù)據(jù)的誤判會帶來致命的結果,因此針對具體的不均衡數(shù)據(jù)分類問題找到行之有效的方法是很關鍵的。這篇文章研究了不平衡數(shù)據(jù)分類的本質,處理方法,評估指標,并結合統(tǒng)計理論,引入了CBO-SVM,RU-SMOTE-SVM,SMOTEBoosting-SVM和C5.0決策樹模型,并利用UCI中的臺灣信用卡用戶違約數(shù)據(jù)做實證分析,同時又選了一些上市公司ST情況數(shù)據(jù)和某電信公司客戶違約數(shù)據(jù)做結果對比,以SVM,SMOTE-SVM為參照,觀察對比各個方法的分類表現(xiàn)。結果顯示RU-SMOTESVM的分類效果最好,這說明RU-SMOTE-SVM相較于本文中的其它幾種方法可以作為不平衡數(shù)據(jù)分類的有效方法。
【圖文】:

超平面,支持向量,最優(yōu)超平面


圖 2.1 支持向量分類的超平面Fig.2.1 Hyperplane in SVM classification目標是找到一個最優(yōu)間隔,這個間隔由超平面和,,如圖中的1 2 3l , l ,l 。最優(yōu)超平面必須在最大程度上

超平面


超平面和最大邊界Fig.2.2Hyperplaneandmaxmargin
【學位授予單位】:大連理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:C81

【參考文獻】

相關期刊論文 前5條

1 梁禮明;鐘震;陳召陽;;支持向量機核函數(shù)選擇研究與仿真[J];計算機工程與科學;2015年06期

2 文傳軍;詹永照;;基于自調節(jié)分類面SVM的平衡不平衡數(shù)據(jù)分類[J];系統(tǒng)工程;2009年03期

3 馮少榮;;決策樹算法的研究與改進[J];廈門大學學報(自然科學版);2007年04期

4 John Durkin,蔡競峰,蔡自興;決策樹技術及其當前研究方向[J];控制工程;2005年01期

5 張學工;關于統(tǒng)計學習理論與支持向量機[J];自動化學報;2000年01期



本文編號:2619461

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2619461.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶bcaac***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com