基于隨機(jī)子空間的SVM分類算法研究
發(fā)布時(shí)間:2017-10-01 01:17
本文關(guān)鍵詞:基于隨機(jī)子空間的SVM分類算法研究
更多相關(guān)文章: 支持向量機(jī) 隨機(jī)子空間 核函數(shù) 分層抽樣 不平衡數(shù)據(jù)
【摘要】:支持向量機(jī)是在堅(jiān)實(shí)理論基礎(chǔ)上發(fā)展起來(lái)的一種機(jī)器學(xué)習(xí)方法,它能很好的解決關(guān)于小樣本、非線性、高維度、局部極小等類似問(wèn)題。目前,支持向量機(jī)作為一種有潛力的分類技術(shù),在數(shù)據(jù)分類方面得到了廣泛的應(yīng)用和研究。但早期提出的基于支持向量機(jī)的數(shù)據(jù)分類方法,在解決海量數(shù)據(jù)分類特別是不平衡的數(shù)據(jù)分類時(shí)會(huì)出現(xiàn)很多問(wèn)題,嚴(yán)重影響著數(shù)據(jù)分類算法的計(jì)算效率和準(zhǔn)確度。隨機(jī)子空間方法是為了適應(yīng)特征數(shù)據(jù)篩選的挑戰(zhàn),其思想就是從大量特征數(shù)據(jù)中選出真正需要的特征,以降低數(shù)據(jù)集的特征維度或平衡特征分布,它對(duì)數(shù)據(jù)預(yù)處理方面有著突出的貢獻(xiàn)。對(duì)此,論文提出基于隨機(jī)子空間的SVM分類算法研究,主要的研究工作分為以下兩個(gè)方面:1.基于隨機(jī)特征子空間及加權(quán)核函數(shù)的SVM算法結(jié)合隨機(jī)子空間和核函數(shù)思想,提出基于隨機(jī)特征子空間及加權(quán)核函數(shù)的SVM算法。首先通過(guò)采用ReliefF算法計(jì)算特征權(quán)值,然后基于隨機(jī)特征子空間方法,根據(jù)特征權(quán)值選擇特征,最后將選出的特征及其權(quán)值對(duì)核函數(shù)中的內(nèi)積進(jìn)行加權(quán)計(jì)算,從而減少了核函數(shù)中內(nèi)積加權(quán)的計(jì)算復(fù)雜度。在平衡數(shù)據(jù)集的分類研究中,該方法在一定程度上解決了傳統(tǒng)的SVM算法缺乏高效率和低準(zhǔn)確率的問(wèn)題。2.基于支持向量機(jī)的不平衡樣本集分類算法結(jié)合重采樣技術(shù)和分層抽樣方法,提出基于支持向量機(jī)的不平衡樣本集分類算法。該算法以支持向量機(jī)為基礎(chǔ),首先利用分層抽樣方法,選出樣本的正、負(fù)特征,以平衡樣本底層特征分布,然后在此基礎(chǔ)上采用重采樣技術(shù),對(duì)樣本數(shù)量進(jìn)行平衡,因此從樣本底層特征分布和樣本數(shù)量上很好的解決了數(shù)據(jù)的不平衡。在不平衡數(shù)據(jù)集的分類研究中,該方法避免了僅考慮數(shù)據(jù)樣本數(shù)量不平衡而忽略樣本底層特征分布不平衡的現(xiàn)象,使不平衡數(shù)據(jù)對(duì)SVM分類器的影響程度得到進(jìn)一步降低。
【關(guān)鍵詞】:支持向量機(jī) 隨機(jī)子空間 核函數(shù) 分層抽樣 不平衡數(shù)據(jù)
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP181
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 第一章 緒論8-12
- 1.1 研究背景和意義8
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀8-10
- 1.3 本文主要內(nèi)容10
- 1.4 本文結(jié)構(gòu)安排10-12
- 第二章 支持向量機(jī)12-22
- 2.1 最優(yōu)分類超平面12-14
- 2.2 SVM分類原理14-18
- 2.3 SVM核函數(shù)18-20
- 2.4 本章小結(jié)20-22
- 第三章 基于隨機(jī)特征子空間及加權(quán)核函數(shù)的SVM算法(RFSWK-SVM)22-33
- 3.1 RFSWK-SVM算法的相關(guān)理論22-27
- 3.1.1 隨機(jī)子空間22-23
- 3.1.2 特征選擇23-27
- 3.2 RFSWK-SVM算法思想27-30
- 3.3 實(shí)驗(yàn)結(jié)果及分析30-32
- 3.4 本章小結(jié)32-33
- 第四章 基于支持向量機(jī)的不平衡樣本集分類算法(IDC-SVM)33-42
- 4.1 不平衡數(shù)據(jù)集的概述33-36
- 4.2 IDC-SVM算法的相關(guān)理論36-39
- 4.3 IDC-SVM算法思想39-40
- 4.4 實(shí)驗(yàn)結(jié)果及分析40-41
- 4.5 本章小結(jié)41-42
- 第五章 總結(jié)與展望42-44
- 5.1 總結(jié)42-43
- 5.2 展望43-44
- 參考文獻(xiàn)44-48
- 作者簡(jiǎn)介及學(xué)期間所取得的科研成果48-49
- 致謝49
本文編號(hào):951503
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/951503.html
最近更新
教材專著