基于主成分分析和遞歸特征消除的支持向量機(jī)分類方法研究
本文關(guān)鍵詞:基于主成分分析和遞歸特征消除的支持向量機(jī)分類方法研究
更多相關(guān)文章: 支持向量機(jī) 主成分分析法 遞歸特征消除法 分類 生物醫(yī)療數(shù)據(jù)
【摘要】:隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,用智能算法處理大數(shù)據(jù)已經(jīng)成為了一種必然的趨勢(shì)。支持向量機(jī)是一種被廣泛應(yīng)用的智能算法,因?yàn)槠渚哂袃?yōu)秀的泛化能力,小樣本決策能力和處理非線性數(shù)據(jù)的能力。統(tǒng)計(jì)學(xué)習(xí)理論的優(yōu)勢(shì)在于以小樣本為研究對(duì)象時(shí)效果極佳,而支持向量機(jī)則是統(tǒng)計(jì)學(xué)習(xí)理論經(jīng)過(guò)發(fā)展和延伸所得到的產(chǎn)物,一種學(xué)習(xí)機(jī)器。最近幾年,支持向量機(jī)發(fā)展迅速,并且產(chǎn)生了例如LS-SVM、LIB-SVM等算法。這些新算法使支持向量機(jī)的應(yīng)用范圍更加廣闊,例如時(shí)間序列建模、前饋控制、優(yōu)化控制等。同時(shí),一些智能控制算法存在著一些缺點(diǎn)和不足,如神經(jīng)網(wǎng)絡(luò)智能控制算法存在算法可能不收斂、局部最優(yōu)化導(dǎo)致解的不唯一、結(jié)構(gòu)較難選取等問(wèn)題。相比之下,支持向量機(jī)具有泛化能力好,非線性建模能力強(qiáng)等特點(diǎn),適合處理大時(shí)延和非線性系統(tǒng)的問(wèn)題。當(dāng)然支持向量機(jī)也存在著一定的不足,希望在不久的將來(lái)可以變得更加完美。生物醫(yī)學(xué)數(shù)據(jù)是非線性且十分復(fù)雜的數(shù)據(jù)。采用合適的算法對(duì)該數(shù)據(jù)進(jìn)行準(zhǔn)確分類,從而輔助醫(yī)生對(duì)病人的病情做出正確的判斷是十分必要的。由于生物醫(yī)學(xué)數(shù)據(jù)的維數(shù)較高,從而本文用支持向量機(jī)結(jié)合主成分分析和遞歸特征消除的方法來(lái)對(duì)生物醫(yī)學(xué)數(shù)據(jù)進(jìn)行分類。本文首先介紹了支持向量機(jī)、主成分分析以及遞歸特征消除方法的基本理論并介紹了其建模方法。對(duì)于維數(shù)十分高的生物醫(yī)學(xué)數(shù)據(jù),本文采用主成分分析對(duì)其進(jìn)行預(yù)處理,使其維數(shù)降低以提高支持向量機(jī)的分類準(zhǔn)確率。另外,遞歸特征消除法是本文采用的另外一種降維方法,對(duì)該數(shù)據(jù)進(jìn)行預(yù)處理。其效果與主成分分析相當(dāng)。上述的兩種方法都能有效的提取高維數(shù)據(jù)中最為主要的幾個(gè)變量,使得支持向量機(jī)在后續(xù)對(duì)其分類時(shí)計(jì)算量減小、計(jì)算時(shí)間縮短以及準(zhǔn)確率提高。本文最后用上述的三種方法對(duì)生物醫(yī)學(xué)數(shù)據(jù)進(jìn)行仿真并對(duì)其結(jié)果進(jìn)行分析比較。其結(jié)果證明,對(duì)于生物醫(yī)療數(shù)據(jù)支持向量機(jī)是一種十分有效的分類方法。
【關(guān)鍵詞】:支持向量機(jī) 主成分分析法 遞歸特征消除法 分類 生物醫(yī)療數(shù)據(jù)
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:R318;TP18
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-18
- 1.1 課題背景以及研究目的和意義8
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀8-16
- 1.2.1 生物醫(yī)學(xué)數(shù)據(jù)國(guó)內(nèi)外研究現(xiàn)狀8-9
- 1.2.2 支持向量機(jī)的研究現(xiàn)狀9-14
- 1.2.3 基于遞歸特征消除法的支持向量機(jī)(SVM-RFE)研究現(xiàn)狀14-15
- 1.2.4 主成分分析研究現(xiàn)狀15-16
- 1.3 本文的主要研究?jī)?nèi)容16-18
- 第2章 支持向量機(jī)18-31
- 2.1 統(tǒng)計(jì)學(xué)習(xí)理論簡(jiǎn)介18-21
- 2.1.1 學(xué)習(xí)問(wèn)題18-19
- 2.1.2 經(jīng)驗(yàn)風(fēng)險(xiǎn)19
- 2.1.3 VC維19-20
- 2.1.4 結(jié)構(gòu)風(fēng)險(xiǎn)20-21
- 2.2 支持向量機(jī)21-25
- 2.2.1 支持向量機(jī)分類21-23
- 2.2.2 支持向量機(jī)函數(shù)擬合23-25
- 2.3 核函數(shù)25-29
- 2.3.1 研究現(xiàn)狀25-26
- 2.3.2 支持向量機(jī)中的核函數(shù)26-27
- 2.3.3 高斯核函數(shù)27-28
- 2.3.4 高斯核函數(shù)的參數(shù)選擇28-29
- 2.4 支持向量機(jī)的優(yōu)點(diǎn)29-30
- 2.5 本章小結(jié)30-31
- 第3章 特征選擇方法31-38
- 3.1 特征選擇方法的概念和意義31-32
- 3.2 特征選擇算法32-34
- 3.2.1 按照評(píng)價(jià)標(biāo)準(zhǔn)分類32-33
- 3.2.2 按照搜索策略分類33-34
- 3.3 特征選擇方法的選取原則34-35
- 3.3.1 影響因素34
- 3.3.2 選取準(zhǔn)則34-35
- 3.4 SVM-RFE算法35-37
- 3.5 本章小結(jié)37-38
- 第4章 主成分分析38-46
- 4.1 引言38
- 4.2 主成分分析的幾何意義38-39
- 4.3 主成分分析的主要思想39-41
- 4.4 主元分析法及其相關(guān)內(nèi)容41-45
- 4.4.1 主元的定義與求取41-42
- 4.4.2 主元得分向量和主元模型的建立42-43
- 4.4.3 主元個(gè)數(shù)的確定43-44
- 4.4.4 兩個(gè)關(guān)鍵的檢測(cè)統(tǒng)計(jì)量44-45
- 4.5 本章小結(jié)45-46
- 第5章 生物醫(yī)學(xué)數(shù)據(jù)的數(shù)據(jù)挖掘46-60
- 5.1 簡(jiǎn)介46
- 5.2 數(shù)據(jù)預(yù)處理46-47
- 5.3 生物醫(yī)學(xué)數(shù)據(jù)的特點(diǎn)47-48
- 5.4 乳腺癌數(shù)據(jù)分析48-58
- 5.4.1 經(jīng)典SVM對(duì)乳腺癌數(shù)據(jù)分類51-53
- 5.4.2 SVM-RFE對(duì)乳腺癌數(shù)據(jù)分類53-55
- 5.4.3 PCA對(duì)乳腺癌數(shù)據(jù)分類55-58
- 5.5 仿真結(jié)果分析58
- 5.6 本章小結(jié)58-60
- 結(jié)論60-62
- 參考文獻(xiàn)62-70
- 攻讀碩士學(xué)位期間發(fā)表的論文及其它成果70-72
- 致謝72
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 馮劍豐;王洪禮;李勝朋;;基于支持向量機(jī)的浮游植物密度預(yù)測(cè)研究[J];海洋環(huán)境科學(xué);2007年05期
2 蔡佳;陳洪;;ν-支持向量機(jī)的收斂性[J];湖北大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年04期
3 唐萬(wàn)梅;;基于灰色支持向量機(jī)的新型預(yù)測(cè)模型[J];系統(tǒng)工程學(xué)報(bào);2006年04期
4 熊宇虹;溫志渝;梁玉前;陳勤;張波;劉妤;向賢毅;;基于支持向量機(jī)的模型傳遞方法研究[J];光譜學(xué)與光譜分析;2007年01期
5 左林;;一個(gè)新的稀疏支持向量機(jī)模型[J];山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
6 赫英明;王漢杰;;支持向量機(jī)在積雪檢測(cè)中的應(yīng)用[J];南京氣象學(xué)院學(xué)報(bào);2009年01期
7 賈亮;王禮力;;支持向量機(jī)在上市公司財(cái)務(wù)預(yù)警模型中的應(yīng)用[J];淮陰工學(xué)院學(xué)報(bào);2010年02期
8 郎宇寧;藺娟如;;基于支持向量機(jī)的多分類方法研究[J];中國(guó)西部科技;2010年17期
9 謝福民;;支持向量機(jī)理論研究[J];科技廣場(chǎng);2011年01期
10 王紅蔚;席紅旗;孔波;;一種新的半監(jiān)督支持向量機(jī)[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2012年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 余樂(lè)安;姚瀟;;基于中心化支持向量機(jī)的信用風(fēng)險(xiǎn)評(píng)估模型[A];第六屆(2011)中國(guó)管理學(xué)年會(huì)——商務(wù)智能分會(huì)場(chǎng)論文集[C];2011年
2 劉希玉;徐志敏;段會(huì)川;;基于支持向量機(jī)的創(chuàng)新分類器[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(一)[C];2005年
3 史曉濤;劉建麗;駱玉榮;;一種抗噪音的支持向量機(jī)學(xué)習(xí)方法[A];全國(guó)第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
4 何琴淑;劉信恩;肖世富;;基于支持向量機(jī)的系統(tǒng)辨識(shí)方法研究及應(yīng)用[A];中國(guó)力學(xué)大會(huì)——2013論文摘要集[C];2013年
5 劉駿;;基于支持向量機(jī)方法的衢州降雪模型[A];第五屆長(zhǎng)三角氣象科技論壇論文集[C];2008年
6 王婷;胡秀珍;;基于組合向量的支持向量機(jī)方法預(yù)測(cè)膜蛋白類型[A];第十一次中國(guó)生物物理學(xué)術(shù)大會(huì)暨第九屆全國(guó)會(huì)員代表大會(huì)摘要集[C];2009年
7 趙晶;高雋;張旭東;謝昭;;支持向量機(jī)綜述[A];全國(guó)第十五屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2003年
8 周星宇;王思元;;智能數(shù)學(xué)與支持向量機(jī)[A];2005年中國(guó)智能自動(dòng)化會(huì)議論文集[C];2005年
9 顏根廷;馬廣富;朱良寬;宋斌;;一種魯棒支持向量機(jī)算法[A];2006中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
10 侯澍e,
本文編號(hào):868198
本文鏈接:http://sikaile.net/yixuelunwen/swyx/868198.html