一種基于SVM的降維方法在三類ROC分析中的應(yīng)用
本文關(guān)鍵詞:一種基于SVM的降維方法在三類ROC分析中的應(yīng)用,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人工智能、大數(shù)據(jù)等技術(shù)的快速發(fā)展,機(jī)器學(xué)習(xí)迎來(lái)了發(fā)展的春天。機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域的交叉學(xué)科,是人工智能研究的核心領(lǐng)域,不管是在工業(yè)界,還是在學(xué)術(shù)界都大家研究的熱點(diǎn)。機(jī)器學(xué)習(xí)理論主要目的是設(shè)計(jì)出一些算法使計(jì)算機(jī)具備自我學(xué)習(xí)的能力,通過(guò)訓(xùn)練集獲取模型,并利用此模型對(duì)未知的訓(xùn)練集樣本進(jìn)行預(yù)測(cè),在很多領(lǐng)域已經(jīng)達(dá)到甚至超越了人類的水平。在傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)中,都是在假設(shè)樣本具有相同的類分布,且兩類錯(cuò)誤代價(jià)相同的前提下的,而實(shí)際應(yīng)用中數(shù)據(jù)往往是不平衡分布的,錯(cuò)誤代價(jià)也是存在著天壤之別的。為了推動(dòng)機(jī)器學(xué)習(xí)技術(shù)的進(jìn)一步發(fā)展,我們必須重新審視傳統(tǒng)機(jī)器學(xué)習(xí)中的局限性,而衡量機(jī)器學(xué)習(xí)算法的優(yōu)劣的標(biāo)準(zhǔn)是我們優(yōu)先考慮的方向,也就是ROC分析技術(shù)。目前ROC分析技術(shù)已經(jīng)廣泛應(yīng)用到了生物醫(yī)學(xué)、信號(hào)處理、機(jī)器學(xué)習(xí)等領(lǐng)域,但主要應(yīng)用在兩類問(wèn)題中,在多類問(wèn)題上,ROC面臨著高維空間、表示困難、難以理解等問(wèn)題。本文的主要目標(biāo)是提出一種新的三分類分類器性能比較方法,用ROC曲面下的體積來(lái)比較三分類分類器的性能,從而有效的拓展ROC分析技術(shù)在三分類問(wèn)題上的應(yīng)用。本文需要解決的主要問(wèn)題是實(shí)現(xiàn)數(shù)據(jù)的降維、形成ROC曲面以及求得ROC曲面下體積的大小。本文以支持向量機(jī)為分類工具,采用“一對(duì)余”的分類方式對(duì)三類數(shù)據(jù)進(jìn)行分類,得到三個(gè)一維的數(shù)值,然后以三個(gè)分類結(jié)果為坐標(biāo)軸建立空間坐標(biāo)系,然后在此基礎(chǔ)上進(jìn)行數(shù)據(jù)的降維,先將數(shù)據(jù)投影到一個(gè)三維空間平面,再將三維空間平面上的數(shù)據(jù)映射到了二維空間。通過(guò)直角支架以一定的步數(shù)遍歷二維空間上的樣本點(diǎn),支架每到一個(gè)位置都會(huì)得到一個(gè)三維的點(diǎn),所有的這些點(diǎn)就構(gòu)成了所要三維ROC曲面。最后使用分塊求體積的方式求得ROC曲面下的體積,將ROC曲面分成若干個(gè)小的三棱柱,每一個(gè)小的三棱柱又可以分為三個(gè)小的三棱錐。最后,本文通過(guò)仿真數(shù)據(jù)集實(shí)驗(yàn)和真實(shí)數(shù)據(jù)集實(shí)驗(yàn),結(jié)果充分驗(yàn)證了本文方法的可靠性和優(yōu)越性,和傳統(tǒng)的三類ROC分析技術(shù)相比,本文方法避免了空間的高維化,具有容易表達(dá),易于理解等優(yōu)點(diǎn),和非參數(shù)法相比,本文所用體積法求VUS具有計(jì)算復(fù)雜度低的優(yōu)點(diǎn)。
【關(guān)鍵詞】:支持向量機(jī)(SVM) 接收機(jī)工作特性(ROC) 降維 曲面下的體積(VUS)
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP181
【目錄】:
- 摘要4-5
- Abstract5-13
- 第一章 緒論13-19
- 1.1 研究背景13-16
- 1.2 選題的意義和研究現(xiàn)狀16-17
- 1.2.1 將ROC分析方法推廣到三類中的意義16
- 1.2.2 ROC分析方法國(guó)內(nèi)外的研究現(xiàn)狀16-17
- 1.3 本文主要研究?jī)?nèi)容17-18
- 1.4 本章小結(jié)18-19
- 第二章 ROC介紹19-33
- 2.1 分類器的評(píng)價(jià)19-20
- 2.1.1 分類算法的衡量標(biāo)準(zhǔn)19
- 2.1.2 用正確率衡量分類算法的局限性19-20
- 2.2 ROC介紹20-30
- 2.2.1 ROC基礎(chǔ)20-23
- 2.2.2 使用ROC圖評(píng)價(jià)分類器23-28
- 2.2.3 ROC曲線下的面積28-30
- 2.3 ROC在多類中的應(yīng)用30-32
- 2.4 本章小結(jié)32-33
- 第三章 支持向量機(jī)理論33-54
- 3.1 引言33
- 3.2 統(tǒng)計(jì)學(xué)習(xí)理論33-38
- 3.2.1 分類問(wèn)題的統(tǒng)計(jì)學(xué)提法33-34
- 3.2.2 經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則34-35
- 3.2.3 VC維35-36
- 3.2.4 結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則36-38
- 3.3 線性支持向量機(jī)38-45
- 3.3.1 線性可分問(wèn)題最大間隔法38-40
- 3.3.2 線性可分問(wèn)題的支持向量機(jī)40-42
- 3.3.3 線性支持向量分類機(jī)42-45
- 3.4 支持向量機(jī)45-49
- 3.4.1 線性不可分問(wèn)題轉(zhuǎn)化為線性可分問(wèn)題45-46
- 3.4.2 非線性分類支持向量分類機(jī)46-47
- 3.4.3 核函數(shù)47-48
- 3.4.4 標(biāo)準(zhǔn)支持向量機(jī)48-49
- 3.5 支持向量機(jī)在多分類中的應(yīng)用舉例49-53
- 3.5.1 一對(duì)多49-50
- 3.5.2 一對(duì)一50
- 3.5.3 一次性求解50
- 3.5.4 決策有向無(wú)環(huán)圖50-51
- 3.5.5 “糾錯(cuò)編碼”方法51-52
- 3.5.6 “二叉樹(shù)”方法52-53
- 3.6 本章小結(jié)53-54
- 第四章 算法部分54-63
- 4.1 使用SVM分類器對(duì)樣本進(jìn)行分類54
- 4.2 數(shù)據(jù)降維的實(shí)現(xiàn)54-58
- 4.2.1 建立空間坐標(biāo)系54-55
- 4.2.2 三維空間向二維空間的轉(zhuǎn)換55-58
- 4.3 遍歷二維平面得到ROC曲面58-60
- 4.3.1 支架的轉(zhuǎn)換58-59
- 4.3.2 遍歷平面上的樣本59-60
- 4.4 計(jì)算ROC曲面下的體積60-61
- 4.5 非參數(shù)法估計(jì)VUS均值的大小61
- 4.6 本章小結(jié)61-63
- 第五章 實(shí)驗(yàn)驗(yàn)證及分析63-69
- 5.1 實(shí)驗(yàn)一:VUS和類間距的關(guān)系驗(yàn)證63-64
- 5.2 實(shí)驗(yàn)二:驗(yàn)證步數(shù)對(duì)體積的影響64
- 5.3 實(shí)驗(yàn)三:體積法和非參數(shù)法對(duì)比64-65
- 5.4 實(shí)驗(yàn)四:體積法的時(shí)間成本與步數(shù)的變化關(guān)系65-66
- 5.5 實(shí)驗(yàn)五:體積法和非參數(shù)法時(shí)間復(fù)雜度對(duì)比66
- 5.6 實(shí)驗(yàn)六:IRIS(鳶尾花)數(shù)據(jù)集測(cè)試66-68
- 5.7 本章小結(jié)68-69
- 總結(jié)與展望69-71
- 參考文獻(xiàn)71-77
- 攻讀碩士學(xué)位期間取得的研究成果77-79
- 致謝79
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉學(xué)謙;于宏毅;;SVM在通信信號(hào)處理中的研究與應(yīng)用[J];信息工程大學(xué)學(xué)報(bào);2013年06期
2 饒剛;劉瓊蓀;高君健;;基于灰色特征加權(quán)支持向量機(jī)的二維函數(shù)擬合[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年10期
3 包健;劉然;;用糾錯(cuò)編碼改進(jìn)的M-ary支持向量機(jī)多類分類算法[J];計(jì)算機(jī)應(yīng)用;2012年03期
4 潘清;陳卉;馬宇晶;沙飛;;影像學(xué)診斷評(píng)價(jià)中的參數(shù)法ROC曲線分析[J];中國(guó)醫(yī)學(xué)影像技術(shù);2011年08期
5 王艷;陳歡歡;沈毅;;有向無(wú)環(huán)圖的多類支持向量機(jī)分類算法[J];電機(jī)與控制學(xué)報(bào);2011年04期
6 劉健;劉忠;熊鷹;;改進(jìn)的二叉樹(shù)支持向量機(jī)多類分類算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年33期
7 武優(yōu)西;郭磊;柴欣;王巖;;基于優(yōu)化算法的核函數(shù)參數(shù)選擇的研究[J];計(jì)算機(jī)應(yīng)用與軟件;2010年01期
8 韓毅;周晏;;基于SVM的Web文本分類[J];科技信息;2009年17期
9 王曉鋒;秦玉平;;一種新型基于二叉樹(shù)的支持向量機(jī)多類分類方法[J];鄭州輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2008年06期
10 黃劍鋒;劉付顯;朱法順;;基于多類分類支持向量機(jī)的空襲目標(biāo)識(shí)別[J];微計(jì)算機(jī)信息;2008年10期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 李玉朵;基于SVM的人臉表情識(shí)別研究[D];河北工程大學(xué);2012年
2 謝福民;基于支持向量機(jī)的軟測(cè)量方法及其應(yīng)用研究[D];江西理工大學(xué);2011年
3 孫慶嘉;多類支持向量機(jī)的研究與分析[D];北京交通大學(xué);2010年
4 陳鳴;序列數(shù)據(jù)多分類問(wèn)題的研究與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2010年
5 李金華;基于SVM的多類文本分類研究[D];山東科技大學(xué);2010年
6 董鋼;支持向量機(jī)建模方法的研究[D];東北大學(xué);2008年
7 何凱;支持向量機(jī)方法在智能醫(yī)療診斷系統(tǒng)中的應(yīng)用與研究[D];浙江大學(xué);2007年
本文關(guān)鍵詞:一種基于SVM的降維方法在三類ROC分析中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號(hào):392153
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/392153.html