V-支持向量分類機中若干問題的研究
發(fā)布時間:2017-04-13 14:12
本文關(guān)鍵詞:V-支持向量分類機中若干問題的研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:支持向量分類機(Support Vector Classification, SVC)是Vapnik等人于1995年提出的一類機器學(xué)習(xí)算法,它以統(tǒng)計學(xué)習(xí)理論(statistical learning theory, SLT)為基礎(chǔ),具有簡潔的數(shù)學(xué)形式、標(biāo)準(zhǔn)快捷的訓(xùn)練方法.與傳統(tǒng)的基于經(jīng)驗風(fēng)險最小化(experience risk minimization, ERM)原則的機器學(xué)習(xí)算法,例如:神經(jīng)網(wǎng)絡(luò)、決策樹等不同,支持向量分類機是基于結(jié)構(gòu)風(fēng)險最小化(structure risk minimization)原則,考慮的是經(jīng)驗風(fēng)險和置信界之和的最小化.正因為如此,支持向量分類機在上個世紀(jì)90年代受到廣泛的關(guān)注并得到了迅速的完善和發(fā)展.它具有扎實的理論基礎(chǔ)、更強的泛化能力,在解決小樣本、非線性等實際問題的性能也表現(xiàn)得很優(yōu)異,因此成為主流的機器學(xué)習(xí)算法之一.目前支持向量分類機被廣泛應(yīng)用于模式識別、生物信息學(xué)、文本和手寫識別等數(shù)據(jù)挖掘問題.由于C-支持向量分類機(C-SVC)中參數(shù)C的取值范圍是(0,+∞)并且本身也沒有定量的含義,在實際應(yīng)用中C的取值往往很難取舍.因此Scholkopf等人于2000年利用參數(shù)v代替C提出了v-支持向量分類機(v-SVC),通過替換,參數(shù)v值本身就含有一定的意義.本論文主要做了以下三方面的工作:(1)探究了v-SVC中參數(shù)v與總樣本數(shù)f之間的關(guān)系.利用Markov不等式及其概率論相關(guān)知識,證明了參數(shù)v在滿足一定條件下以概率1漸進逼近于支持向量個數(shù)和總樣本數(shù)之比q/l;(2)研究了v-SVC與C-SVC中參數(shù)v與參數(shù)C之間的映射關(guān)系.從UCI數(shù)據(jù)庫中下載:breast-cancer-wisconsin (diagnostic), iris, letter-recognition數(shù)據(jù)集,利用RStudio編程實現(xiàn)C-SVC并進行了數(shù)值實驗.實驗結(jié)果表明:訓(xùn)練樣本集在選取非正定核函數(shù)下參數(shù)C與參數(shù)v的映射關(guān)系并不滿足非增性;(3)研究了如何利用準(zhǔn)確率和召回率選取最優(yōu)參數(shù)v來獲得最優(yōu)分類器.從UCI數(shù)據(jù)庫中下載balance-scale, breast-cancer-wisconsin (original), iris, letter-recognition, waveform這五個標(biāo)準(zhǔn)數(shù)據(jù)集,利用RStudio編程實現(xiàn)v-SVC并進行了實驗,實驗中選取數(shù)據(jù)的2/3作為訓(xùn)練數(shù)據(jù),1/3作為測試數(shù)據(jù),計算出取不同v值時的準(zhǔn)確率和召回率以及相應(yīng)的F-值.并依據(jù)F-值得到了在取不同核函數(shù)時的最優(yōu)參數(shù)區(qū)間.實驗結(jié)果表明:在得出的最優(yōu)參數(shù)區(qū)間內(nèi),v-SVC保持了在訓(xùn)練集和測試集上較高的準(zhǔn)確率和召回率.
【關(guān)鍵詞】:v-支持向量分類機 核函數(shù) 混淆矩陣 準(zhǔn)確率 召回率 F-值
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要6-8
- Abstract8-14
- 第一章 引言14-20
- 1.1 支持向量分類機的發(fā)展現(xiàn)狀14-15
- 1.2 支持向量分類機的研究背景15-17
- 1.3 支持向量分類機相關(guān)概念17-20
- 第二章 C-支持向量分類機原理20-28
- 2.1 C-線性可分支持向量分類機20-21
- 2.2 C-線性支持向量分類機21-25
- 2.3 C-支持向量分類機25-28
- 第三章 v-支持向量分類機原理28-36
- 3.1 v-線性支持向量分類機28-29
- 3.2 v-支持向量分類機29-31
- 3.3 v-支持向量分類機的性質(zhì)31-32
- 3.4 參數(shù)v與總樣本數(shù)l的關(guān)系證明32-36
- 第四章 參數(shù)v和參數(shù)C關(guān)系的探究36-43
- 4.1 參數(shù)v與參數(shù)C的相關(guān)定理36-37
- 4.2 基于正定核下參數(shù)v與參數(shù)C的關(guān)系37-40
- 4.3 基于非正定核下參數(shù)v與參數(shù)C的關(guān)系40-43
- 第五章 最優(yōu)參數(shù)v的選擇43-52
- 5.1 評估分類器性能的度量43-45
- 5.2 最優(yōu)參數(shù)v的選擇45-52
- 5.2.1 基于正定核linear下最優(yōu)參數(shù)v的選擇46-47
- 5.2.2 基于正定核radial下最優(yōu)參數(shù)v的選擇47-48
- 5.2.3 基于非正定核Sigmoid下最優(yōu)參數(shù)v的選擇48-50
- 5.2.4 最優(yōu)參數(shù)v的選擇結(jié)果50-52
- 第六章 總結(jié)與展望52-54
- 參考文獻54-58
- 附錄58-65
- 致謝65
【參考文獻】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 沈麗靜;ν-支持向量分類機在心肌梗塞疾病診斷中的應(yīng)用[D];華東師范大學(xué);2014年
本文關(guān)鍵詞:V-支持向量分類機中若干問題的研究,由筆耕文化傳播整理發(fā)布。
本文編號:303782
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/303782.html
最近更新
教材專著