不平衡數(shù)據(jù)的距離加權(quán)算法的誤差分析
發(fā)布時(shí)間:2021-11-28 05:37
近年來,隨著科技和信息技術(shù)的發(fā)展,高維小樣本問題和不平衡數(shù)據(jù)問題越來越受研究者的重視。支持向量機(jī)算法是最流行的分類算法之一,由于其分類邊界的確定只依賴于部分被稱之為支持向量的訓(xùn)練樣本,這導(dǎo)致其在處理高維小樣本數(shù)據(jù)時(shí)產(chǎn)生了“數(shù)據(jù)堆積”現(xiàn)象,從而影響了其分類效果。距離加權(quán)分類算法旨在解決支持向量機(jī)在處理高維小樣本數(shù)據(jù)時(shí)所固有的“數(shù)據(jù)堆積”現(xiàn)象,但該算法并不能很好地處理不平衡數(shù)據(jù)的分類問題。帶權(quán)的距離加權(quán)分類算法的提出旨在通過靈活地選擇兩類樣本的權(quán)重改進(jìn)標(biāo)準(zhǔn)的距離加權(quán)分類算法對不平衡數(shù)據(jù)的分類效果。目前距離加權(quán)分類系列算法已得到了廣泛的應(yīng)用,但其數(shù)學(xué)理論方面的研究還比較缺乏,尤其是缺乏定量的誤差分析理論。本論文主要研究帶權(quán)的距離加權(quán)分類算法,旨在統(tǒng)計(jì)學(xué)習(xí)理論的框架下對該算法進(jìn)行定量的誤差分析。首先我們建立了加權(quán)比較定理,該定理建立了加權(quán)錯(cuò)分誤差與加權(quán)推廣誤差之間的關(guān)系,其在誤差分析中起著關(guān)鍵作用。接著我們通過引入新的投影算子克服了本文中目標(biāo)函數(shù)無界帶來的分析上的困難。最后通過概率不等式和覆蓋數(shù)等技術(shù)估計(jì)了加權(quán)推廣誤差,并在此基礎(chǔ)之上建立了基于核的加權(quán)距離加權(quán)分類算法的收斂速率。本文為處理不平...
【文章來源】:浙江師范大學(xué)浙江省
【文章頁數(shù)】:40 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 統(tǒng)計(jì)學(xué)習(xí)理論概況
1.2 SVM與 DWD算法
1.2.1 SVM
1.2.2 DWD
1.3 線性WDWD算法
1.4 研究背景
1.5 論文結(jié)構(gòu)
2 基于核的WDWD算法和主要結(jié)果
2.1 基于核的WDWD算法
2.2 收斂速率
2.3 比較定理
3 誤差分析
3.1 投影算子及誤差分解
3.2 加權(quán)推廣誤差估計(jì)
3.3 收斂速率的證明
4 結(jié)論
5 附錄
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]Classification with Gaussians and convex loss Ⅱ:improving error bounds by noise conditions[J]. XIANG DaoHong Department of Mathematics, Zhejiang Normal University, Jinhua 321004, China. Science China(Mathematics). 2011(01)
[2]不平衡數(shù)據(jù)分類的研究現(xiàn)狀[J]. 林智勇,郝志峰,楊曉偉. 計(jì)算機(jī)應(yīng)用研究. 2008(02)
本文編號:3523813
【文章來源】:浙江師范大學(xué)浙江省
【文章頁數(shù)】:40 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 統(tǒng)計(jì)學(xué)習(xí)理論概況
1.2 SVM與 DWD算法
1.2.1 SVM
1.2.2 DWD
1.3 線性WDWD算法
1.4 研究背景
1.5 論文結(jié)構(gòu)
2 基于核的WDWD算法和主要結(jié)果
2.1 基于核的WDWD算法
2.2 收斂速率
2.3 比較定理
3 誤差分析
3.1 投影算子及誤差分解
3.2 加權(quán)推廣誤差估計(jì)
3.3 收斂速率的證明
4 結(jié)論
5 附錄
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]Classification with Gaussians and convex loss Ⅱ:improving error bounds by noise conditions[J]. XIANG DaoHong Department of Mathematics, Zhejiang Normal University, Jinhua 321004, China. Science China(Mathematics). 2011(01)
[2]不平衡數(shù)據(jù)分類的研究現(xiàn)狀[J]. 林智勇,郝志峰,楊曉偉. 計(jì)算機(jī)應(yīng)用研究. 2008(02)
本文編號:3523813
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3523813.html
最近更新
教材專著