天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

不平衡數(shù)據(jù)的距離加權(quán)算法的誤差分析

發(fā)布時(shí)間:2021-11-28 05:37
  近年來,隨著科技和信息技術(shù)的發(fā)展,高維小樣本問題和不平衡數(shù)據(jù)問題越來越受研究者的重視。支持向量機(jī)算法是最流行的分類算法之一,由于其分類邊界的確定只依賴于部分被稱之為支持向量的訓(xùn)練樣本,這導(dǎo)致其在處理高維小樣本數(shù)據(jù)時(shí)產(chǎn)生了“數(shù)據(jù)堆積”現(xiàn)象,從而影響了其分類效果。距離加權(quán)分類算法旨在解決支持向量機(jī)在處理高維小樣本數(shù)據(jù)時(shí)所固有的“數(shù)據(jù)堆積”現(xiàn)象,但該算法并不能很好地處理不平衡數(shù)據(jù)的分類問題。帶權(quán)的距離加權(quán)分類算法的提出旨在通過靈活地選擇兩類樣本的權(quán)重改進(jìn)標(biāo)準(zhǔn)的距離加權(quán)分類算法對不平衡數(shù)據(jù)的分類效果。目前距離加權(quán)分類系列算法已得到了廣泛的應(yīng)用,但其數(shù)學(xué)理論方面的研究還比較缺乏,尤其是缺乏定量的誤差分析理論。本論文主要研究帶權(quán)的距離加權(quán)分類算法,旨在統(tǒng)計(jì)學(xué)習(xí)理論的框架下對該算法進(jìn)行定量的誤差分析。首先我們建立了加權(quán)比較定理,該定理建立了加權(quán)錯(cuò)分誤差與加權(quán)推廣誤差之間的關(guān)系,其在誤差分析中起著關(guān)鍵作用。接著我們通過引入新的投影算子克服了本文中目標(biāo)函數(shù)無界帶來的分析上的困難。最后通過概率不等式和覆蓋數(shù)等技術(shù)估計(jì)了加權(quán)推廣誤差,并在此基礎(chǔ)之上建立了基于核的加權(quán)距離加權(quán)分類算法的收斂速率。本文為處理不平... 

【文章來源】:浙江師范大學(xué)浙江省

【文章頁數(shù)】:40 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
1 緒論
    1.1 統(tǒng)計(jì)學(xué)習(xí)理論概況
    1.2 SVM與 DWD算法
        1.2.1 SVM
        1.2.2 DWD
    1.3 線性WDWD算法
    1.4 研究背景
    1.5 論文結(jié)構(gòu)
2 基于核的WDWD算法和主要結(jié)果
    2.1 基于核的WDWD算法
    2.2 收斂速率
    2.3 比較定理
3 誤差分析
    3.1 投影算子及誤差分解
    3.2 加權(quán)推廣誤差估計(jì)
    3.3 收斂速率的證明
4 結(jié)論
5 附錄
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝


【參考文獻(xiàn)】:
期刊論文
[1]Classification with Gaussians and convex loss Ⅱ:improving error bounds by noise conditions[J]. XIANG DaoHong Department of Mathematics, Zhejiang Normal University, Jinhua 321004, China.  Science China(Mathematics). 2011(01)
[2]不平衡數(shù)據(jù)分類的研究現(xiàn)狀[J]. 林智勇,郝志峰,楊曉偉.  計(jì)算機(jī)應(yīng)用研究. 2008(02)



本文編號:3523813

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3523813.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5d39***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com