天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

面向不平衡樣本分類的過采樣集成學(xué)習(xí)算法研究

發(fā)布時(shí)間:2023-10-01 21:38
  不平衡樣本分類是指對某一類樣本數(shù)遠(yuǎn)多于其他類的數(shù)據(jù)集進(jìn)行模式分類的問題,重點(diǎn)關(guān)注的是對少數(shù)類樣本的識別。然而傳統(tǒng)分類器為了追求全局準(zhǔn)確率而傾向于將少數(shù)類誤分類為多數(shù)類,針對該問題我們從數(shù)據(jù)層面和算法層面提出了相應(yīng)的解決方法,以提高對少數(shù)類的識別準(zhǔn)確率。不平衡樣本分類方法主要從數(shù)據(jù)層面和算法層面考慮。在數(shù)據(jù)層面,過采樣算法能夠增加樣本信息,有助于少數(shù)類的識別。其中,BorderLine過采樣算法以及Adaptive Smote過采樣算法存在邊界少數(shù)類樣本識別不準(zhǔn)確的問題,導(dǎo)致對于種子少數(shù)類樣本選擇不準(zhǔn)確,難以合成符合樣本分布的數(shù)據(jù)集;算法層面的方法主要通過修改現(xiàn)有分類器的損失函數(shù)實(shí)現(xiàn),該類方法可使分類器更加注重少數(shù)類樣本從而提高對少數(shù)類樣本的識別準(zhǔn)確率。其中,代價(jià)敏感ADC2算法樣本的權(quán)重更新只考慮了基分類器準(zhǔn)確率對下一輪樣本權(quán)重的更新的影響,而沒有考慮樣本分布對樣本權(quán)重更新的影響。AdaBoost算法存在少數(shù)類樣本誤分類總權(quán)重小于多數(shù)類誤分類總權(quán)重的問題,該問題使得分類器對少數(shù)類分類準(zhǔn)確率降低。本文針對過采樣方法以及集成分類器在處理不平衡問題中存在的不足,在原有算法的基礎(chǔ)之上做了一些改...

【文章頁數(shù)】:60 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景與研究目的
    1.2 不平衡分類問題國內(nèi)外研究現(xiàn)狀
        1.2.1 采樣算法
        1.2.2 代價(jià)敏感和集成算法
    1.3 論文研究內(nèi)容
    1.4 論文結(jié)構(gòu)安排
第2章 不平衡樣本分類經(jīng)典算法與評價(jià)標(biāo)準(zhǔn)
    2.1 不平衡樣本分類算法的研究
        2.1.1 邊界過采樣和自適應(yīng)過采樣方法
        2.1.2 核密度估計(jì)采樣算法
        2.1.3 典型欠采樣算法
        2.1.4 集成學(xué)習(xí)方法與XGBoost提升樹
    2.2 不平衡樣本分類評價(jià)標(biāo)準(zhǔn)
        2.2.1 原子標(biāo)準(zhǔn)
        2.2.2 復(fù)合標(biāo)準(zhǔn)
        2.2.3 AUC值
    2.3 本章小結(jié)
第3章 不平衡樣本分類的過采樣集成學(xué)習(xí)方法
    3.1 改進(jìn)的帶權(quán)過采樣及其衍生算法
        3.1.1 改進(jìn)的帶權(quán)過采樣方法描述
        3.1.2 基于多數(shù)類帶權(quán)投票過采樣算法
    3.2 改進(jìn)權(quán)重更新的集成學(xué)習(xí)
        3.2.1 AdaBoost算法在不平衡樣本分類中存在的問題
        3.2.2 改進(jìn)權(quán)重更新策略
        3.2.3 BalanceBoost集成提升算法
    3.3 改進(jìn)的帶權(quán)過采樣BalanceBoost集成學(xué)習(xí)算法
    3.4 本章小結(jié)
第4章 實(shí)驗(yàn)結(jié)果與分析
    4.1 實(shí)驗(yàn)設(shè)置
        4.1.1 數(shù)據(jù)描述
        4.1.2 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置
    4.2 改進(jìn)的帶權(quán)過采樣系列算法的有效性驗(yàn)證
        4.2.1 IWOS算法和其他過采樣算法的對比試驗(yàn)
        4.2.2 WV過采樣算法對比實(shí)驗(yàn)
    4.3 VWA算法以及BalanceBoost算法有效性驗(yàn)證
        4.3.1 VWA算法有效性驗(yàn)證
        4.3.2 BalanceBoost算法有效性驗(yàn)證
    4.4 IWEN算法有效性驗(yàn)證
    4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝



本文編號:3849467

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3849467.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶81d2b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com