不均衡樣本的分類優(yōu)化方法
發(fā)布時(shí)間:2021-11-05 06:57
隨著機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、深度學(xué)習(xí)等領(lǐng)域的快速發(fā)展,人們致力于不斷優(yōu)化各種模型。分類問題作為數(shù)據(jù)挖掘的主要任務(wù),備受學(xué)者關(guān)注,傳統(tǒng)分類策略大都基于代價(jià)不敏感的均衡數(shù)據(jù),它們往往注重一個(gè)模型的整體精度,而這樣的分類器對于非均衡的樣本數(shù)據(jù)并不適用。因此,如何改進(jìn)分類策略以優(yōu)化不均衡樣本的分類器性能,是一個(gè)值得討論的議題。本文以此為目標(biāo)展開研究,致力于在保持整體性能的前提下,提升分類器對少數(shù)類別的學(xué)習(xí)能力。當(dāng)前主要的研究方向主要有兩個(gè),其一從樣本出發(fā),研究如何在盡量不損失原樣本所含信息的前提下平衡類樣本數(shù)量,同時(shí)還應(yīng)盡量避免噪聲的產(chǎn)生;其二從算法出發(fā),通過訓(xùn)練單類樣本分類器、引入代價(jià)敏感因子、采用集合策略等方式提升學(xué)習(xí)器分類性能。本文在提出優(yōu)化策略之前,首先提出一種新型復(fù)合評價(jià)準(zhǔn)則IIBAα,通過理論和實(shí)驗(yàn)證明了其不僅能度量模型整體性能,還能夠側(cè)重評估少數(shù)類別的分類,同時(shí)具有更高的穩(wěn)健性和抗噪聲性等優(yōu)點(diǎn),可以將其運(yùn)用于優(yōu)化效果的比較中。之后本文分為樣本和算法策略兩方面介紹非均衡樣本分類的優(yōu)化方式,其中樣本優(yōu)化是核心所在。本文提出了一種基于聚類思想的組合樣本優(yōu)化方法框架,這種樣本優(yōu)化方法可與各種...
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
平衡后樣本散點(diǎn)圖
本文編號:3477304
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
平衡后樣本散點(diǎn)圖
本文編號:3477304
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3477304.html
最近更新
教材專著