不平衡數(shù)據(jù)分類方法研究及其應(yīng)用
發(fā)布時(shí)間:2021-07-02 07:06
不平衡學(xué)習(xí)指在分類任務(wù)中不同類別的訓(xùn)練樣本數(shù)目差別很大的情況。近十年來,這個(gè)領(lǐng)域越發(fā)的受到研究者的關(guān)注,近五年以來,更是呈現(xiàn)爆發(fā)式的增長。與傳統(tǒng)分類任務(wù)不同,一方面數(shù)據(jù)的不平衡性會(huì)導(dǎo)致傳統(tǒng)分類算法的性能大幅下降,另一方面,不平衡學(xué)習(xí)往往存在錯(cuò)分代價(jià)不均等的問題,故對不平衡學(xué)習(xí)的研究有重要的意義。之前的研究已經(jīng)提出了大量的不平衡學(xué)習(xí)算法,但對于從后處理預(yù)測概率的角度提升少類的分類精度卻鮮有研究;诋(dāng)前的研究,針對二分類和多分類問題,對不平衡學(xué)習(xí)中,少數(shù)類樣本精度不高問題以及錯(cuò)分代價(jià)不均衡問題進(jìn)行改進(jìn)。本文主要通過兩階段的學(xué)習(xí)過程,對不平衡數(shù)據(jù)分類進(jìn)行優(yōu)化。第一階段得到預(yù)測概率,第二階段利用改進(jìn)的花朵授粉算法對預(yù)測概率的進(jìn)行優(yōu)化,保證得到更好的分類結(jié)果。實(shí)驗(yàn)表明,在10個(gè)二分類真實(shí)數(shù)據(jù)集上,此方法能成功的提升少數(shù)類樣本的精確度,具有很好的實(shí)際運(yùn)用價(jià)值,在多分類中,通過人工數(shù)據(jù)集和真實(shí)數(shù)據(jù)集的驗(yàn)證,此方法都在少數(shù)類樣本上取得了更高的精確度,并把此方法成功的應(yīng)用在農(nóng)場退出預(yù)測問題上,實(shí)驗(yàn)表明,該策略大幅度的提升了預(yù)測精度。
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
不平衡數(shù)據(jù)集的概率密度分布及分類邊界
不同不平
不同樣
【參考文獻(xiàn)】:
期刊論文
[1]基于分類精度和相關(guān)性的隨機(jī)森林算法改進(jìn)[J]. 王日升,謝紅薇,安建成. 科學(xué)技術(shù)與工程. 2017(20)
[2]求解旅行商問題的離散花授粉算法[J]. 李前,賀興時(shí),楊新社. 計(jì)算機(jī)與現(xiàn)代化. 2016(07)
博士論文
[1]基于蒙特卡洛神經(jīng)網(wǎng)絡(luò)算法的不平衡數(shù)據(jù)分類研究[D]. 馮芳.蘭州大學(xué) 2019
碩士論文
[1]基于極限學(xué)習(xí)機(jī)的多標(biāo)記不平衡分類算法研究[D]. 許二戧.江蘇科技大學(xué) 2019
本文編號(hào):3259999
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
不平衡數(shù)據(jù)集的概率密度分布及分類邊界
不同不平
不同樣
【參考文獻(xiàn)】:
期刊論文
[1]基于分類精度和相關(guān)性的隨機(jī)森林算法改進(jìn)[J]. 王日升,謝紅薇,安建成. 科學(xué)技術(shù)與工程. 2017(20)
[2]求解旅行商問題的離散花授粉算法[J]. 李前,賀興時(shí),楊新社. 計(jì)算機(jī)與現(xiàn)代化. 2016(07)
博士論文
[1]基于蒙特卡洛神經(jīng)網(wǎng)絡(luò)算法的不平衡數(shù)據(jù)分類研究[D]. 馮芳.蘭州大學(xué) 2019
碩士論文
[1]基于極限學(xué)習(xí)機(jī)的多標(biāo)記不平衡分類算法研究[D]. 許二戧.江蘇科技大學(xué) 2019
本文編號(hào):3259999
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3259999.html
最近更新
教材專著