基于欠抽樣技術(shù)和旋轉(zhuǎn)森林的非平衡類方法研究
發(fā)布時間:2023-05-21 23:11
作為模式識別和機器學(xué)習(xí)研究領(lǐng)域中最具挑戰(zhàn)性和吸引力的問題之一,非平衡類問題引起了越來越廣泛的關(guān)注,其表現(xiàn)為數(shù)據(jù)集樣本類別分布的高度不平衡。在很多實際問題中,如溢油檢測,漏油事件發(fā)生的頻率較低,但這種事件一旦發(fā)生后果比較嚴(yán)重。因此如何有效識別這些感興趣的少數(shù)類樣本往往比正確識別多數(shù)類樣本更加重要;谇烦闃拥慕M合分類器方法是常用于處理非平衡類問題的有效方法,但該方法使用欠抽樣方法獲得的數(shù)據(jù)集往往較小,如何在較少的數(shù)據(jù)集合上學(xué)習(xí)具有高準(zhǔn)確率的基分類器是該方法成功的核心問題之一。觀察到旋轉(zhuǎn)森林比Bagging、Adaboost等方法具有更高的泛化性能,故本文選擇旋轉(zhuǎn)森林作為基學(xué)習(xí)器,以獲得高準(zhǔn)確率的基分類器。另外旋轉(zhuǎn)森林對數(shù)據(jù)分布很敏感,相較于支持向量機、神經(jīng)網(wǎng)絡(luò),其更容易學(xué)習(xí)有差異的基分類器,這是基于欠抽樣的組合分類器方法能在非平衡類問題取得成功的另一個原因。因此,本文研究將欠抽樣技術(shù)與旋轉(zhuǎn)森林方法有效結(jié)合起來,提出有效的面向非平衡類問題的高效處理方法。本文的主要工作如下:(1)提出基于欠抽樣和旋轉(zhuǎn)森林的組合分類器方法(Ensemble with Undersampling techniq...
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
第2章 相關(guān)理論
2.1 非平衡類問題
2.2 非平衡類問題解決方法
2.2.1 數(shù)據(jù)層方法
2.2.2 算法層方法
2.2.3 組合分類器方法
2.3 評價指標(biāo)
2.4 本章小結(jié)
第3章 基于欠抽樣和旋轉(zhuǎn)森林的組合分類器方法
3.1 算法動機與算法思想
3.2 基于欠抽樣和旋轉(zhuǎn)森林的組合分類器方法
3.2.1 EUR-Ⅰ
3.2.2 EUR-Ⅱ
3.3 數(shù)據(jù)集及實驗設(shè)置
3.4 實驗結(jié)果與分析
3.5 本章小結(jié)
第4章 基于欠抽樣的旋轉(zhuǎn)森林增強算法
4.1 動機及算法基本思想
4.2 基于欠抽樣的旋轉(zhuǎn)森林增強算法
4.3 實驗設(shè)置
4.4 實驗結(jié)果分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀學(xué)位期間獲得與學(xué)位論文相關(guān)的科研成果目錄
致謝
本文編號:3821608
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
第2章 相關(guān)理論
2.1 非平衡類問題
2.2 非平衡類問題解決方法
2.2.1 數(shù)據(jù)層方法
2.2.2 算法層方法
2.2.3 組合分類器方法
2.3 評價指標(biāo)
2.4 本章小結(jié)
第3章 基于欠抽樣和旋轉(zhuǎn)森林的組合分類器方法
3.1 算法動機與算法思想
3.2 基于欠抽樣和旋轉(zhuǎn)森林的組合分類器方法
3.2.1 EUR-Ⅰ
3.2.2 EUR-Ⅱ
3.3 數(shù)據(jù)集及實驗設(shè)置
3.4 實驗結(jié)果與分析
3.5 本章小結(jié)
第4章 基于欠抽樣的旋轉(zhuǎn)森林增強算法
4.1 動機及算法基本思想
4.2 基于欠抽樣的旋轉(zhuǎn)森林增強算法
4.3 實驗設(shè)置
4.4 實驗結(jié)果分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
攻讀學(xué)位期間獲得與學(xué)位論文相關(guān)的科研成果目錄
致謝
本文編號:3821608
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3821608.html
最近更新
教材專著