基于GAN的不平衡數(shù)據(jù)增強(qiáng)算法及其應(yīng)用研究
發(fā)布時(shí)間:2024-04-13 05:26
隨著機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的快速發(fā)展,越來越多的研究通過學(xué)習(xí)挖掘海量數(shù)據(jù)中的規(guī)律和特征,來實(shí)現(xiàn)更加準(zhǔn)確的預(yù)測和推斷。對海量數(shù)據(jù)進(jìn)行自動(dòng)分類能夠大大的提高人們獲取信息的效率。傳統(tǒng)的分類方法是建立在類分布大致平衡的假設(shè)基礎(chǔ)上,然而,現(xiàn)實(shí)生活中的很多數(shù)據(jù)都是不平衡的,例如癌癥檢測、網(wǎng)絡(luò)攻擊識(shí)別等,因此,不平衡數(shù)據(jù)增強(qiáng)算法的研究課題,近兩年來受到越來越多的關(guān)注。現(xiàn)有的解決不平衡數(shù)據(jù)分類問題的主流方法有采樣和集成學(xué)習(xí)相結(jié)合的方法,例如SMOTEBoost、RUSBoost、EUSBoost等算法。以上算法在初始化時(shí)給每個(gè)樣本賦予相同的權(quán)重,然后分別訓(xùn)練分類器,根據(jù)誤差率的反饋不斷地調(diào)整樣本的權(quán)重,最后得到表現(xiàn)較好的分類器。這些算法在某些特定情況下會(huì)過度依賴原始數(shù)據(jù)集。針對上述問題,本文中提出了用生成式對抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng)以解決不平衡數(shù)據(jù)分類的問題。本文主要貢獻(xiàn)如下:(1)針對訓(xùn)練數(shù)據(jù)集樣本不足的情況,提出了基于GAN的不平衡數(shù)據(jù)增強(qiáng)算法,利用該算法生成圖像組成新的數(shù)據(jù)集,然后提取圖像特征并分類,實(shí)驗(yàn)證明,生成的圖像在樣本多樣性上有較好的效果,并且通過該方法進(jìn)行數(shù)據(jù)增強(qiáng)后,數(shù)據(jù)的分類結(jié)果有了較好的提升...
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 數(shù)據(jù)層面解決策略
1.2.2 算法層面解決策略
1.2.3 綜合解決策略
1.3 主要工作和研究內(nèi)容
1.4 組織結(jié)構(gòu)
2 相關(guān)理論介紹
2.1 數(shù)據(jù)不平衡
2.1.1 數(shù)據(jù)不平衡介紹
2.1.2 常見形式和特點(diǎn)
2.1.3 解決辦法
2.2 生成式對抗網(wǎng)絡(luò)
2.2.1 核心思想
2.2.2 實(shí)現(xiàn)過程
2.2.3 網(wǎng)絡(luò)特點(diǎn)
2.3 本章小結(jié)
3 基于DCGAN的不平衡數(shù)據(jù)增強(qiáng)算法
3.1 問題提出
3.2 算法流程
3.3 算法訓(xùn)練
3.3.1 深度卷積生成式對抗網(wǎng)絡(luò)的訓(xùn)練
3.3.2 VGG16的訓(xùn)練
3.3.3 基礎(chǔ)分類器訓(xùn)練
3.4 實(shí)驗(yàn)分析
3.4.1 數(shù)據(jù)集描述
3.4.2 實(shí)驗(yàn)設(shè)計(jì)
3.4.3 結(jié)果分析
3.5 本章小結(jié)
4 基于DCGAN的集成學(xué)習(xí)的不平衡數(shù)據(jù)增強(qiáng)算法
4.1 問題提出
4.2 算法描述
4.2.1 算法介紹
4.2.2 算法流程
4.3 實(shí)驗(yàn)分析
4.3.1 數(shù)據(jù)集描述
4.3.2 實(shí)驗(yàn)設(shè)置
4.3.3 實(shí)驗(yàn)準(zhǔn)備
4.3.4 結(jié)果分析
4.4 算法實(shí)驗(yàn)結(jié)果對比
4.5 本章小結(jié)
5 不平衡數(shù)據(jù)增強(qiáng)算法的應(yīng)用系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)功能介紹
5.2 系統(tǒng)設(shè)計(jì)介紹
5.3 部分界面
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
作者簡歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號:3952549
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 數(shù)據(jù)層面解決策略
1.2.2 算法層面解決策略
1.2.3 綜合解決策略
1.3 主要工作和研究內(nèi)容
1.4 組織結(jié)構(gòu)
2 相關(guān)理論介紹
2.1 數(shù)據(jù)不平衡
2.1.1 數(shù)據(jù)不平衡介紹
2.1.2 常見形式和特點(diǎn)
2.1.3 解決辦法
2.2 生成式對抗網(wǎng)絡(luò)
2.2.1 核心思想
2.2.2 實(shí)現(xiàn)過程
2.2.3 網(wǎng)絡(luò)特點(diǎn)
2.3 本章小結(jié)
3 基于DCGAN的不平衡數(shù)據(jù)增強(qiáng)算法
3.1 問題提出
3.2 算法流程
3.3 算法訓(xùn)練
3.3.1 深度卷積生成式對抗網(wǎng)絡(luò)的訓(xùn)練
3.3.2 VGG16的訓(xùn)練
3.3.3 基礎(chǔ)分類器訓(xùn)練
3.4 實(shí)驗(yàn)分析
3.4.1 數(shù)據(jù)集描述
3.4.2 實(shí)驗(yàn)設(shè)計(jì)
3.4.3 結(jié)果分析
3.5 本章小結(jié)
4 基于DCGAN的集成學(xué)習(xí)的不平衡數(shù)據(jù)增強(qiáng)算法
4.1 問題提出
4.2 算法描述
4.2.1 算法介紹
4.2.2 算法流程
4.3 實(shí)驗(yàn)分析
4.3.1 數(shù)據(jù)集描述
4.3.2 實(shí)驗(yàn)設(shè)置
4.3.3 實(shí)驗(yàn)準(zhǔn)備
4.3.4 結(jié)果分析
4.4 算法實(shí)驗(yàn)結(jié)果對比
4.5 本章小結(jié)
5 不平衡數(shù)據(jù)增強(qiáng)算法的應(yīng)用系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)功能介紹
5.2 系統(tǒng)設(shè)計(jì)介紹
5.3 部分界面
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
作者簡歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號:3952549
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3952549.html
最近更新
教材專著