基于自然進(jìn)化策略的特征選擇算法研究
發(fā)布時(shí)間:2023-08-10 20:37
特征選擇是特征工程領(lǐng)域中子集篩選的一種框架,是一種NP-難問題。在當(dāng)今大數(shù)據(jù)時(shí)代,很多領(lǐng)域中都包含大量的數(shù)據(jù)信息,數(shù)據(jù)成為了一種重要資源。為了高效利用數(shù)據(jù),從數(shù)據(jù)中挖掘有效特征就尤為重要。特征工程首先將客觀數(shù)據(jù)編碼為特征,特征選擇便服務(wù)于特征的篩選,其旨是剔除特征集合中不相關(guān)及冗余的特征來減少模型訓(xùn)練的時(shí)間,提高模型預(yù)測的精確度。因此特征選擇在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和模式識(shí)別等領(lǐng)域中是一種重要的數(shù)據(jù)預(yù)處理手段。特征選擇表現(xiàn)為在原始特征集合中挑選優(yōu)質(zhì)特征子集的過程。一般由于缺少先驗(yàn)知識(shí),無法準(zhǔn)確篩選出和描述目標(biāo)最為相關(guān)的特征,面對該問題通常會(huì)采用一些評價(jià)準(zhǔn)則對特征進(jìn)行評估,這可以選出優(yōu)質(zhì)的特征,但是很難挖掘優(yōu)異的特征子集。一種簡單的尋找最優(yōu)特征子集的方法就是窮舉法,窮舉法試圖枚舉出所有的特征集合,這可以找到全局最優(yōu)的特征子集,但是窮舉搜索方式無法滿足較高維數(shù)據(jù)集的性能需求。進(jìn)一步隨機(jī)算法作為一種優(yōu)化方法可以很好地應(yīng)用到特征選擇中,并且由于隨機(jī)算法出色的全局搜索能力在特征選擇中取得了不錯(cuò)的效果。進(jìn)化策略作為一種隨機(jī)搜索方法被廣泛用于目標(biāo)優(yōu)化中。進(jìn)化策略模擬基因進(jìn)化過程,采用基因突變、產(chǎn)生種群、...
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與現(xiàn)狀
1.2 本文工作與結(jié)構(gòu)
第2章 特征選擇背景知識(shí)
2.1 特征工程
2.2 特征選擇概述
2.3 子集搜索
2.4 特征選擇算法
2.4.1 過濾式特征選擇算法
2.4.2 包裹式特征選擇算法
2.4.3 嵌入式特征選擇算法
第3章 進(jìn)化策略算法
3.1 ES算法
3.2 CMA-ES算法
3.3 NES算法
3.4 求解NES算法
第4章 MCC-NES算法
4.1 MCC-NES算法建模
4.2 初始化策略
4.3 適應(yīng)度函數(shù)
4.4 更新機(jī)制
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 數(shù)據(jù)集
4.5.2 對比算法及參數(shù)設(shè)置
4.5.3 實(shí)驗(yàn)結(jié)果對比分析
4.6 小結(jié)
第5章 總結(jié)與展望
參考文獻(xiàn)
作者簡介及科研成果
致謝
本文編號(hào):3841176
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與現(xiàn)狀
1.2 本文工作與結(jié)構(gòu)
第2章 特征選擇背景知識(shí)
2.1 特征工程
2.2 特征選擇概述
2.3 子集搜索
2.4 特征選擇算法
2.4.1 過濾式特征選擇算法
2.4.2 包裹式特征選擇算法
2.4.3 嵌入式特征選擇算法
第3章 進(jìn)化策略算法
3.1 ES算法
3.2 CMA-ES算法
3.3 NES算法
3.4 求解NES算法
第4章 MCC-NES算法
4.1 MCC-NES算法建模
4.2 初始化策略
4.3 適應(yīng)度函數(shù)
4.4 更新機(jī)制
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 數(shù)據(jù)集
4.5.2 對比算法及參數(shù)設(shè)置
4.5.3 實(shí)驗(yàn)結(jié)果對比分析
4.6 小結(jié)
第5章 總結(jié)與展望
參考文獻(xiàn)
作者簡介及科研成果
致謝
本文編號(hào):3841176
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3841176.html
最近更新
教材專著