基于混合ABC和CRO的高維特征選擇方法
發(fā)布時間:2021-10-01 01:17
高維數(shù)據(jù)集包含了成千上萬可用于數(shù)據(jù)分析和預(yù)測的特征,然而這些數(shù)據(jù)集存在許多不相關(guān)或冗余特征,影響了數(shù)據(jù)分析和預(yù)測的準(zhǔn)確性。現(xiàn)有分類技術(shù)難以準(zhǔn)確地識別最佳特征子集。針對該問題,提出了一種基于wrapper模式的特征選擇方法 AB-CRO,該方法結(jié)合了人工蜂群算法(ABC)和改進的化學(xué)反應(yīng)算法(CRO)的優(yōu)點進行特征選擇。針對迭代過程中較優(yōu)的個體可能在化學(xué)反應(yīng)過程中被消耗掉的現(xiàn)象,適當(dāng)?shù)丶尤刖⒉呗詠肀3址N群的優(yōu)良性。實驗結(jié)果表明,AB-CRO算法在最佳特征子集的識別和分類精度方面相對于基準(zhǔn)算法ABC,CRO以及基于GA,PSO和混合蛙跳算法都所有改進。
【文章來源】:計算機工程與應(yīng)用. 2019,55(11)北大核心CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
不同算法的平均適應(yīng)度值比較
2019,55(11)據(jù)集上的特征銳減最明顯(除了數(shù)據(jù)集DLBCL-Stanford和NervousSystem)。雖然在圖6中對于大多數(shù)數(shù)據(jù)集算法AB-CRO獲得適應(yīng)度值與CRO基本相似,但是圖7展示了AB-CRO算法選擇的最佳特征子集明顯小于CRO。這兩個指標(biāo)進一步證明了,本文算法在高維生物醫(yī)學(xué)數(shù)據(jù)特征選擇方面的優(yōu)越性。針對平均適應(yīng)度函數(shù),圖8對比了ABC算法、CRO算法和本文的AB-CRO算法在8個數(shù)據(jù)集下收斂性,本文的AB-CRO算法相對于ABC和CRO算法有較好的全局收斂能力,尤其是在ColonTumor和ALL-AML-trainALL-AML_trainColonTumorDLBCLOutcomeDLBCL-StanfordlungCancer_trainLungCancer-OntarioNervousSystemDLBCL-NIH-train1.00.80.60.40.20平均適應(yīng)度值A(chǔ)vgfAB-CROCROABCSFLAGAMPSO數(shù)據(jù)集圖6不同算法的平均適應(yīng)度值比較圖7不同算法選取的平均特征占總特征的比值數(shù)據(jù)集2.001.501.000.500平均特征占總特征的比例/%ColonTumorDLBCLOutcomeDLBCL-StanfordLungCancer-OntarioDLBCL-NIH-trainALL-AML_trainlungCancer_trainNervousSystemCROABCSFLAGAMPSOAB-CRO0.830.800.770.740.710.680.650.620.590.560.530.50240023002200210020001900180017001600150014001300120011001000900800700600500400300200100
?誘?一方面可以看到CRO算法提高了ABC的全局搜索能力,避免陷入局部最優(yōu)。另外,AB-CRO算法利用ABC生成初始種群位置,并采用精英保留策略,不會破壞原始AB-CRO算法的求解性能。進一步驗證了AB-CRO算法有較好的全局搜索能力。此外圖8還比較了ABC-CRO算法在使用精英策略和沒有使用精英策略(ABC-CRO-NES)下的收斂性,在數(shù)據(jù)集ColonTumor和lungCancer_train下,引入精英策略的收斂速度高于非精英策略,其他6組的收斂速度雖然略低于非精英策略,但是引入精英策略后能夠找到較好的全局最優(yōu)解,不容易陷入局部最優(yōu)解。圖9展示了ABC、CRO和本文的AB-CRO這三種算法在8個數(shù)據(jù)集上運行時間的比較,如圖9所示,本文的AB-CRO算法在DLBCL-NIH-train數(shù)據(jù)集用時846s,而ABC算法也需要864s,對于DLBCL-NIH-train(實例數(shù)160條,特征數(shù)目7400個)這種大數(shù)據(jù)集運行時間優(yōu)于ABC算法,雖然在其他7個數(shù)據(jù)集上的運行時間都略高于其他兩種算法,但是都能控制在100s以內(nèi),所以融合后的AB-CRO算法是可以滿足實時性的需求。4.3.2不同分類器對算法的影響通過與不同算法比較,AB-CRO算法在疾病數(shù)據(jù)分析方面取得了良好的分類性能。本文除了使用KNN分類器用于評估AB-CRO算法,還使用了另兩種流行的分類器SVM和NB對本文算法性能進行評估,實驗結(jié)果見表5。表5可以清楚看出,算法AB-CRO基于分類器KNN和SVM在ALL-AML_train、ColonTumor、NervousSystem、圖9不同算法運行時間的比較DLBCL-NIH-trainLungCancer-OntariolungCancer_trainDLBCL-StanfordDLBCLOutcomecentralNervousSystem-outcomeCo
本文編號:3416966
【文章來源】:計算機工程與應(yīng)用. 2019,55(11)北大核心CSCD
【文章頁數(shù)】:9 頁
【部分圖文】:
不同算法的平均適應(yīng)度值比較
2019,55(11)據(jù)集上的特征銳減最明顯(除了數(shù)據(jù)集DLBCL-Stanford和NervousSystem)。雖然在圖6中對于大多數(shù)數(shù)據(jù)集算法AB-CRO獲得適應(yīng)度值與CRO基本相似,但是圖7展示了AB-CRO算法選擇的最佳特征子集明顯小于CRO。這兩個指標(biāo)進一步證明了,本文算法在高維生物醫(yī)學(xué)數(shù)據(jù)特征選擇方面的優(yōu)越性。針對平均適應(yīng)度函數(shù),圖8對比了ABC算法、CRO算法和本文的AB-CRO算法在8個數(shù)據(jù)集下收斂性,本文的AB-CRO算法相對于ABC和CRO算法有較好的全局收斂能力,尤其是在ColonTumor和ALL-AML-trainALL-AML_trainColonTumorDLBCLOutcomeDLBCL-StanfordlungCancer_trainLungCancer-OntarioNervousSystemDLBCL-NIH-train1.00.80.60.40.20平均適應(yīng)度值A(chǔ)vgfAB-CROCROABCSFLAGAMPSO數(shù)據(jù)集圖6不同算法的平均適應(yīng)度值比較圖7不同算法選取的平均特征占總特征的比值數(shù)據(jù)集2.001.501.000.500平均特征占總特征的比例/%ColonTumorDLBCLOutcomeDLBCL-StanfordLungCancer-OntarioDLBCL-NIH-trainALL-AML_trainlungCancer_trainNervousSystemCROABCSFLAGAMPSOAB-CRO0.830.800.770.740.710.680.650.620.590.560.530.50240023002200210020001900180017001600150014001300120011001000900800700600500400300200100
?誘?一方面可以看到CRO算法提高了ABC的全局搜索能力,避免陷入局部最優(yōu)。另外,AB-CRO算法利用ABC生成初始種群位置,并采用精英保留策略,不會破壞原始AB-CRO算法的求解性能。進一步驗證了AB-CRO算法有較好的全局搜索能力。此外圖8還比較了ABC-CRO算法在使用精英策略和沒有使用精英策略(ABC-CRO-NES)下的收斂性,在數(shù)據(jù)集ColonTumor和lungCancer_train下,引入精英策略的收斂速度高于非精英策略,其他6組的收斂速度雖然略低于非精英策略,但是引入精英策略后能夠找到較好的全局最優(yōu)解,不容易陷入局部最優(yōu)解。圖9展示了ABC、CRO和本文的AB-CRO這三種算法在8個數(shù)據(jù)集上運行時間的比較,如圖9所示,本文的AB-CRO算法在DLBCL-NIH-train數(shù)據(jù)集用時846s,而ABC算法也需要864s,對于DLBCL-NIH-train(實例數(shù)160條,特征數(shù)目7400個)這種大數(shù)據(jù)集運行時間優(yōu)于ABC算法,雖然在其他7個數(shù)據(jù)集上的運行時間都略高于其他兩種算法,但是都能控制在100s以內(nèi),所以融合后的AB-CRO算法是可以滿足實時性的需求。4.3.2不同分類器對算法的影響通過與不同算法比較,AB-CRO算法在疾病數(shù)據(jù)分析方面取得了良好的分類性能。本文除了使用KNN分類器用于評估AB-CRO算法,還使用了另兩種流行的分類器SVM和NB對本文算法性能進行評估,實驗結(jié)果見表5。表5可以清楚看出,算法AB-CRO基于分類器KNN和SVM在ALL-AML_train、ColonTumor、NervousSystem、圖9不同算法運行時間的比較DLBCL-NIH-trainLungCancer-OntariolungCancer_trainDLBCL-StanfordDLBCLOutcomecentralNervousSystem-outcomeCo
本文編號:3416966
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3416966.html
最近更新
教材專著