基于特征子集相關度和偏最小二乘法的特征選擇策略
發(fā)布時間:2021-10-17 14:36
在中藥方劑的量-效關系分析中,需要尋找藥理指標(因變量)受哪些血液指標(自變量)影響。本文提出一種基于特征子集相關度和偏最小二乘法的特征選擇策略,利用特征子集相關度對藥理指標進行評估預選出特征子集,然后將其放入偏最小二乘法中進行訓練,利用訓練后得出的殘差平方和評估該特征子集是否可取,并結(jié)合順序前向浮動混合搜索策略與順序后向浮動混合搜索策略,綜合評估以分析藥理指標受哪些血液指標的影響。分別采用麻杏石甘湯君藥止咳數(shù)據(jù)集及UCI數(shù)據(jù)集進行分析處理,實驗結(jié)果表明該特征選擇策略能較好尋找一個較優(yōu)的特征子集。
【文章來源】:江西中醫(yī)藥大學學報. 2019,31(02)
【文章頁數(shù)】:5 頁
【部分圖文】:
圖1兩種算法結(jié)合SFFS的SSETrain比較
咸卣餮≡袼惴ǖ氖笛榻峁?數(shù)據(jù)集被選擇特征數(shù)CFSCFS-PLS訓練集RSSCFSCFS-PLS測試集RSSCFSCFS-PLS運行時間(ms)CFSCFS-PLSMXSGT430.64970.427513.728111.99783747AQ873.64520.23280.10510.01063271351CASP654034.1872576.299269.5723224.39834862415Slump670.29760.31280.05160.03326781Housing11712.56419.31670.51380.478165187ENB764.45125.63710.28760.309689137CBM75973.5681347.7317213.654834.12565873278CCPP44134.540832.78697.76572.07248792418圖1兩種算法結(jié)合SFFS的SSETrain比較圖2兩種算法結(jié)合SFFS的SSETest比較圖3兩種算法結(jié)合SBFS的SSETrain比較圖4兩種算法結(jié)合SBFS的SSETest比較特征選擇子集存在一定的隨機性,不能保證全局最優(yōu),只能是較優(yōu)。由圖3和圖4可知,使用順序后向浮動混合搜索策略,在Slump數(shù)據(jù)集上,CFS-PLS訓練集的殘差平方和大于CFS。說明CFS-PLS算法不甚理想。而在ENB數(shù)據(jù)集上,CFS-PLS訓練集和測試集的殘差平方和都大于CFS。也說明CFS-PLS算法對該組數(shù)據(jù)沒有起到很好的效果。以上兩組數(shù)據(jù)說明,由于實驗數(shù)據(jù)(下轉(zhuǎn)第124頁)·19·劉蕾等:基于特征子集相關度和偏最小二乘法的特征選擇策略
咸卣餮≡袼惴ǖ氖笛榻峁?數(shù)據(jù)集被選擇特征數(shù)CFSCFS-PLS訓練集RSSCFSCFS-PLS測試集RSSCFSCFS-PLS運行時間(ms)CFSCFS-PLSMXSGT430.64970.427513.728111.99783747AQ873.64520.23280.10510.01063271351CASP654034.1872576.299269.5723224.39834862415Slump670.29760.31280.05160.03326781Housing11712.56419.31670.51380.478165187ENB764.45125.63710.28760.309689137CBM75973.5681347.7317213.654834.12565873278CCPP44134.540832.78697.76572.07248792418圖1兩種算法結(jié)合SFFS的SSETrain比較圖2兩種算法結(jié)合SFFS的SSETest比較圖3兩種算法結(jié)合SBFS的SSETrain比較圖4兩種算法結(jié)合SBFS的SSETest比較特征選擇子集存在一定的隨機性,不能保證全局最優(yōu),只能是較優(yōu)。由圖3和圖4可知,使用順序后向浮動混合搜索策略,在Slump數(shù)據(jù)集上,CFS-PLS訓練集的殘差平方和大于CFS。說明CFS-PLS算法不甚理想。而在ENB數(shù)據(jù)集上,CFS-PLS訓練集和測試集的殘差平方和都大于CFS。也說明CFS-PLS算法對該組數(shù)據(jù)沒有起到很好的效果。以上兩組數(shù)據(jù)說明,由于實驗數(shù)據(jù)(下轉(zhuǎn)第124頁)·19·劉蕾等:基于特征子集相關度和偏最小二乘法的特征選擇策略
【參考文獻】:
期刊論文
[1]基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J]. 孫廣路,宋智超,劉金來,朱素霞,何勇軍. 自動化學報. 2017(05)
[2]特征選擇方法與算法的研究[J]. 李敏,卡米力·木依丁. 計算機技術與發(fā)展. 2013(12)
[3]基于聯(lián)盟博弈的Filter特征選擇算法[J]. 李智廣,付楓,孫鑫,李彩虹. 計算機工程. 2013(04)
[4]一種使用多Filter初始化GA種群的混合特征選擇模型[J]. 高鵬毅,陳傳波,張葵,朱力,胡迎松,李丹. 小型微型計算機系統(tǒng). 2012(11)
[5]基于GA-SVM封裝算法的高光譜數(shù)據(jù)特征選擇[J]. 卓莉,鄭璟,王芳,黎夏,艾彬,錢峻屏. 地理研究. 2008(03)
本文編號:3441930
【文章來源】:江西中醫(yī)藥大學學報. 2019,31(02)
【文章頁數(shù)】:5 頁
【部分圖文】:
圖1兩種算法結(jié)合SFFS的SSETrain比較
咸卣餮≡袼惴ǖ氖笛榻峁?數(shù)據(jù)集被選擇特征數(shù)CFSCFS-PLS訓練集RSSCFSCFS-PLS測試集RSSCFSCFS-PLS運行時間(ms)CFSCFS-PLSMXSGT430.64970.427513.728111.99783747AQ873.64520.23280.10510.01063271351CASP654034.1872576.299269.5723224.39834862415Slump670.29760.31280.05160.03326781Housing11712.56419.31670.51380.478165187ENB764.45125.63710.28760.309689137CBM75973.5681347.7317213.654834.12565873278CCPP44134.540832.78697.76572.07248792418圖1兩種算法結(jié)合SFFS的SSETrain比較圖2兩種算法結(jié)合SFFS的SSETest比較圖3兩種算法結(jié)合SBFS的SSETrain比較圖4兩種算法結(jié)合SBFS的SSETest比較特征選擇子集存在一定的隨機性,不能保證全局最優(yōu),只能是較優(yōu)。由圖3和圖4可知,使用順序后向浮動混合搜索策略,在Slump數(shù)據(jù)集上,CFS-PLS訓練集的殘差平方和大于CFS。說明CFS-PLS算法不甚理想。而在ENB數(shù)據(jù)集上,CFS-PLS訓練集和測試集的殘差平方和都大于CFS。也說明CFS-PLS算法對該組數(shù)據(jù)沒有起到很好的效果。以上兩組數(shù)據(jù)說明,由于實驗數(shù)據(jù)(下轉(zhuǎn)第124頁)·19·劉蕾等:基于特征子集相關度和偏最小二乘法的特征選擇策略
咸卣餮≡袼惴ǖ氖笛榻峁?數(shù)據(jù)集被選擇特征數(shù)CFSCFS-PLS訓練集RSSCFSCFS-PLS測試集RSSCFSCFS-PLS運行時間(ms)CFSCFS-PLSMXSGT430.64970.427513.728111.99783747AQ873.64520.23280.10510.01063271351CASP654034.1872576.299269.5723224.39834862415Slump670.29760.31280.05160.03326781Housing11712.56419.31670.51380.478165187ENB764.45125.63710.28760.309689137CBM75973.5681347.7317213.654834.12565873278CCPP44134.540832.78697.76572.07248792418圖1兩種算法結(jié)合SFFS的SSETrain比較圖2兩種算法結(jié)合SFFS的SSETest比較圖3兩種算法結(jié)合SBFS的SSETrain比較圖4兩種算法結(jié)合SBFS的SSETest比較特征選擇子集存在一定的隨機性,不能保證全局最優(yōu),只能是較優(yōu)。由圖3和圖4可知,使用順序后向浮動混合搜索策略,在Slump數(shù)據(jù)集上,CFS-PLS訓練集的殘差平方和大于CFS。說明CFS-PLS算法不甚理想。而在ENB數(shù)據(jù)集上,CFS-PLS訓練集和測試集的殘差平方和都大于CFS。也說明CFS-PLS算法對該組數(shù)據(jù)沒有起到很好的效果。以上兩組數(shù)據(jù)說明,由于實驗數(shù)據(jù)(下轉(zhuǎn)第124頁)·19·劉蕾等:基于特征子集相關度和偏最小二乘法的特征選擇策略
【參考文獻】:
期刊論文
[1]基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J]. 孫廣路,宋智超,劉金來,朱素霞,何勇軍. 自動化學報. 2017(05)
[2]特征選擇方法與算法的研究[J]. 李敏,卡米力·木依丁. 計算機技術與發(fā)展. 2013(12)
[3]基于聯(lián)盟博弈的Filter特征選擇算法[J]. 李智廣,付楓,孫鑫,李彩虹. 計算機工程. 2013(04)
[4]一種使用多Filter初始化GA種群的混合特征選擇模型[J]. 高鵬毅,陳傳波,張葵,朱力,胡迎松,李丹. 小型微型計算機系統(tǒng). 2012(11)
[5]基于GA-SVM封裝算法的高光譜數(shù)據(jù)特征選擇[J]. 卓莉,鄭璟,王芳,黎夏,艾彬,錢峻屏. 地理研究. 2008(03)
本文編號:3441930
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3441930.html
最近更新
教材專著