決策信息系統(tǒng)的連續(xù)型特征選取方法
發(fā)布時(shí)間:2021-03-26 15:30
在大數(shù)據(jù)應(yīng)用過(guò)程中,對(duì)特征集合進(jìn)行約簡(jiǎn),降低數(shù)據(jù)維度,有助于提升數(shù)據(jù)模型的泛化能力.采用隨機(jī)森林模型選擇和相似性度量結(jié)合的方式對(duì)特征集合進(jìn)行特征初選,并通過(guò)前向搜索策略以距離為評(píng)價(jià)方式對(duì)初選集合進(jìn)行二次篩選,最終獲得特征子集.算法模型采用局部遍歷以提高執(zhí)行效率,同時(shí)通過(guò)前向選擇算法解決傳統(tǒng)方法無(wú)法確定最優(yōu)特征數(shù)目的問(wèn)題.實(shí)驗(yàn)結(jié)果表明,本文提出的方法能更有效地選擇特征子集,提高模型的分類(lèi)準(zhǔn)確率.
【文章來(lái)源】:信息與控制. 2019,48(02)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
0 引言
1 相關(guān)概念
1.1 連續(xù)型特征的決策信息系統(tǒng)
1.2 隨機(jī)森林特征重要性度量
1.3 相關(guān)性度量
1.4 樣本距離度量
2 隨機(jī)森林—序列前向選擇
2.1 序列向前搜索
2.2 隨機(jī)森林特征初選
1) 隨機(jī)森林特征排序
2) 相似度方法
2.3 前向選擇
3 實(shí)驗(yàn)驗(yàn)證
3.1 參數(shù)設(shè)置
3.2 超參數(shù)調(diào)節(jié)
3.3 準(zhǔn)確性對(duì)比分析
3.4 時(shí)間效率對(duì)比分析
4 結(jié)論
【參考文獻(xiàn)】:
期刊論文
[1]基于兩階段組合預(yù)測(cè)模型的區(qū)域物流需求預(yù)測(cè)[J]. 李捷,陳彥如,楊璐. 信息與控制. 2018(02)
[2]特征選擇研究綜述[J]. 黃鉉. 信息與電腦(理論版). 2017(24)
[3]基于Lasso特征選擇的自閉癥預(yù)測(cè)[J]. 常春云. 北京生物醫(yī)學(xué)工程. 2017(06)
[4]基于競(jìng)爭(zhēng)思想的分級(jí)聚類(lèi)算法[J]. 張文倩,莊華亮,陳翔,何熊熊. 信息與控制. 2017(05)
[5]基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J]. 孫廣路,宋智超,劉金來(lái),朱素霞,何勇軍. 自動(dòng)化學(xué)報(bào). 2017(05)
[6]集成特征選擇的最優(yōu)化支持向量機(jī)分類(lèi)器模型研究[J]. 趙宇,陳銳,劉蔚. 計(jì)算機(jī)科學(xué). 2016(08)
[7]基于屬性相似度的連續(xù)型特征選擇方法[J]. 王宏威,李國(guó)和. 渤海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(04)
[8]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2014(01)
碩士論文
[1]基于距離相關(guān)的最小冗余最大相關(guān)特征選擇法在QSAR中的應(yīng)用[D]. 鄧小龍.湖南農(nóng)業(yè)大學(xué) 2016
本文編號(hào):3101816
【文章來(lái)源】:信息與控制. 2019,48(02)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【文章目錄】:
0 引言
1 相關(guān)概念
1.1 連續(xù)型特征的決策信息系統(tǒng)
1.2 隨機(jī)森林特征重要性度量
1.3 相關(guān)性度量
1.4 樣本距離度量
2 隨機(jī)森林—序列前向選擇
2.1 序列向前搜索
2.2 隨機(jī)森林特征初選
1) 隨機(jī)森林特征排序
2) 相似度方法
2.3 前向選擇
3 實(shí)驗(yàn)驗(yàn)證
3.1 參數(shù)設(shè)置
3.2 超參數(shù)調(diào)節(jié)
3.3 準(zhǔn)確性對(duì)比分析
3.4 時(shí)間效率對(duì)比分析
4 結(jié)論
【參考文獻(xiàn)】:
期刊論文
[1]基于兩階段組合預(yù)測(cè)模型的區(qū)域物流需求預(yù)測(cè)[J]. 李捷,陳彥如,楊璐. 信息與控制. 2018(02)
[2]特征選擇研究綜述[J]. 黃鉉. 信息與電腦(理論版). 2017(24)
[3]基于Lasso特征選擇的自閉癥預(yù)測(cè)[J]. 常春云. 北京生物醫(yī)學(xué)工程. 2017(06)
[4]基于競(jìng)爭(zhēng)思想的分級(jí)聚類(lèi)算法[J]. 張文倩,莊華亮,陳翔,何熊熊. 信息與控制. 2017(05)
[5]基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J]. 孫廣路,宋智超,劉金來(lái),朱素霞,何勇軍. 自動(dòng)化學(xué)報(bào). 2017(05)
[6]集成特征選擇的最優(yōu)化支持向量機(jī)分類(lèi)器模型研究[J]. 趙宇,陳銳,劉蔚. 計(jì)算機(jī)科學(xué). 2016(08)
[7]基于屬性相似度的連續(xù)型特征選擇方法[J]. 王宏威,李國(guó)和. 渤海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(04)
[8]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2014(01)
碩士論文
[1]基于距離相關(guān)的最小冗余最大相關(guān)特征選擇法在QSAR中的應(yīng)用[D]. 鄧小龍.湖南農(nóng)業(yè)大學(xué) 2016
本文編號(hào):3101816
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3101816.html
最近更新
教材專(zhuān)著