基于歸一化模糊聯(lián)合互信息最大的特征選擇
本文關(guān)鍵詞:基于歸一化模糊聯(lián)合互信息最大的特征選擇 出處:《計(jì)算機(jī)工程與應(yīng)用》2017年22期 論文類型:期刊論文
更多相關(guān)文章: 模糊等價(jià)關(guān)系 聯(lián)合互信息 最大最小準(zhǔn)則 特征選擇
【摘要】:特征選擇就是從特征集合中選擇出與分類類別相關(guān)性強(qiáng)而特征之間冗余性最小的特征子集,這樣一方面可以提高分類器的計(jì)算效率,另一方面可以提高分類器的泛化能力,進(jìn)而提高分類精度。基于互信息的特征相關(guān)性和冗余性的評(píng)價(jià)準(zhǔn)則,在實(shí)際應(yīng)用中存在以下的問(wèn)題:(1)變量的概率計(jì)算困難,進(jìn)而影響特征的信息熵計(jì)算困難;(2)互信息傾向于選擇值較多的特征;(3)基于累積加和的候選特征與特征子集之間冗余性度量準(zhǔn)則在特征維數(shù)較高的情況下容易失效。為了解決上述問(wèn)題,提出了基于歸一化模糊互信息最大的特征評(píng)價(jià)準(zhǔn)則,基于模糊等價(jià)關(guān)系計(jì)算變量的信息熵、條件熵、聯(lián)合熵;利用聯(lián)合互信息最大替換累積加和的度量方法;基于歸一化聯(lián)合互信息對(duì)特征重要性進(jìn)行評(píng)價(jià);基于該準(zhǔn)則建立了基于前向貪婪搜索的特征選擇算法。在UCI機(jī)器學(xué)習(xí)標(biāo)準(zhǔn)數(shù)據(jù)集上的多組實(shí)驗(yàn),證明算法能夠有效地選擇出對(duì)分類類別有效的特征子集,能夠明顯提高分類精度。
[Abstract]:Feature selection is to select the feature subset which has strong correlation with the classification category and the least redundancy between the features from the feature set. On the one hand, it can improve the computing efficiency of the classifier. On the other hand, it can improve the generalization ability of classifier, and then improve the classification accuracy. In the practical application, there are the following problems: 1) the probability of the variable is difficult to calculate, and then the information entropy which affects the feature is difficult to calculate. (2) Mutual information tends to select features with more values; In order to solve the above problem, redundancy metrics between candidate features and feature subsets based on cumulative sum are easy to fail in the case of high feature dimension. Based on the normalized fuzzy mutual information maximum feature evaluation criterion, the information entropy, conditional entropy and joint entropy of variables are calculated based on fuzzy equivalence relation. A measure of the cumulative sum of the maximum substitution of joint mutual information; The importance of feature is evaluated based on normalized joint mutual information. Based on this criterion, a feature selection algorithm based on forward greedy search is established. Experiments on UCI machine learning standard data set show that the algorithm can effectively select feature subsets that are effective for classification categories. The classification accuracy can be improved obviously.
【作者單位】: 武漢科技大學(xué)城市學(xué)院實(shí)驗(yàn)實(shí)訓(xùn)中心;華中科技大學(xué)軟件學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(No.61472289) 中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(No.2015IVA067) 河南省教育廳自然科學(xué)基金(No.15A110011)
【分類號(hào)】:TP18
【正文快照】: 1.武漢科技大學(xué)城市學(xué)院實(shí)驗(yàn)實(shí)訓(xùn)中心,武漢4300832.華中科技大學(xué)軟件學(xué)院,武漢4300001.Research and Training Center of City College,Wuhan University of Science and Technology,Wuhan 430083,China2.School of Software Engineering,Huazhong University of ScienceTech
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李云;;穩(wěn)定的特征選擇研究[J];微型機(jī)與應(yīng)用;2012年15期
2 錢(qián)學(xué)雙;多重篩選逐步回歸特征選擇法及其應(yīng)用[J];信息與控制;1986年05期
3 王新峰;邱靜;劉冠軍;;基于特征相關(guān)性和冗余性分析的機(jī)械故障特征選擇研究[J];中國(guó)機(jī)械工程;2006年04期
4 張葛祥;金煒東;胡來(lái)招;;滿意特征選擇及其應(yīng)用[J];控制理論與應(yīng)用;2006年01期
5 蔣盛益;王連喜;;基于特征相關(guān)性的特征選擇[J];計(jì)算機(jī)工程與應(yīng)用;2010年20期
6 張禹;劉云東;;基于相容粒的特征選擇[J];宿州學(xué)院學(xué)報(bào);2011年02期
7 付濤;;基于特征選擇的多示例學(xué)習(xí)算法研究[J];科技通報(bào);2013年08期
8 李麗娜;歐陽(yáng)繼紅;劉大有;高文杰;;一種結(jié)合特征選擇和鏈接過(guò)濾的主動(dòng)協(xié)作分類方法[J];計(jì)算機(jī)研究與發(fā)展;2013年11期
9 桑農(nóng);謝衍濤;高如新;張?zhí)煨?;神經(jīng)模糊網(wǎng)絡(luò)特征選擇[J];模式識(shí)別與人工智能;2006年06期
10 曹彥;王倩;周馳;;基于特征選擇技術(shù)的集成方法研究[J];計(jì)算機(jī)工程與科學(xué);2013年08期
相關(guān)博士學(xué)位論文 前5條
1 代琨;基于支持向量機(jī)的網(wǎng)絡(luò)數(shù)據(jù)特征選擇技術(shù)研究[D];解放軍信息工程大學(xué);2013年
2 楊峻山;生物組學(xué)數(shù)據(jù)的集成特征選擇研究[D];深圳大學(xué);2017年
3 劉波;組稀疏子空間的大間隔特征選擇[D];重慶大學(xué);2013年
4 王瑞;針對(duì)類別不平衡和代價(jià)敏感分類問(wèn)題的特征選擇和分類算法[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
5 姚蘭;支持向量機(jī)特征選擇中的L_p正則化方法研究[D];湖南大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 周瑞;基于支持向量機(jī)特征選擇的移動(dòng)通信網(wǎng)絡(luò)問(wèn)題分析[D];華南理工大學(xué);2015年
2 季金勝;高分辨率遙感影像典型地物目標(biāo)的特征選擇及其穩(wěn)定性研究[D];上海交通大學(xué);2015年
3 王維智;基于特征提取和特征選擇的級(jí)聯(lián)深度學(xué)習(xí)模型研究[D];哈爾濱工業(yè)大學(xué);2015年
4 蘭天;CUDA平臺(tái)下基于分層多組粒子群算法的特征選擇研究[D];重慶大學(xué);2015年
5 徐冬;基于特征選擇的入侵檢測(cè)方法研究[D];吉林大學(xué);2016年
6 肖麗莎;半監(jiān)督特征選擇關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2016年
7 李昌;概率特征選擇分類向量機(jī)[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年
8 譚蘊(yùn)琨;面向稀疏數(shù)據(jù)的在線學(xué)習(xí)特征選擇方法研究[D];華南理工大學(xué);2016年
9 蔡亞萍;結(jié)合標(biāo)記相關(guān)性的多標(biāo)記特征選擇及分類算法研究[D];南京師范大學(xué);2016年
10 陳東方;復(fù)雜數(shù)據(jù)分類方法及其應(yīng)用研究[D];天津大學(xué);2014年
,本文編號(hào):1418218
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1418218.html