基于密度聚類(lèi)和樣本加權(quán)信息熵的特征選擇算法
本文關(guān)鍵詞:基于密度聚類(lèi)和樣本加權(quán)信息熵的特征選擇算法 出處:《山東師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2016年04期 論文類(lèi)型:期刊論文
更多相關(guān)文章: 特征選擇 加權(quán)信息熵 聚類(lèi)
【摘要】:特征選擇是機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域中的一個(gè)重要問(wèn)題.本文提出一種非監(jiān)督的特征選擇算法,稱(chēng)為基于密度聚類(lèi)和樣本加權(quán)信息熵的特征選擇算法(DCWIE).不同于傳統(tǒng)的基于信息熵的特征選擇算法,DCWIE使用一種加權(quán)的信息熵計(jì)算方法,增加對(duì)分類(lèi)貢獻(xiàn)大的樣本的權(quán)值,并通過(guò)與聚類(lèi)結(jié)合,實(shí)現(xiàn)無(wú)監(jiān)督學(xué)習(xí).實(shí)驗(yàn)結(jié)果表明了本文算法的有效性.
【作者單位】: 山東師范大學(xué)信息科學(xué)與工程學(xué)院;山東省分布式計(jì)算機(jī)軟件新技術(shù)重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61170145)
【分類(lèi)號(hào)】:TP181
【正文快照】: 1引言很多實(shí)際應(yīng)用中,比如人臉識(shí)別、信號(hào)處理、文本分類(lèi)等,數(shù)據(jù)的維數(shù)往往很高,且數(shù)據(jù)經(jīng)常含有不相關(guān)和冗余的特征,這些特征增加了機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘過(guò)程的計(jì)算復(fù)雜性.為解決所謂的“維數(shù)災(zāi)難”問(wèn)題[1],提高計(jì)算性能,一般要對(duì)數(shù)據(jù)進(jìn)行降維處理.特征選擇作為一種數(shù)據(jù)預(yù)處理方
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 卜華龍;夏靜;韓俊波;;特征選擇算法綜述及進(jìn)展研究[J];巢湖學(xué)院學(xué)報(bào);2008年06期
2 王博;賈焰;田李;;基于類(lèi)標(biāo)號(hào)擴(kuò)展的半監(jiān)督特征選擇算法[J];計(jì)算機(jī)科學(xué);2009年10期
3 陳紅;郭躬德;;一種新的雙重融合的半監(jiān)督特征選擇算法[J];小型微型計(jì)算機(jī)系統(tǒng);2010年08期
4 張曉光;孫正;徐桂云;阮殿旭;;一種類(lèi)內(nèi)方差與相關(guān)度結(jié)合的特征選擇算法[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2011年03期
5 陳建華;王治和;蔣蕓;許虎寅;樊東輝;;一種改進(jìn)的文本分類(lèi)特征選擇算法[J];微電子學(xué)與計(jì)算機(jī);2011年12期
6 郭磊;王亞弟;陳庶樵;朱珂;伊鵬;;一種改進(jìn)的動(dòng)態(tài)流特征選擇算法[J];計(jì)算機(jī)工程與應(yīng)用;2012年18期
7 代琨;于宏毅;馬學(xué)剛;李青;;基于支持向量機(jī)的特征選擇算法綜述[J];信息工程大學(xué)學(xué)報(bào);2014年01期
8 毛勇;周曉波;夏錚;尹征;孫優(yōu)賢;;特征選擇算法研究綜述[J];模式識(shí)別與人工智能;2007年02期
9 任雙橋;傅耀文;黎湘;莊釗文;;基于分類(lèi)間隔的特征選擇算法[J];軟件學(xué)報(bào);2008年04期
10 李勇明;張素娟;曾孝平;覃劍;韓亮;;輪詢(xún)式多準(zhǔn)則特征選擇算法的研究[J];系統(tǒng)仿真學(xué)報(bào);2009年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前5條
1 甄超;鄭濤;許潔萍;;音樂(lè)流派分類(lèi)中特征選擇算法研究[A];第18屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年
2 張仰森;曹元大;;最大熵建模方法中一種改進(jìn)的特征選擇算法[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
3 張錚;胡社教;江萍;;基于EP模式的特征選擇算法[A];2011中國(guó)儀器儀表與測(cè)控技術(shù)大會(huì)論文集[C];2011年
4 周炎濤;唐劍波;王家琴;;基于信息熵的改進(jìn)TFIDF特征選擇算法[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
5 李文法;段m#毅;劉悅;孫春來(lái);;一種面向流分類(lèi)的特征選擇算法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 王劍橋;基于局部特性的毫米波距離像識(shí)別方法研究[D];南京理工大學(xué);2014年
2 李云;特征選擇算法及其在基于內(nèi)容圖像檢索中的應(yīng)用研究[D];重慶大學(xué);2005年
3 劉華文;基于信息熵的特征選擇算法研究[D];吉林大學(xué);2010年
4 張靖;面向高維小樣本數(shù)據(jù)的分類(lèi)特征選擇算法研究[D];合肥工業(yè)大學(xué);2014年
5 潘巍巍;故障嚴(yán)重程度識(shí)別的有序分類(lèi)特征分析方法[D];哈爾濱工業(yè)大學(xué);2013年
6 張嘉偉;心電圖形態(tài)特征的識(shí)別及其在分類(lèi)中的作用研究[D];華東師范大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 徐嬌;基于Hadoop的文本特征選擇算法的研究[D];蘭州大學(xué);2015年
2 朱艷玲;基于聚類(lèi)的多層特征選擇算法的研究與應(yīng)用[D];鄭州輕工業(yè)學(xué)院;2015年
3 周p,
本文編號(hào):1308804
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1308804.html