一種基于帶核隨機(jī)子空間的聚類集成算法
本文選題:子空間聚類 切入點(diǎn):聚類集成 出處:《南京大學(xué)學(xué)報(bào)(自然科學(xué))》2017年06期
【摘要】:隨機(jī)子空間聚類集成通過(guò)屬性隨機(jī)采樣產(chǎn)生屬性子空間,并將子空間上的基聚類結(jié)果進(jìn)行集成得到最終聚類結(jié)果.在這一過(guò)程中,子空間產(chǎn)生的隨機(jī)性雖然為聚類集成提供了很大的差異度,但是無(wú)法保證基聚類結(jié)果的有效性,這是因?yàn)殡S機(jī)產(chǎn)生的子空間有可能只包含極少的重要屬性.針對(duì)這一不足,提出了一種帶核隨機(jī)子空間生成策略:首先依據(jù)粗糙集理論中的互補(bǔ)互信息選出對(duì)于刻畫數(shù)據(jù)集整體信息至關(guān)重要的屬性子集,作為每個(gè)屬性子空間的"核心",再?gòu)氖S鄬傩约须S機(jī)選擇一定數(shù)量的屬性與核心屬性共同構(gòu)成聚類子空間.這種策略在兼顧子空間之間差異性的同時(shí)也提高了每個(gè)屬性子空間對(duì)數(shù)據(jù)整體信息的刻畫能力,從而得到更好的聚類集成結(jié)果.在大量UCI數(shù)據(jù)集上的實(shí)驗(yàn)證實(shí)了所提方法的合理性和有效性.
[Abstract]:Random subspace clustering ensemble generates attribute subspace by attribute random sampling, and the result of base clustering on subspace is integrated to obtain the final clustering result.In this process, the randomness generated by subspace can not guarantee the validity of base clustering results, although it provides a great degree of difference for clustering integration, because randomly generated subspaces may contain only a few important attributes.To solve this problem, a strategy of generating random subspace with kernels is proposed. Firstly, based on complementary mutual information in rough set theory, attribute subsets are selected which are important for describing the global information of data sets.As the "core" of each attribute subspace, a certain number of attributes and core attributes are randomly selected from the residual attribute set to form a cluster subspace.This strategy not only takes into account the differences between subspaces, but also improves the ability of each attribute subspace to depict the whole information of the data, so as to obtain a better result of clustering integration.Experiments on a large number of UCI datasets show that the proposed method is reasonable and effective.
【作者單位】: 山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院;計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家自然科學(xué)基金(61303008,61202018) 山西省自然科學(xué)基金(2013021018-1)
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 姚小群,陳統(tǒng)堅(jiān),姚錫凡;基于粗糙集理論的數(shù)據(jù)發(fā)掘算法[J];機(jī)床與液壓;2003年04期
2 黃金杰,李士勇,左興權(quán);粗糙集理論的新進(jìn)展及其在智能信息處理中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2003年09期
3 張士林,毛海軍,邵龍?zhí)?粗糙集不協(xié)調(diào)率的研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年18期
4 傅明,陳曦,劉翌南;基于信息顆粒的粗糙集約簡(jiǎn)研究[J];長(zhǎng)沙理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年01期
5 曹宇蓉,帥典勛;基于粗糙集理論的稅務(wù)系統(tǒng)分析模型[J];微型電腦應(yīng)用;2004年09期
6 劉靖,陳福生,張勤;基于粗糙集和模糊集的屬性約簡(jiǎn)算法[J];計(jì)算機(jī)工程與科學(xué);2005年02期
7 譚耀武;;基于數(shù)據(jù)挖掘粗糙集技術(shù)的電信運(yùn)營(yíng)商客戶價(jià)值評(píng)價(jià)[J];沿海企業(yè)與科技;2006年01期
8 趙青杉;王建國(guó);劉婧;;基于粗糙集的風(fēng)濕性二尖瓣狹窄疾病診斷[J];太原科技大學(xué)學(xué)報(bào);2006年03期
9 陳維巖;徐上;;基于基因表達(dá)式編程和粗糙集的屬性約簡(jiǎn)分類方法[J];太原科技;2009年01期
10 王文逾;;基于粗糙集的分體錯(cuò)位式動(dòng)態(tài)汽車稱重系統(tǒng)研究[J];太原理工大學(xué)學(xué)報(bào);2011年06期
相關(guān)會(huì)議論文 前5條
1 柯慧燕;;基于粗糙集的遠(yuǎn)程教育個(gè)性化服務(wù)研究[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
2 邢敬宏;張明新;李向偉;;基于粗糙集的分類模型預(yù)處理研究[A];全國(guó)第十屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)年會(huì)論文集[C];2006年
3 王剛;張志禹;;數(shù)據(jù)融合中粗糙集的應(yīng)用技術(shù)研究[A];2006中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
4 方煒煒;楊炳儒;彭珍;;一種基于粗糙集的啟發(fā)式屬性歸約的新算法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
5 方舟;黃俊強(qiáng);王希忠;;基于粗糙集神經(jīng)網(wǎng)絡(luò)的信息安全等保測(cè)評(píng)方法[A];第二屆全國(guó)信息安全等級(jí)保護(hù)測(cè)評(píng)體系建設(shè)會(huì)議論文集[C];2012年
相關(guān)博士學(xué)位論文 前10條
1 超木日力格;基于雅克比矩陣的軟劃分聚類算法分析[D];北京交通大學(xué);2017年
2 高兵;基于密度的數(shù)據(jù)流聚類方法研究[D];哈爾濱工程大學(xué);2014年
3 王永生;基于粗糙集理論的動(dòng)態(tài)數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];北京科技大學(xué);2016年
4 王麗娜;基于陰影集和粗糙集的模糊聚類算法研究與應(yīng)用[D];南京航空航天大學(xué);2016年
5 劉業(yè)政;基于粗糙集數(shù)據(jù)分析的智能決策支持系統(tǒng)研究[D];合肥工業(yè)大學(xué);2002年
6 王加陽(yáng);面向海量數(shù)據(jù)的粗糙集理論與方法研究[D];中南大學(xué);2005年
7 王佐;基于粗糙集的聚類算法研究[D];吉林大學(xué);2013年
8 郭慶;基于粗糙集理論的不確定信息系統(tǒng)及其決策研究[D];合肥工業(yè)大學(xué);2017年
9 瞿彬彬;基于粗糙集理論的決策信息系統(tǒng)知識(shí)獲取研究[D];華中科技大學(xué);2006年
10 李少勇;有序決策系統(tǒng)的知識(shí)更新理論及其高效算法[D];西南交通大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 郭亞銳;面向大規(guī)模數(shù)據(jù)的多視角K-means聚類算法的研究[D];鄭州大學(xué);2017年
2 曹曉鋒;面向維度的高維聚類邊界檢測(cè)技術(shù)研究[D];鄭州大學(xué);2017年
3 邱雪營(yíng);基于圖像視覺(jué)上下文的多元IB聚類算法[D];鄭州大學(xué);2017年
4 栗國(guó)保;基于MapReduce的分布式聚類算法的研究[D];江西理工大學(xué);2017年
5 張燦龍;不確定DM-chameleon聚類算法在滑坡危險(xiǎn)性預(yù)測(cè)的研究及應(yīng)用[D];江西理工大學(xué);2017年
6 張曼;基于粗糙集和包含度的聚類分類算法研究[D];青島理工大學(xué);2015年
7 程鈺;基于粗糙集的屬性選擇系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山西大學(xué);2015年
8 賀林曉;基于粗糙集的關(guān)聯(lián)規(guī)則挖掘在變電設(shè)備故障診斷中的應(yīng)用[D];華北電力大學(xué);2015年
9 張遠(yuǎn)聲;基于決策粗糙集的web短文本挖掘模型[D];廣西大學(xué);2016年
10 徐小玉;基于粒計(jì)算的數(shù)據(jù)流分類及F-粗糙集擴(kuò)展的研究[D];浙江師范大學(xué);2016年
,本文編號(hào):1693289
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1693289.html