一種不完備混合數(shù)據(jù)集成聚類算法
本文關(guān)鍵詞:一種不完備混合數(shù)據(jù)集成聚類算法
更多相關(guān)文章: 集成聚類 不完備數(shù)據(jù) 混合數(shù)據(jù) 缺失值填充 K原型聚類算法
【摘要】:集成聚類技術(shù)由于具有較好的泛化能力,目前引起了研究者的高度關(guān)注.已有研究主要關(guān)注數(shù)值型完備數(shù)據(jù)的集成聚類問題.然而,實(shí)際應(yīng)用中面臨的數(shù)據(jù)往往是兼具數(shù)值屬性和分類屬性共同描述的混合型數(shù)據(jù),而且通常帶有缺失值.為此,針對不完備混合數(shù)據(jù)提出了一種集成聚類算法,首先利用3種缺失值填充方法對不完備混合數(shù)據(jù)進(jìn)行完備化處理;其次在3種填充后的不同完備數(shù)據(jù)集上分別多次執(zhí)行K-Prototypes算法產(chǎn)生基聚類結(jié)果;最后對基聚類結(jié)果進(jìn)行集成.在UCI真實(shí)數(shù)據(jù)集上與傳統(tǒng)聚類算法通過實(shí)驗(yàn)進(jìn)行了比較分析,實(shí)驗(yàn)結(jié)果表明提出的算法是有效的.
【作者單位】: 山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院;計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室(山西大學(xué));
【關(guān)鍵詞】: 集成聚類 不完備數(shù)據(jù) 混合數(shù)據(jù) 缺失值填充 K原型聚類算法
【分類號】:TP391
【正文快照】: 聚類分析是針對給定的數(shù)據(jù)集,根據(jù)元素之間因此,如何針對不完備混合數(shù)據(jù)進(jìn)行集成聚類就顯的相似性度量自動將相似的元素劃分到同一組,使得尤為必要.得組內(nèi)的元素相似性達(dá)到最大而組間元素的相似性為了解決這一問題,本文提出了一個(gè)基于缺失達(dá)到最小的過程.目前,聚類分析技術(shù)已
【相似文獻(xiàn)】
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 蔡彪;廖聞劍;彭艷兵;;Deep Web數(shù)據(jù)集成和關(guān)鍵技術(shù)綜述[A];2009年研究生學(xué)術(shù)交流會通信與信息技術(shù)論文集[C];2009年
2 許國艷;王志堅(jiān);;基于主動服務(wù)的領(lǐng)域數(shù)據(jù)集成研究[A];2008年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2008年
3 胥永康;吳志杰;席傳裕;岳筱玲;;基于數(shù)據(jù)拆分的數(shù)據(jù)集成技術(shù)研究[A];2005全國計(jì)算機(jī)程序設(shè)計(jì)類課程教學(xué)研討會論文集[C];2005年
4 李宗華;肖道綱;彭明軍;;數(shù)字武漢空間基礎(chǔ)數(shù)據(jù)集成建庫及應(yīng)用[A];堅(jiān)持科學(xué)發(fā)展觀 推進(jìn)自主創(chuàng)新 促進(jìn)國家創(chuàng)新型城市建設(shè)——武漢市第二屆學(xué)術(shù)年會論文集[C];2006年
5 喬慧捷;趙海軍;紀(jì)力強(qiáng);;生物多樣性數(shù)據(jù)集成模式初探[A];第五屆全國生物多樣性保護(hù)與持續(xù)利用研討會論文摘要集[C];2002年
6 張壽明;張?jiān)粕?向風(fēng)紅;繆爾康;;異構(gòu)設(shè)備數(shù)據(jù)集成實(shí)踐[A];中國自動化學(xué)會全國第九屆自動化新技術(shù)學(xué)術(shù)交流會論文集[C];2004年
7 張德欽;饒克鋒;顧進(jìn)廣;;基于語義的工業(yè)聯(lián)合體數(shù)據(jù)集成機(jī)制[A];全國冶金自動化信息網(wǎng)2014年會論文集[C];2014年
8 劉靖;劉江寧;;數(shù)據(jù)集成體系架構(gòu)及其實(shí)現(xiàn)框架研究[A];山東省計(jì)算機(jī)學(xué)會2005年信息技術(shù)與信息化研討會論文集(二)[C];2005年
9 李宗華;彭明軍;;規(guī)劃國土資源管理空間數(shù)據(jù)集成應(yīng)用與運(yùn)行機(jī)制探討[A];2004城市規(guī)劃年會論文集(下)[C];2004年
10 祝曉紅;劉煒;李俊麗;;用WPF進(jìn)行復(fù)雜數(shù)據(jù)集成的方法研究[A];第二十七屆中國控制會議論文集[C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 于翔;集成即服務(wù):面向云的數(shù)據(jù)集成[N];網(wǎng)絡(luò)世界;2009年
2 鄒大斌;發(fā)揮數(shù)據(jù)的最大價(jià)值[N];計(jì)算機(jī)世界;2007年
3 于翔;誰碾碎了數(shù)據(jù)?[N];網(wǎng)絡(luò)世界;2007年
4 本報(bào)記者 于翔;數(shù)據(jù)集成驅(qū)動企業(yè)實(shí)時(shí)創(chuàng)新[N];網(wǎng)絡(luò)世界;2010年
5 本報(bào)記者 于翔;數(shù)據(jù)集成市場演繹“大國崛起”[N];網(wǎng)絡(luò)世界;2010年
6 本報(bào)記者 于翔;數(shù)據(jù)集成開啟云征程[N];網(wǎng)絡(luò)世界;2010年
7 本報(bào)記者 于翔;數(shù)據(jù)集成進(jìn)入快速成長期[N];網(wǎng)絡(luò)世界;2010年
8 于翔 王翔;收復(fù)數(shù)據(jù)孤島[N];網(wǎng)絡(luò)世界;2007年
9 朱文;CIO希望攻克數(shù)據(jù)質(zhì)量關(guān)[N];計(jì)算機(jī)世界;2008年
10 呂梁市煤炭設(shè)計(jì)研究院 張萍;淺析數(shù)據(jù)集成環(huán)境下煤炭企業(yè)管理信息系統(tǒng)的構(gòu)建[N];呂梁日報(bào);2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張燕;Web數(shù)據(jù)集成中實(shí)體演化與關(guān)聯(lián)問題研究[D];山東大學(xué);2015年
2 鄂新華;面向服務(wù)的數(shù)據(jù)集成若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2015年
3 朱笑塵;異質(zhì)過程數(shù)據(jù)集成與修復(fù)[D];清華大學(xué);2015年
4 王欣;數(shù)據(jù)集成技術(shù)若干問題的研究[D];上海交通大學(xué);2010年
5 張永新;面向Web數(shù)據(jù)集成的數(shù)據(jù)融合問題研究[D];山東大學(xué);2012年
6 吳春明;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用[D];西南大學(xué);2011年
7 魏紅雨;基于4G地學(xué)空間數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];吉林大學(xué);2014年
8 曹順良;生物學(xué)數(shù)據(jù)集成若干關(guān)鍵問題研究[D];復(fù)旦大學(xué);2005年
9 周春英;超數(shù)據(jù)集成挖掘方法與技術(shù)研究[D];浙江大學(xué);2012年
10 陳義;面向數(shù)據(jù)集成的數(shù)據(jù)復(fù)制和查詢優(yōu)化[D];中國科學(xué)院研究生院(軟件研究所);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 翟妍偉;基于聯(lián)邦的異構(gòu)數(shù)據(jù)集成與交換系統(tǒng)研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
2 賈存鑫;鏈接數(shù)據(jù)技術(shù)在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用技術(shù)研究[D];南京大學(xué);2015年
3 姜玉茹;變電站數(shù)據(jù)集成與智能化應(yīng)用研究[D];山東大學(xué);2015年
4 申亞鵬;基于用戶反饋的多源非結(jié)構(gòu)化數(shù)據(jù)集成研究[D];浙江大學(xué);2015年
5 李明;多元空間位置數(shù)據(jù)集成和服務(wù)方法研究[D];南京師范大學(xué);2015年
6 李莉;保障信息系統(tǒng)數(shù)據(jù)集成管理工具的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年
7 徐U嗞,
本文編號:806505
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/806505.html