天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于混合型數(shù)據(jù)表示的聚類集成算法

發(fā)布時間:2021-03-24 18:51
  聚類分析是數(shù)據(jù)挖掘中的一個重要研究領(lǐng)域,已被廣泛應(yīng)用于圖像處理、信息檢索和生物信息學等研究領(lǐng)域。目前,已有多種聚類算法被發(fā)展。由于數(shù)據(jù)的復(fù)雜性,單一聚類算法無法有效地完成聚類任務(wù)。如何將多個聚類結(jié)果進行融合(即聚類集成)已成為聚類分析的一個重要研究內(nèi)容。在聚類集成過程中,集成結(jié)果的有效性容易受到基聚類的質(zhì)量的影響。為此,本文針對該問題開展了深入的研究工作,其中主要的研究成果包括如下:(1)將基聚類看作數(shù)據(jù)的符號特征與其原有特征進行合并,提出了一種基于混合型數(shù)據(jù)表示的聚類集成算法。該算法對K-Prototypes算法進行擴展,通過不斷迭代更新基聚類,使得獲得的集成結(jié)果同時對原數(shù)據(jù)類結(jié)構(gòu)和基聚類具有較高的一致性。在UCI數(shù)據(jù)集上將新算法與其它聚類集成算法進行了實驗比較分析。實驗結(jié)果表明提出的算法相比其它算法能夠在測試數(shù)據(jù)集上獲得更加有效性的集成結(jié)果。(2)在第一項研究工作的基礎(chǔ)上,本文將原數(shù)據(jù)特征信息、監(jiān)督信息和基聚類信息進行融合,提出了一種基于混合型數(shù)據(jù)表示的半監(jiān)督聚類集成算法。該算法利用非負矩陣分解聚類算法獲得和更新基聚類。獲得的聚類結(jié)果同時對原數(shù)據(jù)特征信息、監(jiān)督信息與基聚類信息有著較... 

【文章來源】:山西大學山西省

【文章頁數(shù)】:52 頁

【學位級別】:碩士

【部分圖文】:

基于混合型數(shù)據(jù)表示的聚類集成算法


數(shù)據(jù)表示本章使用K-Means聚類算法生成基聚類,將用數(shù)據(jù)集進行T次K-Means得到基

示意圖,算法,示意圖,混合型數(shù)據(jù)


基于混合型數(shù)據(jù)表示的聚類集成算法p2. 在混合型數(shù)據(jù)中隨機選取k 個對象作為初始類原型;p3. 對數(shù)據(jù)集中的每個對象,根據(jù)公式(2-5)計算其與每個類原型的相異分配到與其最近的類原型所代表的類中;p4. 重新計算每個類的類原型:數(shù)值型屬性部分取類內(nèi)全部對象的均值部分取出現(xiàn)次數(shù)最多的屬性組成類原型;p5. 循環(huán) Step3~Step4,直到每個類中的對象不再發(fā)生變化為止;p6. 將Step2~Step5循環(huán)T 次,將每次得到的結(jié)果矩陣替換Step1中的基聚p7. Step6 循環(huán)Q次結(jié)束,在最終的結(jié)果矩陣中選取結(jié)果類標簽。

數(shù)據(jù)表示


T 次基聚類結(jié)果下對象i與對象 j劃分在一類的次數(shù),根據(jù)公式(3-1)計算:1( , ) ( , ),1,( , )0,Tit jttit jtit jtit jtB i j R RR RR RR R (3-在監(jiān)督信息特征空間中,將成對約束表示成n n的矩陣S。對于給定的同一集上,成對約束具有對稱性和傳遞性[52]。根據(jù)下述公式計算對象點之間的相似度保證相似性矩陣 S 的非負性:101,( , )( , ) 1,1/ ,( , )i ji je e X X MS i j e unknowe e X X C (3-這樣,在原數(shù)據(jù)、基聚類、監(jiān)督信息三種特征空間上分別構(gòu)造 n n的矩陣D 和 S 后,將三個相似性矩陣線性結(jié)合構(gòu)造一個新矩陣1 2 3L w D w B wS,其中1w、3w分別為原數(shù)據(jù)、基聚類及監(jiān)督信息的權(quán)重,數(shù)據(jù)表示見圖 3.1。

【參考文獻】:
期刊論文
[1]一種基于混合型數(shù)據(jù)表示的聚類集成算法[J]. 李鑫,白亮.  鄭州大學學報(理學版). 2019(02)
[2]基于貝葉斯網(wǎng)絡(luò)的半監(jiān)督聚類集成模型[J]. 王紅軍,李志蜀,戚建淮,成飏,周鵬,周維.  軟件學報. 2010(11)
[3]基于屬性重要性的加權(quán)聚類融合[J]. 陽琳赟,周海京,卓晴,王文淵.  計算機科學. 2009(04)
[4]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇.  軟件學報. 2008(01)
[5]基于Bagging的選擇性聚類集成[J]. 唐偉,周志華.  軟件學報. 2005(04)
[6]數(shù)據(jù)挖掘綜述[J]. 鐘曉,馬少平,張鈸,俞瑞釗.  模式識別與人工智能. 2001(01)

博士論文
[1]聚類集成關(guān)鍵技術(shù)研究[D]. 羅會蘭.浙江大學 2007



本文編號:3098212

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3098212.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd255***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com