天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

聚類融合算法及其在移動(dòng)通信企業(yè)的應(yīng)用

發(fā)布時(shí)間:2024-03-24 22:06
  聚類,作為數(shù)據(jù)挖掘技術(shù)研究的熱點(diǎn)之一,受到越來越多的關(guān)注。聚類的主要任務(wù)就是把數(shù)據(jù)集劃分成有意義或有用的組。隨著數(shù)據(jù)庫技術(shù)的飛速發(fā)展,各行各業(yè)中的信息數(shù)據(jù)也急劇地增長(zhǎng),而且數(shù)據(jù)的類型也由單一的數(shù)值型、文本型逐漸轉(zhuǎn)變成混合型,這就對(duì)聚類分析技術(shù)提出了新的要求。從已有的文獻(xiàn)來看,能有效處理混合型數(shù)據(jù)的算法相對(duì)較少�;谶@一現(xiàn)狀,本文重點(diǎn)研究了面向混合型數(shù)據(jù)的聚類融合算法,同時(shí)對(duì)其在移動(dòng)通信行業(yè)中的應(yīng)用進(jìn)行了探討。 本文對(duì)已有的算法進(jìn)行了研究比較之后,提出了一種基于圖的聚類融合算法——GCE算法。該算法選取能處理混合型數(shù)據(jù)的k-prototypes算法和CBL算法作為聚類成員進(jìn)行融合,以圖為基礎(chǔ),利用圖中頂點(diǎn)和邊的權(quán)值設(shè)置來確定數(shù)據(jù)點(diǎn)之間的聯(lián)系,通過數(shù)據(jù)點(diǎn)之間共享最近鄰數(shù)來確定融合函數(shù)。通過公共數(shù)據(jù)集上的實(shí)驗(yàn),結(jié)果表明該算法不僅能很好地處理混合型屬性數(shù)據(jù),而且得到比單一算法更為優(yōu)越的結(jié)果。此外,本文還分析了4種聚類成員差異性度量與融合準(zhǔn)確度之間的關(guān)系,實(shí)驗(yàn)結(jié)果表明成員大小為15到20左右,待聚類數(shù)據(jù)集有均勻簇分布時(shí),各種差異性度量與融合方法性能間的相關(guān)程度最高。 本文最后將此聚類融合算法成功...

【文章頁數(shù)】:68 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖3.1oiffieultdoughnut數(shù)據(jù)集(a圖中分為兩類;b圖中分為四類)

圖3.1oiffieultdoughnut數(shù)據(jù)集(a圖中分為兩類;b圖中分為四類)

的方法就是基于集群的幾何特征來進(jìn)行,然而每種方法均是只適用。如果要利用某種方法找到真實(shí)的聚類個(gè)數(shù),首先就要對(duì)數(shù)據(jù)集的假設(shè)�?赡艿那闆r是:同一數(shù)據(jù)集中有不同的集群形狀或者在真實(shí)任何有關(guān)集群形狀的信息。將一種聚類穩(wěn)定性能計(jì)量方法同某種特定的聚類算法相結(jié)合將會(huì)因此,當(dāng)這種計(jì)量方法顯示數(shù)....


圖3.2兩個(gè)點(diǎn)之間的共享最近部相似度的計(jì)算

圖3.2兩個(gè)點(diǎn)之間的共享最近部相似度的計(jì)算

否應(yīng)該把這三個(gè)對(duì)象歸結(jié)到同一個(gè)簇當(dāng)中呢?又或者對(duì)象i和j“真的”相似,他們是否與同一對(duì)象k都不相似呢?所以,我們考慮采用共享最近鄰的思想來提供一種穩(wěn)定的方法分析對(duì)象間的相似性。共享最近鄰的解釋如圖3.2所示。因此,接下來我們將設(shè)計(jì)一種嚴(yán)格的融合函數(shù)以幫助我們揭示數(shù)據(jù)集的真實(shí)自然結(jié)....


圖3.5人工數(shù)據(jù)集可視化圖

圖3.5人工數(shù)據(jù)集可視化圖

圖3.5人工數(shù)據(jù)集可視化圖(a)是20一Ze數(shù)據(jù)集,(b)是20一3C數(shù)據(jù)集,(e)是ZC一NonConvex數(shù)據(jù)集圖3.5(a)、(b)、(c)是采用人工數(shù)據(jù)集運(yùn)行聚類融合算法得到的可視化結(jié)果。該人工數(shù)據(jù)20一ZC、Zn一3C、Ze一NonConvex的自然簇分別為(50,1....


圖3.7Ecoli數(shù)據(jù)集中三種算法準(zhǔn)確率的比較

圖3.7Ecoli數(shù)據(jù)集中三種算法準(zhǔn)確率的比較

不包含丟失數(shù)據(jù),數(shù)據(jù)記錄用來測(cè)試生物蛋白在原核細(xì)胞中的位置。為了驗(yàn)證算法的性能,采用k一Protot即es算法、CBL算法以及本文提出的GcE融合算法對(duì)數(shù)據(jù)集聚類,得到的算法準(zhǔn)確率進(jìn)行了對(duì)比。比較三種聚類算法在不同聚類結(jié)果數(shù)目下的聚類準(zhǔn)確率結(jié)果,如圖3.7所示聚類結(jié)果數(shù)目從2到8....



本文編號(hào):3938088

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/xxjj/3938088.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶99696***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com