K-means算法在地質(zhì)災(zāi)害系統(tǒng)中的應(yīng)用研究
【學(xué)位授予單位】:西安工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:P694;TP311.13
【圖文】:
西安工業(yè)大學(xué)碩士學(xué)位論文 K-means 算法進(jìn)行之前的數(shù)據(jù)預(yù)處理階段。首先,對(duì)待研究的機(jī)抽樣,這樣可以保證獲得的數(shù)據(jù)集具有代表性,能夠充分反映而且綜合了 K-means 算法的各個(gè)優(yōu)點(diǎn),從而獲得一組最佳的開始中心能夠很真實(shí)的反映真實(shí)數(shù)據(jù)。然而,該抽樣也有一些缺點(diǎn):夠取得很大規(guī)模的數(shù)據(jù)集,且有比較高的正確率,但是容易產(chǎn)生其次,雖然該抽樣方法效率是比較高的,但是無法避免抽取的據(jù)分布之間存在偏差,從而得不到高的正確性;诖,對(duì)于抽進(jìn)行合適的把握。
3 一種改進(jìn)的 CMU-kmeans 算法如下圖 3.4 所示,CMU-kmeans 算法主要包括三個(gè)部心的優(yōu)化,該算法運(yùn)行于對(duì)原始數(shù)據(jù)集的抽取樣本些最佳的初始聚類種子及初始聚類個(gè)數(shù),這些聚類種始數(shù)據(jù)集分布,這是 CMU-kmeans 算法最為核心的類算法對(duì)樣本數(shù)據(jù)對(duì)象集進(jìn)行聚類,這是本改進(jìn)算驗(yàn)以及對(duì)實(shí)驗(yàn)的評(píng)估,以驗(yàn)證本文提出的 CMU-km
圖 4.1 Glass 數(shù)據(jù)集中 m%取值對(duì)準(zhǔn)確率的影響中都包含不相關(guān)數(shù)據(jù)和孤立點(diǎn)數(shù)據(jù),只是這些數(shù)據(jù)一般比據(jù)分布的子樹數(shù)出現(xiàn)的可能性不大,所以將 p 設(shè)置為 90常量,本次實(shí)驗(yàn)用 0.5 來取值。價(jià)標(biāo)準(zhǔn)-means算法、改進(jìn)的Canopy算法和本論文中提出的CM行評(píng)價(jià)的標(biāo)準(zhǔn)有很多,這里選擇平均召回率(recall)兩個(gè)標(biāo)準(zhǔn)的定義分別如式 4.1 和 4.2 所示。P(i, j)= precision(i, j) = Ni,j/ NiR(i, j)= recall(i, j) = Ni,j/ Nj類 i中包含的樣本數(shù)據(jù)個(gè)數(shù);Ni,j代表類別 j 中的分類 i象的個(gè)數(shù)。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孟海東;任敬佩;;基于云計(jì)算平臺(tái)的聚類算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年11期
2 武霞;董增壽;孟曉燕;;基于大數(shù)據(jù)平臺(tái)hadoop的聚類算法K值優(yōu)化研究[J];太原科技大學(xué)學(xué)報(bào);2015年02期
3 譚躍生;楊寶光;王靜宇;張亞楠;;Hadoop云平臺(tái)下的聚類算法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年05期
4 趙慶;;基于Hadoop平臺(tái)下的Canopy-Kmeans高效算法[J];電子科技;2014年02期
5 周麗娟;王慧;王文伯;張寧;;面向海量數(shù)據(jù)的并行KMeans算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年S1期
6 毛典輝;;基于MapReduce的Canopy-Kmeans改進(jìn)算法[J];計(jì)算機(jī)工程與應(yīng)用;2012年27期
7 牛瑞卿;韓舸;;利用數(shù)據(jù)挖掘的滑坡監(jiān)測數(shù)據(jù)處理流程[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2012年07期
8 趙衛(wèi)中;馬慧芳;傅燕翔;史忠植;;基于云計(jì)算平臺(tái)Hadoop的并行k-means聚類算法設(shè)計(jì)研究[J];計(jì)算機(jī)科學(xué);2011年10期
9 劉文軍;游興中;;一種改進(jìn)的凝聚層次聚類法[J];吉首大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
10 孫雪;李昆侖;胡夕坤;趙瑞;;基于半監(jiān)督K-means的K值全局尋優(yōu)算法[J];北京交通大學(xué)學(xué)報(bào);2009年06期
相關(guān)碩士學(xué)位論文 前1條
1 張鑫;層次聚類算法的研究與應(yīng)用[D];江西理工大學(xué);2009年
本文編號(hào):2785967
本文鏈接:http://sikaile.net/kejilunwen/diqiudizhi/2785967.html