基于擬蒙特卡洛的K均值聚類(lèi)中心初始化方法
本文選題:K-means聚類(lèi) + 擬蒙特卡洛; 參考:《濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年01期
【摘要】:針對(duì)傳統(tǒng)K-means算法隨機(jī)選擇初始聚類(lèi)中心容易造成聚類(lèi)結(jié)果不穩(wěn)定且準(zhǔn)確率低等問(wèn)題,基于擬蒙特卡洛(Quasi-Monte Carlo,QMC)方法提出一種新的初始聚類(lèi)中心確定方法;該算法利用QMC序列分布的超均勻性特點(diǎn),對(duì)整個(gè)樣本空間中的樣本分布進(jìn)行采樣估計(jì);基于k近鄰距離(k-distance)對(duì)QMC序列點(diǎn)進(jìn)行加權(quán)的K-means聚類(lèi),得到初始聚類(lèi)中心。該算法的計(jì)算復(fù)雜度為O(max(d、n)logn),其中d、n分別表示樣本數(shù)據(jù)的維數(shù)和數(shù)量;在人工數(shù)據(jù)和實(shí)際數(shù)據(jù)集上的仿真實(shí)驗(yàn)表明,該算法能選擇更優(yōu)的初始聚類(lèi)中心,有效降低K-means算法的迭代次數(shù),提高聚類(lèi)的準(zhǔn)確性、魯棒性和收斂速度。
[Abstract]:Aiming at the problem that the traditional K-means algorithm is easy to select the initial clustering center at random, the result of clustering is unstable and the accuracy is low. A new method for determining the initial clustering center is proposed based on quasi-Monte Carlo method. Based on the heterogeneity of QMC sequence distribution, the sample distribution in the whole sample space is sampled and estimated, and the initial clustering center is obtained based on k-nearest neighbor distance weighted K-means clustering of QMC sequence points. The computational complexity of the algorithm is O _ (max.) DU _ (n), where dn represents the dimension and quantity of the sample data respectively, and the simulation results on the artificial data and the actual data set show that the algorithm can select a better initial clustering center. It can effectively reduce the number of iterations of K-means algorithm and improve the accuracy, robustness and convergence speed of clustering.
【作者單位】: 中國(guó)計(jì)量大學(xué)理學(xué)院;中國(guó)計(jì)量大學(xué)量新學(xué)院;
【基金】:浙江省自然科學(xué)基金項(xiàng)目(LY14F030020)
【分類(lèi)號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 元丁;;令人驚訝的張冠李戴[J];新聞戰(zhàn)線;1992年09期
2 張文明;工作站環(huán)境中電路的蒙特卡洛分析[J];計(jì)算機(jī)應(yīng)用研究;1997年02期
3 程康萱;;憶訪棋王衛(wèi)冕戰(zhàn)——蒙特卡洛瑣記[J];新聞三昧;1995年03期
4 董寬;;再見(jiàn),蒙特卡洛——訪申辦2000年奧運(yùn)會(huì)決戰(zhàn)紀(jì)實(shí)[J];新聞三昧;1994年01期
5 閔濤;張帆;;參數(shù)反演的微分進(jìn)化蒙特卡洛算法[J];計(jì)算機(jī)工程與應(yīng)用;2012年07期
6 葛麗萍;鄂英杰;;運(yùn)用Crystal Ball & MS Project實(shí)現(xiàn)項(xiàng)目進(jìn)度的蒙特卡洛風(fēng)險(xiǎn)分析[J];電腦編程技巧與維護(hù);2013年08期
7 張建平;張鳳蓮;陶華;;基于混合蒙特卡洛算法的容差分配研究[J];計(jì)算機(jī)仿真;2009年10期
8 馬北北;;蒙特卡洛:舉世矚目的一天[J];青年記者;1994年01期
9 曲洪權(quán);龐麗萍;李運(yùn)澤;;序列蒙特卡洛濾波在衛(wèi)星傳熱反問(wèn)題中的應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2008年13期
10 錢(qián)鍵民;;雷達(dá)虛警概率模擬與重要采樣技術(shù)[J];火控雷達(dá)技術(shù);1984年02期
相關(guān)會(huì)議論文 前3條
1 程磊;房永智;王剛;;蒙特卡洛計(jì)算方法與作戰(zhàn)毀傷模擬決策分析[A];中國(guó)系統(tǒng)工程學(xué)會(huì)決策科學(xué)專業(yè)委員會(huì)第六屆學(xué)術(shù)年會(huì)論文集[C];2005年
2 周永宏;鄭大偉;廖新浩;;相關(guān)分析顯著水平的蒙特卡洛模擬檢驗(yàn)[A];中國(guó)地球物理學(xué)會(huì)年刊2002——中國(guó)地球物理學(xué)會(huì)第十八屆年會(huì)論文集[C];2002年
3 康曉巖;陳永義;;一種改進(jìn)的蒙特卡洛選擇算子[A];中國(guó)系統(tǒng)工程學(xué)會(huì)模糊數(shù)學(xué)與模糊系統(tǒng)委員會(huì)第十一屆年會(huì)論文選集[C];2002年
相關(guān)重要報(bào)紙文章 前6條
1 記者 王慶芳;蒙特卡洛三劍客聚首雜技節(jié)[N];石家莊日?qǐng)?bào);2005年
2 梁麗娟;1993:難忘蒙特卡洛[N];人民日?qǐng)?bào)海外版;2008年
3 宋志堅(jiān);天價(jià)之中的特權(quán)成本[N];福建日?qǐng)?bào);2007年
4 陽(yáng)映紅 編譯;充滿挑戰(zhàn)的再保業(yè)(下)[N];中國(guó)保險(xiǎn)報(bào);2014年
5 陽(yáng)映紅 編譯;充滿挑戰(zhàn)的再保業(yè)(上)[N];中國(guó)保險(xiǎn)報(bào);2014年
6 李雨萌;李娜的稅收哲學(xué)[N];大連日?qǐng)?bào);2014年
相關(guān)碩士學(xué)位論文 前10條
1 于永波;基于蒙特卡洛樹(shù)搜索的計(jì)算機(jī)圍棋博弈研究[D];大連海事大學(xué);2015年
2 祁建娟;CDO信用風(fēng)險(xiǎn)度量的蒙特卡洛算法優(yōu)化及應(yīng)用[D];上海交通大學(xué);2015年
3 梁金龍;鈾部件質(zhì)量豐度檢測(cè)數(shù)據(jù)采集仿真系統(tǒng)研究[D];西南科技大學(xué);2015年
4 王洋;基于蒙特卡洛理論的基因序列分析與仿真[D];廣東工業(yè)大學(xué);2016年
5 喬馨慧;磁場(chǎng)對(duì)容性及感應(yīng)耦合等離子體性質(zhì)影響的數(shù)值模擬研究[D];華中科技大學(xué);2014年
6 鄧斌;基于蒙特卡洛算法的錨泊容量研究[D];大連海事大學(xué);2012年
7 徐麟;基于蒙特卡洛分析的港口項(xiàng)目財(cái)務(wù)風(fēng)險(xiǎn)研究[D];大連海事大學(xué);2008年
8 謝東;基于蒙特卡洛技術(shù)的中國(guó)移動(dòng)無(wú)線網(wǎng)優(yōu)項(xiàng)目時(shí)間管理研究[D];安徽大學(xué);2012年
9 夏勇;基于蒙特卡洛的動(dòng)態(tài)無(wú)線傳感器網(wǎng)絡(luò)節(jié)點(diǎn)定位算法研究[D];遼寧科技大學(xué);2014年
10 肖峰;GPU高性能運(yùn)算在計(jì)算機(jī)圍棋博弈系統(tǒng)中的應(yīng)用研究及實(shí)驗(yàn)[D];北京郵電大學(xué);2011年
,本文編號(hào):1859494
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1859494.html