天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于快速地標(biāo)采樣的大規(guī)模譜聚類算法

發(fā)布時(shí)間:2018-05-01 07:29

  本文選題:地標(biāo)點(diǎn)采樣 + 大數(shù)據(jù) ; 參考:《電子與信息學(xué)報(bào)》2017年02期


【摘要】:為避免傳統(tǒng)譜聚類算法高復(fù)雜度的應(yīng)用局限,基于地標(biāo)表示的譜聚類算法利用地標(biāo)點(diǎn)與數(shù)據(jù)集各點(diǎn)間的相似度矩陣,有效降低了譜嵌入的計(jì)算復(fù)雜度。在大數(shù)據(jù)集情況下,現(xiàn)有的隨機(jī)抽取地標(biāo)點(diǎn)的方法會(huì)影響聚類結(jié)果的穩(wěn)定性,k均值中心點(diǎn)方法面臨收斂時(shí)間未知、反復(fù)讀取數(shù)據(jù)的問(wèn)題。該文將近似奇異值分解應(yīng)用于基于地標(biāo)點(diǎn)的譜聚類,設(shè)計(jì)了一種快速地標(biāo)點(diǎn)采樣算法。該算法利用由近似奇異向量矩陣行向量的長(zhǎng)度計(jì)算的抽樣概率來(lái)進(jìn)行抽樣,同隨機(jī)抽樣策略相比,保證了聚類結(jié)果的穩(wěn)定性和精度,同k均值中心點(diǎn)策略相比降低了算法復(fù)雜度。同時(shí)從理論上分析了抽樣結(jié)果對(duì)原始數(shù)據(jù)的信息保持性,并對(duì)算法的性能進(jìn)行了實(shí)驗(yàn)驗(yàn)證。
[Abstract]:In order to avoid the high complexity of the traditional spectral clustering algorithm, the spectral clustering algorithm based on landmarks can effectively reduce the computational complexity of spectral embedding by using the similarity matrix between the ground punctuation points and the data sets. In the case of big data set, the existing random sampling ground punctuation methods will affect the stability of the clustering results and the k-means centroid method will face the problem of the unknown convergence time and the problem of repeatedly reading the data. In this paper, the approximate singular value decomposition is applied to the spectral clustering based on geopunctuation, and a fast punctuation sampling algorithm is designed. The algorithm uses the sampling probability calculated by the length of the approximate singular vector matrix row vector to carry out the sampling. Compared with the random sampling strategy, the stability and accuracy of the clustering results are guaranteed. Compared with the k-means center point strategy, the algorithm complexity is reduced. At the same time, the information retention of the sampling results to the original data is analyzed theoretically, and the performance of the algorithm is verified experimentally.
【作者單位】: 解放軍信息工程大學(xué);數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室;
【基金】:國(guó)家973計(jì)劃(2012CB315905) 國(guó)家自然科學(xué)基金(61502527,61379150)~~
【分類號(hào)】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 蔡曉妍;戴冠中;楊黎斌;;譜聚類算法綜述[J];計(jì)算機(jī)科學(xué);2008年07期

2 汪中;劉貴全;陳恩紅;;基于模糊K-harmonic means的譜聚類算法[J];智能系統(tǒng)學(xué)報(bào);2009年02期

3 孫昌思核;孔萬(wàn)增;戴國(guó)駿;;一種自動(dòng)確定類個(gè)數(shù)的譜聚類算法[J];杭州電子科技大學(xué)學(xué)報(bào);2010年02期

4 蘭洋;;改進(jìn)譜聚類算法在高等院校人才選拔中的應(yīng)用[J];信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年04期

5 張力文;丁世飛;許新征;朱紅;徐麗;;一種基于成對(duì)約束的譜聚類算法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期

6 施培蓓;郭玉堂;胡玉娟;俞駿;;多尺度的譜聚類算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年08期

7 楊曉慧;王莉莉;李登峰;;一種新的層次譜聚類算法[J];上海理工大學(xué)學(xué)報(bào);2014年01期

8 朱強(qiáng)生;何華燦;周延泉;;譜聚類算法對(duì)輸入數(shù)據(jù)順序的敏感性[J];計(jì)算機(jī)應(yīng)用研究;2007年04期

9 金慧珍;趙遼英;;多層自動(dòng)確定類別的譜聚類算法[J];計(jì)算機(jī)應(yīng)用;2008年05期

10 孫大雷;孟凡榮;閆秋艷;;一種初始化不敏感的譜聚類算法[J];微電子學(xué)與計(jì)算機(jī);2012年07期

相關(guān)博士學(xué)位論文 前1條

1 呂紹高;統(tǒng)計(jì)學(xué)習(xí)中回歸與正則化譜聚類算法的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 李純;快速譜聚類算法的研究與應(yīng)用[D];哈爾濱工程大學(xué);2012年

2 董彬;一種基于主動(dòng)學(xué)習(xí)的半監(jiān)督譜聚類算法研究[D];中國(guó)礦業(yè)大學(xué);2015年

3 劉萍萍;基于特征間隙檢測(cè)簇?cái)?shù)的譜聚類算法研究[D];南京郵電大學(xué);2015年

4 孫承祥;雙饋型風(fēng)電機(jī)組的風(fēng)電場(chǎng)建模研究[D];華北電力大學(xué);2015年

5 崔慧嶺;一種面向大數(shù)據(jù)的文本聚類算法[D];湖北師范大學(xué);2016年

6 徐大海;基于分布式的譜聚類算法在虛擬社區(qū)發(fā)現(xiàn)上的應(yīng)用研究[D];暨南大學(xué);2016年

7 王有華;基于歸一化壓縮距離的文本譜聚類算法研究[D];貴州大學(xué);2016年

8 張濤;基于密度估計(jì)的譜聚類算法研究與應(yīng)用[D];江南大學(xué);2016年

9 包秀娟;聚類有效性指標(biāo)結(jié)構(gòu)分析及應(yīng)用[D];天津大學(xué);2014年

10 周燕琴;基于改進(jìn)譜聚類算法在醫(yī)學(xué)圖像中的應(yīng)用研究[D];廣西師范學(xué)院;2016年

,

本文編號(hào):1828350

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1828350.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶493d6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com