天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于約束的高維不確定子空間聚類

發(fā)布時間:2018-02-05 21:46

  本文關(guān)鍵詞: 子空間 約束 聚類 不確定 高維 出處:《大連理工大學(xué)》2016年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著社會的發(fā)展和科學(xué)的進(jìn)步,數(shù)據(jù)逐漸朝著大數(shù)據(jù)量、高維度、多樣性發(fā)展,從數(shù)據(jù)中提取信息越來越困難。在數(shù)據(jù)挖掘研究中,不確定數(shù)據(jù)的聚類是一個巨大的挑戰(zhàn),由于傳統(tǒng)的聚類算法是基于準(zhǔn)確的數(shù)據(jù)進(jìn)行聚類的,而不確定數(shù)據(jù)并不是一個準(zhǔn)確值,一般是一個滿足某種概率密度函數(shù)的數(shù)據(jù)的分布,傳統(tǒng)聚類算法并不能高效的解決不確定數(shù)據(jù)的聚類問題。另外,高維數(shù)據(jù)的聚類問題也是數(shù)據(jù)挖掘算法中的另一個大問題。由于高維數(shù)據(jù)聚類的兩大難點:稀疏性和維度災(zāi)難,傳統(tǒng)算法同樣不適用,為了解決高維數(shù)據(jù)聚類問題,研究者們經(jīng)過不懈努力,最終提出了子空間聚類算法。該類算法在找到簇和找到與簇相關(guān)的維度兩方面均做出了巨大貢獻(xiàn)。結(jié)合這兩大難點,高維不確定數(shù)據(jù)的聚類算法具有更大的挑戰(zhàn)性,并且這類算法目前還很少。就我們所知,目前只有一種基于自底向上的子空間聚類算法擴(kuò)展而來的算法。為了有效地解決高維不確定數(shù)據(jù)的聚類問題,本文基于經(jīng)典的用于處理高維數(shù)據(jù)聚類問題的子空間聚類算法FINDIT(a fast and intelligent subspace clustering algorithm using dimension voting),提出了一種基于約束的半監(jiān)督子空間聚類算法:UFINDIT。本文主要的貢獻(xiàn)在于提出了一種有效地解決高維不確定數(shù)據(jù)聚類的自頂向下的不確定子空間聚類算法,算法具有較高的準(zhǔn)確率并且易于擴(kuò)展具有良好的伸縮性。具體如下:本文主要擴(kuò)展了FINDIT算法的距離度量函數(shù)和維投票過程,使其可以有效地處理不確定數(shù)據(jù);由于FINDIT算法的性能評估函數(shù)本身的缺陷,導(dǎo)致了在處理不確定數(shù)據(jù)時失效,為了解決這一問題,本文使用了約束信息來剔除不合理的項;同時,也使用了約束信息來改善FINDIT算法,提高運行速度并減少了參數(shù),主要表現(xiàn)在中心點合并過程;另外,本文提出了一些方法,如抽樣來使算法更有效;谌斯(shù)據(jù)集和真實數(shù)據(jù)集的實驗結(jié)果表明UFINDIT算法與現(xiàn)存的高維不確定數(shù)據(jù)的聚類算法相比具有更好的效果。
[Abstract]:With the development of the society and the progress of science, the data gradually develop towards the large amount of data, high dimension and diversity. It is more and more difficult to extract information from the data. Clustering of uncertain data is a great challenge, because the traditional clustering algorithm is based on accurate data clustering, but uncertain data is not an accurate value. Generally, it is a data distribution that satisfies some probability density function. Traditional clustering algorithm can not solve the clustering problem of uncertain data efficiently. The clustering problem of high-dimensional data is another big problem in data mining algorithm. Because of the two difficulties of high-dimensional data clustering: sparsity and dimensionality disaster, the traditional algorithm is also not applicable. In order to solve the problem of high-dimensional data clustering, researchers have made unremitting efforts. Finally, a subspace clustering algorithm is proposed, which has made a great contribution in finding clusters and finding the dimension related to clusters. Combined with these two major difficulties. Clustering algorithms for high-dimensional uncertain data are more challenging and few. As far as we know. At present, there is only one extended algorithm based on bottom-up subspace clustering algorithm to effectively solve the clustering problem of high-dimensional uncertain data. This paper is based on the classical subspace clustering algorithm FINDIT-based for dealing with high-dimensional data clustering problems. A fast and intelligent subspace clustering algorithm using dimension. Voicing). . A constraint based semi-supervised subspace clustering algorithm is proposed. UFINDIT.The main contribution of this paper is to propose a top-down clustering algorithm for high-dimensional uncertain data clustering from top to bottom. The algorithm has high accuracy and is easy to be extended and has good scalability. The details are as follows: this paper mainly extends the distance measure function and dimension voting process of FINDIT algorithm. To enable it to deal effectively with uncertain data; Because of the defect of the performance evaluation function of the FINDIT algorithm, it is invalid when dealing with the uncertain data. In order to solve this problem, the constraint information is used to eliminate the unreasonable items. At the same time, the constraint information is also used to improve the FINDIT algorithm, improve the speed and reduce the parameters, mainly in the center point merging process; In addition, some methods are proposed. The experimental results based on artificial data set and real data set show that the UFINDIT algorithm is more effective than the existing clustering algorithm of high-dimensional uncertain data.
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 柳盛;吉根林;;空間聚類技術(shù)研究綜述[J];南京師范大學(xué)學(xué)報(工程技術(shù)版);2010年02期

2 馬程;楊詩琴;;基于量子粒子群的帶障礙約束的空間聚類[J];安慶師范學(xué)院學(xué)報(自然科學(xué)版);2010年03期

3 殷俊華;李光強(qiáng);陳翼;鄧敏;;基于概念格的空間聚類方法[J];計算機(jī)系統(tǒng)應(yīng)用;2011年06期

4 李霞;徐樹維;;子空間聚類改進(jìn)算法研究綜述[J];計算機(jī)仿真;2010年05期

5 陳銘;吉根林;;一種基于相似維的高維子空間聚類算法[J];南京師大學(xué)報(自然科學(xué)版);2010年04期

6 馬程;陳杰;;障礙約束下的空間聚類算法分析[J];宜春學(xué)院學(xué)報;2012年12期

7 張思亮;李廣霞;;子空間聚類在入侵檢測中的應(yīng)用[J];計算機(jī)安全;2013年12期

8 何彬彬;方濤;郭達(dá)志;;基于不確定性的空間聚類[J];計算機(jī)科學(xué);2004年11期

9 楊楊;孫志偉;趙政;;一種處理障礙約束的基于密度的空間聚類算法[J];計算機(jī)應(yīng)用;2007年07期

10 李光強(qiáng);鄧敏;程濤;朱建軍;;一種基于雙重距離的空間聚類方法[J];測繪學(xué)報;2008年04期

相關(guān)會議論文 前6條

1 劉啟亮;鄧敏;彭東亮;徐震;;基于場論的空間聚類有效性評價方法研究[A];2009`中國地理信息產(chǎn)業(yè)論壇暨第二屆教育論壇就業(yè)洽談會論文集[C];2009年

2 鄧羽;;廣義多維云模型在空間聚類中的應(yīng)用[A];地理學(xué)與生態(tài)文明建設(shè)——中國地理學(xué)會2008年學(xué)術(shù)年會論文摘要集[C];2008年

3 鄧敏;劉啟亮;李光強(qiáng);程濤;;一種基于場模型的空間聚類算法[A];現(xiàn)代測量技術(shù)與地理信息系統(tǒng)科技創(chuàng)新及產(chǎn)業(yè)發(fā)展研討會論文集[C];2009年

4 徐玉峰;周麗華;肖清;;一種基于數(shù)據(jù)分布差異度的子空間聚類算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(一)[C];2008年

5 張燕萍;姜青山;;k-means型軟子空間聚類算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年

6 任家東;周瑋瑋;何海濤;;高維數(shù)據(jù)流的自適應(yīng)子空間聚類算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年

相關(guān)博士學(xué)位論文 前3條

1 孫麗萍;半監(jiān)督空間聚類方法及其在城市公共設(shè)施區(qū)位規(guī)劃中的應(yīng)用研究[D];安徽師范大學(xué);2015年

2 黃明;基于空間分區(qū)的空間聚類研究[D];武漢大學(xué);2010年

3 王劍亭;面向量子密鑰分發(fā)安全性分析的子空間聚類算法研究[D];中國科學(xué)技術(shù)大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 魏海洋;城市案件空間聚類技術(shù)研究[D];北京建筑大學(xué);2015年

2 張洋;基于空間聚類的公路交通運力態(tài)勢可視化方法研究[D];國防科學(xué)技術(shù)大學(xué);2013年

3 歐陽佩佩;改進(jìn)的稀疏子空間聚類算法研究[D];青島大學(xué);2015年

4 孫素敏;子空間聚類及其應(yīng)用[D];西安建筑科技大學(xué);2016年

5 許亞駿;子空間聚類算法研究及應(yīng)用[D];江南大學(xué);2016年

6 凌曉蔚;基于子空間聚類的多關(guān)系社交網(wǎng)絡(luò)挖掘研究[D];電子科技大學(xué);2016年

7 吳飛;面向序列數(shù)據(jù)的稀疏低秩子空間聚類方法研究[D];北京工業(yè)大學(xué);2016年

8 鄧振云;稀疏樣本自表達(dá)的子空間聚類算法[D];廣西師范大學(xué);2016年

9 齊緒停;基于子空間聚類的文本相關(guān)性研究[D];山東師范大學(xué);2016年

10 顧曉偉;基于面狀區(qū)域混合類型數(shù)據(jù)的空間聚類算法研究及應(yīng)用[D];遼寧工程技術(shù)大學(xué);2015年

,

本文編號:1492844

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1492844.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶09dbf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com