一種適用于高維非線性特征數(shù)據(jù)的聚類算法及應用
[Abstract]:In high dimensional data clustering analysis, there are many nonlinear feature relationships between the data, which lead to uneven distribution of data, failure of traditional similarity measurement and difficulty in accurate representation of result class centers, and so on. A high dimensional nonlinear feature data clustering technique based on kernel principal component analysis (KPCA) and density clustering (DBSCAN) is proposed. Firstly, in order to extract the nonlinear features of high-dimensional data effectively, the original data is mapped to higher-dimensional data space by using KPCA theory, and the direction set of data change is obtained by principal component analysis, and then the dimensionality reduction analysis is carried out. The traditional DBSCAN clustering method is improved by redefining the similarity distance of data samples in the principal component space, and each cluster center is represented by using the 3 未 statistical theory to realize the accurate classification of high-dimensional data and the knowledge representation of the cluster center. The validity of the method is verified by taking the cluster problem of real hypertension patients as an example. The experimental results show that the proposed method can effectively obtain the nonlinear characteristics of the original data. In order to solve the problem that traditional DBSCAN clustering method is not applicable to high dimensional data, the effective division of patient individual characteristic groups and the expression of cluster center knowledge are realized.
【作者單位】: 西安交通大學機械制造系統(tǒng)工程國家重點實驗室;西安交通大學第二附屬醫(yī)院;
【基金】:國家自然科學基金資助項目(51375375) 中央高校基本科研業(yè)務費專項資金資助項目(xjj2014108)
【分類號】:TP311.13
【相似文獻】
相關期刊論文 前10條
1 肖化昆;;一種高維數(shù)據(jù)類模板的設計方法與應用[J];計算機科學;2006年08期
2 賀玲;蔡益朝;楊征;;高維數(shù)據(jù)空間的一種網(wǎng)格劃分方法[J];計算機工程與應用;2011年05期
3 何進榮;丁立新;胡慶輝;李照奎;;高維數(shù)據(jù)空間的性質(zhì)及度量選擇[J];計算機科學;2014年03期
4 劉洪波,王秀坤,趙晶;高維數(shù)據(jù)空間金字塔技術研究[J];計算機工程與應用;2003年16期
5 沈萍;;高維數(shù)據(jù)挖掘技術研究[J];電腦知識與技術;2009年06期
6 謝楓平;;聚類分析中的高維數(shù)據(jù)降維方法研究[J];閩西職業(yè)技術學院學報;2009年04期
7 余元輝;鄧瑩;;一種新的高維數(shù)據(jù)聚類自適應算法的研究[J];沈陽化工大學學報;2010年02期
8 王寅峰;劉昊;狄盛;胡昊宇;;一種支持高維數(shù)據(jù)查詢的并行索引機制[J];華中科技大學學報(自然科學版);2011年S1期
9 周勇;盧曉偉;程春田;;非規(guī)則流中高維數(shù)據(jù)流典型相關性分析并行計算方法[J];軟件學報;2012年05期
10 王素芳;;基于組件的高維數(shù)據(jù)降維方法研究[J];電腦與電信;2012年10期
相關會議論文 前5條
1 周煜人;彭輝;桂衛(wèi)華;;基于映射的高維數(shù)據(jù)聚類方法[A];04'中國企業(yè)自動化和信息化建設論壇暨中南六省區(qū)自動化學會學術年會專輯[C];2004年
2 梁俊杰;楊澤新;馮玉才;;大規(guī)模高維數(shù)據(jù)庫索引結(jié)構(gòu)[A];第二十三屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2006年
3 陳冠華;馬秀莉;楊冬青;唐世渭;帥猛;;面向高維數(shù)據(jù)的低冗余Top-k異常點發(fā)現(xiàn)方法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(A輯)[C];2009年
4 劉運濤;鮑玉斌;吳丹;冷芳玲;孫煥良;于戈;;CBFrag-Cubing:一種基于壓縮位圖的高維數(shù)據(jù)立方創(chuàng)建算法(英文)[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2005年
5 甘俊英;張有為;;核主元分析特征提取法的研究[A];第十一屆全國信號處理學術年會(CCSP-2003)論文集[C];2003年
相關博士學位論文 前10條
1 黃曉輝;高維數(shù)據(jù)的若干聚類問題及算法研究[D];哈爾濱工業(yè)大學;2015年
2 楊崇;高維數(shù)據(jù)流上的K近鄰問題研究[D];山東大學;2016年
3 徐微微;高維數(shù)據(jù)降維可視化研究及其在生物醫(yī)學中的應用[D];武漢大學;2016年
4 楊風召;高維數(shù)據(jù)挖掘中若干關鍵問題的研究[D];復旦大學;2003年
5 陳黎飛;高維數(shù)據(jù)的聚類方法研究與應用[D];廈門大學;2008年
6 吳慶耀;高維數(shù)據(jù)的若干分類問題及算法研究[D];哈爾濱工業(yè)大學;2013年
7 樓巍;面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術研究[D];上海大學;2013年
8 黃健美;高維數(shù)據(jù)索引及其查詢處理技術研究[D];東北大學;2009年
9 董道國;高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復旦大學;2005年
10 劉翠響;人臉識別中高維數(shù)據(jù)特征分析[D];河北工業(yè)大學;2008年
相關碩士學位論文 前10條
1 沈江炎;基于軟子空間的高維數(shù)據(jù)樹形索引研究[D];昆明理工大學;2015年
2 侯小麗;高維數(shù)據(jù)聚類中的神經(jīng)網(wǎng)絡降維方法研究[D];蘭州大學;2015年
3 何熒;高維數(shù)據(jù)下的特征選擇與聚類方法研究[D];西南大學;2015年
4 胡昌杰;基于Autoencoder的高維數(shù)據(jù)降維方法研究[D];蘭州大學;2015年
5 楊代君;基于進化算法的高維數(shù)據(jù)聚類研究[D];西安電子科技大學;2014年
6 楊庭庭;基于信息熵的高維數(shù)據(jù)流聚類及其應用研究[D];重慶交通大學;2015年
7 孫喜利;高維數(shù)據(jù)的降維及聚類方法研究[D];蘭州大學;2016年
8 黃青君;基于稀疏子空間的高維數(shù)據(jù)聚類關鍵技術研究與應用[D];電子科技大學;2016年
9 劉建環(huán);面向高維數(shù)據(jù)降維與分類的深度模型構(gòu)建方法研究[D];重慶大學;2016年
10 孫志鵬;高維數(shù)據(jù)聚類算法的研究及應用[D];江南大學;2017年
,本文編號:2134201
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2134201.html