天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

高維非線性數(shù)據(jù)上的聚類算法研究

發(fā)布時間:2021-09-23 11:10
  聚類是一種重要的數(shù)據(jù)挖掘技術,它可以將獲取的數(shù)據(jù)根據(jù)一定的約束條件劃分為不同的類別。聚類的主要研究目標是同一類簇中數(shù)據(jù)點間的相似性以及不同類簇之間數(shù)據(jù)點間的相異性。由于現(xiàn)有數(shù)據(jù)普遍具有高維性和非線性,針對高維非線性數(shù)據(jù)的聚類已經(jīng)成為數(shù)據(jù)挖掘領域的重要研究課題。本文在對高維非線性數(shù)據(jù)進行深入分析的基礎上,針對傳統(tǒng)降維算法的不足,提出了一種一種基于SU的特征提取算法,并在此基礎上提出了一種基于加權流形距離的非線性數(shù)據(jù)聚類算法。本文取得的主要成果如下:針對傳統(tǒng)降維算法泛化能力差,許多算法需要經(jīng)驗指導,并且無法對非線性增量數(shù)據(jù)進行處理等問題,本文借助信息論相關理論提出了一種相似度量方法-對稱不確定性SU,提出了一種基于SU的特征提取算法(RFE-SU)。該算法解決了傳統(tǒng)主成分分析算法中相關系數(shù)無法衡量數(shù)據(jù)間非線性關系的缺點,并在此基礎上,通過基于滑動窗口技術的多級聯(lián)動緩沖區(qū)機制,對基于SU的特征提取算法進行擴展,使其能應用于增量數(shù)據(jù)的降維處理。在采用RFE-SU算法對數(shù)據(jù)高維非線性數(shù)據(jù)降維的基礎上,本文以信息論和流形學習為基礎,提出了一種基于加權流形距離的非線性數(shù)據(jù)聚類算法(WMD-NLDat... 

【文章來源】:遼寧大學遼寧省 211工程院校

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【部分圖文】:

高維非線性數(shù)據(jù)上的聚類算法研究


降維效果示意圖

中心點,近鄰,樣本點,鄰域


k義 1(反 k 近鄰密度) 記 N(x)k為樣本點 x 的 k 鄰域, ()~Nxk為 x 的反反 K 近鄰密度可描述為:()|~|()||()|~|NxNxNxDoNkkkx (4.6據(jù)近鄰密度指標,可以描述局部流形的結(jié)構。xDoN 越大,則x 越能代范圍內(nèi)的其他樣本點。義 2(中心點) 如果樣本點x的 xDoN ,則認為x是中心點。心點一般被它自身的反 k 近鄰點所包圍,就好像它們的中心點。與均的鄰域中心不同,中心點采用密度概念和距離結(jié)合,每個中心點都在,能切實地描述局部鄰域結(jié)構,更符合客觀流形的結(jié)構。索數(shù)據(jù)集中的每個中心點,將互為最近鄰的每個中心點連接起,將每點連接到距離最近的中心點上,構建一個基于中心點的鄰域圖,該鄰分地體現(xiàn)數(shù)據(jù)集潛在的結(jié)構信息,還能很好地區(qū)分邊界點的類別。

樣本選擇,示例,近鄰,數(shù)據(jù)集


e weight of each featurej . //根據(jù)第 3權重j 。//計算每個樣本的 k 近鄰和反 k 近鄰e k neighbor and Anti-k neighbor ofix .eixDoNof eachix .ncy graph with center point. //將符合 圖coreG , 并 將 其 放 入 新 的 矩 coreG 中每個連接在中心點上的樣本點essed data set Y。是用來縮減整個數(shù)據(jù)集的數(shù)據(jù)規(guī)模,采表其鄰域內(nèi)的其他數(shù)據(jù)點,這樣就保集的內(nèi)部結(jié)構,保證數(shù)據(jù)集的性質(zhì)不

【參考文獻】:
期刊論文
[1]基于區(qū)域劃分的DBSCAN多密度聚類算法[J]. 韓利釗,錢雪忠,羅靖,宋威.  計算機應用研究. 2018(06)
[2]一種加權主成分距離的聚類分析方法[J]. 呂巖威,李平.  統(tǒng)計研究. 2016(11)
[3]基于改進流形距離和人工蜂群的二階段聚類算法[J]. 夏卓群,歐慧,李平,武志偉,戴傲.  控制與決策. 2016(03)
[4]聚類算法綜述[J]. 伍育紅.  計算機科學. 2015(S1)
[5]高維數(shù)據(jù)挖掘中基于稀疏回歸的嵌入式特征提取方法[J]. 林書亮.  中國西部科技. 2013(12)
[6]基于互信息的主成分分析特征選擇算法[J]. 范雪莉,馮海泓,原猛.  控制與決策. 2013(06)
[7]數(shù)據(jù)挖掘中聚類算法研究進展[J]. 周濤,陸惠玲.  計算機工程與應用. 2012(12)
[8]基于互信息的無監(jiān)督特征選擇[J]. 徐峻嶺,周毓明,陳林,徐寶文.  計算機研究與發(fā)展. 2012(02)
[9]復雜分布數(shù)據(jù)的二階段聚類算法[J]. 公茂果,王爽,馬萌,曹宇,焦李成,馬文萍.  軟件學報. 2011(11)
[10]基于流形距離的量子進化聚類算法[J]. 李陽陽,石洪竺,焦李成,馬文萍.  電子學報. 2011(10)

博士論文
[1]譜聚類與維數(shù)約簡算法及其應用[D]. 楊藝芳.西安電子科技大學 2016
[2]流形學習理論與方法及其應用研究[D]. 詹宇斌.國防科學技術大學 2011



本文編號:3405598

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3405598.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶d79b6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com