高維數(shù)據(jù)子空間聚類方法
發(fā)布時間:2023-09-17 07:12
受到“維度災(zāi)難”的影響,高維數(shù)據(jù)的聚類效率與聚類結(jié)果的精度難以得到保證。為了降低“維度災(zāi)難”對聚類結(jié)果的影響,采用子空間聚類算法,生成高維數(shù)據(jù)集的子空間,并將在子空間中聚類得到的結(jié)果作為數(shù)據(jù)分析的依據(jù)。這一過程中子空間的質(zhì)量是保證子空間聚類算法有效性的關(guān)鍵,有兩種提高子空間質(zhì)量的方法,一是在子空間生成的過程中制定有效的生成規(guī)則,二是在子空間生成之后根據(jù)相應(yīng)的篩選策略精簡子空間。本文同時采用以上兩種方法,首先采用高維數(shù)據(jù)中維度密度高的維度生成子空間。其次在子空間內(nèi)自適應(yīng)地生成網(wǎng)格,根據(jù)網(wǎng)格密度精簡子空間內(nèi)的數(shù)據(jù)。之后再次根據(jù)維度密度將子空間內(nèi)的低密度維度剪枝,以提高子空間的質(zhì)量。聚類過程中采用網(wǎng)格聚類的方法,根據(jù)網(wǎng)格的鄰接性對子空間聚類。實驗證明該算法在UCI(University of California-Irvine)數(shù)據(jù)集上能得到較好的實驗結(jié)果,并且在抗噪聲能力,伸縮性以及效率實驗中都能產(chǎn)生良好的實驗結(jié)果。針對高維數(shù)據(jù)中有存在不確定數(shù)據(jù)的情況,為了避免不確定數(shù)據(jù)對高維數(shù)據(jù)聚類結(jié)果造成影響,提出高維不確定數(shù)據(jù)的子空間聚類算法,分別針對高維不確定數(shù)據(jù)中維度不確定與值不確定的情況提出相...
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外現(xiàn)狀研究分析
1.3 課題來源及研究內(nèi)容
1.3.1 課題的來源
1.3.2 課題的主要研究內(nèi)容
第2章 聚類分析技術(shù)介紹
2.1 聚類分析的概念與聚類過程
2.2 高維數(shù)據(jù)以及聚類方法介紹
2.2.1 降維方法介紹
2.2.2 Clique算法
2.3 不確定數(shù)據(jù)以及聚類方法介紹
2.3.1 不確定數(shù)據(jù)的相似度表示
2.3.2 不確定數(shù)據(jù)聚類方法
2.4 本章小結(jié)
第3章 高維高密度子空間聚類算法
3.1 基于hoeffding界子空間生成算法
3.2 基于凝聚的不規(guī)則網(wǎng)格算法
3.3 基于子空間相似的剪枝算法
3.4 基于分類比較的聚類算法
3.5 實驗與分析
3.6 本章小結(jié)
第4章 高維不確定數(shù)據(jù)的子空間聚類算法
4.1 KNN算法
4.2 維度不確定聚類算法
4.2.1 部分?jǐn)?shù)據(jù)維度不確定的子空間聚類算法
4.2.2 數(shù)據(jù)集維度不確定子空間聚類算法
4.3 值不確定子空間聚類算法
4.3.1 數(shù)據(jù)值模糊聚類
4.3.2 數(shù)據(jù)值缺失聚類
4.4 基于子空間的復(fù)雜高維不確定數(shù)據(jù)聚類算法
4.5 實驗與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號:3847252
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外現(xiàn)狀研究分析
1.3 課題來源及研究內(nèi)容
1.3.1 課題的來源
1.3.2 課題的主要研究內(nèi)容
第2章 聚類分析技術(shù)介紹
2.1 聚類分析的概念與聚類過程
2.2 高維數(shù)據(jù)以及聚類方法介紹
2.2.1 降維方法介紹
2.2.2 Clique算法
2.3 不確定數(shù)據(jù)以及聚類方法介紹
2.3.1 不確定數(shù)據(jù)的相似度表示
2.3.2 不確定數(shù)據(jù)聚類方法
2.4 本章小結(jié)
第3章 高維高密度子空間聚類算法
3.1 基于hoeffding界子空間生成算法
3.2 基于凝聚的不規(guī)則網(wǎng)格算法
3.3 基于子空間相似的剪枝算法
3.4 基于分類比較的聚類算法
3.5 實驗與分析
3.6 本章小結(jié)
第4章 高維不確定數(shù)據(jù)的子空間聚類算法
4.1 KNN算法
4.2 維度不確定聚類算法
4.2.1 部分?jǐn)?shù)據(jù)維度不確定的子空間聚類算法
4.2.2 數(shù)據(jù)集維度不確定子空間聚類算法
4.3 值不確定子空間聚類算法
4.3.1 數(shù)據(jù)值模糊聚類
4.3.2 數(shù)據(jù)值缺失聚類
4.4 基于子空間的復(fù)雜高維不確定數(shù)據(jù)聚類算法
4.5 實驗與分析
4.6 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
本文編號:3847252
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3847252.html
最近更新
教材專著