基于ρ-δ決策圖的模糊C均值聚類方法研究
發(fā)布時(shí)間:2024-05-28 03:21
模糊聚類是對(duì)沒有標(biāo)簽的數(shù)據(jù)集進(jìn)行有效劃分的重要手段之一。隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量呈指數(shù)增長(zhǎng),然而大多數(shù)數(shù)據(jù)是沒有標(biāo)簽的,如何將這些數(shù)據(jù)準(zhǔn)確分類,并為用戶提供更準(zhǔn)確的服務(wù)成了當(dāng)今社會(huì)重點(diǎn)研究的方向。模糊C均值算法(FCM)是一種基于目標(biāo)函數(shù)的模糊聚類算法,與典型的“硬聚類”算法(如k-means算法)相比較。FCM算法計(jì)算每個(gè)樣本對(duì)所有類的隸屬度,得到更可靠、準(zhǔn)確的分類結(jié)果。然而,在聚類過程中,FCM算法需要人工確定聚類數(shù)目,并且對(duì)初始聚類中心敏感。容易產(chǎn)生多聚類迭代、收斂速度慢、局部最優(yōu)解等問題。為了解決這些問題,本文提出將FCM算法與決策圖相結(jié)合的算法(DGFCM)。首先利用決策圖自動(dòng)選擇聚類中心和聚類數(shù)目,然后利用FCM算法實(shí)現(xiàn)聚類。本文首先綜述了國(guó)內(nèi)外關(guān)于改進(jìn)FCM算法的研究方法,根據(jù)目標(biāo)準(zhǔn)則函數(shù)闡述了5個(gè)方向的FCM算法的改進(jìn);其次,通過實(shí)驗(yàn)證明了初始聚類中心對(duì)FCM迭代次數(shù)和聚類結(jié)果存在較大影響;再詳細(xì)介紹了基于ρ-δ決策圖的模糊C均值聚類方法;最后,分別采用UCI真實(shí)數(shù)據(jù)集和人工數(shù)據(jù)集作為實(shí)驗(yàn)樣本數(shù)據(jù),運(yùn)用傳統(tǒng)FCM聚類算法、快速密度峰聚類算法(DPC)、DGFCM算法...
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究的背景和意義
1.1.1 研究背景
1.1.2 選題的意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 距離度量方法與非平衡數(shù)據(jù)聚類研究
1.2.2 目標(biāo)準(zhǔn)則函數(shù)與隸屬度約束條件研究
1.2.3 初始聚類中心選擇方法研究
1.3 論文研究思路及內(nèi)容
第2章 聚類方法概述
2.1 聚類及其應(yīng)用領(lǐng)域
2.2 常用聚類方法
2.2.1 基于劃分的聚類方法
2.2.2 基于層次的聚類方法
2.2.3 基于密度的聚類方法
2.2.4 基于模型的聚類方法
2.2.5 模糊聚類方法
2.3 FCM初始聚類中心選擇方法
2.3.1 隨機(jī)選擇方法
2.3.2 遺傳算法
2.3.3 蟻群算法
2.4 聚類效果評(píng)價(jià)
2.4.1 AMI指標(biāo)
2.4.2 ARI指標(biāo)
2.4.3 F-measure指標(biāo)
第3章 FCM初始聚類中心選擇算法設(shè)計(jì)
3.1 模糊C均值聚類
3.1.1 FCM基本思想
3.1.2 算法描述
3.2 FCM初始聚類中心敏感性分析
3.2.1 數(shù)據(jù)準(zhǔn)備
3.2.2 聚類效果檢驗(yàn)
3.3 ρ-δ決策圖
3.3.1 局部密度定義
3.3.2 相對(duì)距離定義
3.3.3 聚類中心自動(dòng)選擇方法
3.4 DGFCM算法設(shè)計(jì)
3.4.1 設(shè)計(jì)思路
3.4.2 算法步驟
3.4.3 算法性能分析
第4章 DGFCM算法實(shí)驗(yàn)分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 DGFCM與 FCM比較
4.2.1 人工數(shù)據(jù)集實(shí)驗(yàn)
4.2.2 UCI數(shù)據(jù)集實(shí)驗(yàn)
4.3 DGFCM與 DPC比較
4.3.1 人工數(shù)據(jù)集實(shí)驗(yàn)
4.3.2 UCI數(shù)據(jù)集實(shí)驗(yàn)
第5章 結(jié)論與展望
5.1 研究結(jié)論
5.2 研究展望
致謝
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間發(fā)表的論文
附錄2 數(shù)據(jù)
本文編號(hào):3983420
【文章頁數(shù)】:66 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究的背景和意義
1.1.1 研究背景
1.1.2 選題的意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 距離度量方法與非平衡數(shù)據(jù)聚類研究
1.2.2 目標(biāo)準(zhǔn)則函數(shù)與隸屬度約束條件研究
1.2.3 初始聚類中心選擇方法研究
1.3 論文研究思路及內(nèi)容
第2章 聚類方法概述
2.1 聚類及其應(yīng)用領(lǐng)域
2.2 常用聚類方法
2.2.1 基于劃分的聚類方法
2.2.2 基于層次的聚類方法
2.2.3 基于密度的聚類方法
2.2.4 基于模型的聚類方法
2.2.5 模糊聚類方法
2.3 FCM初始聚類中心選擇方法
2.3.1 隨機(jī)選擇方法
2.3.2 遺傳算法
2.3.3 蟻群算法
2.4 聚類效果評(píng)價(jià)
2.4.1 AMI指標(biāo)
2.4.2 ARI指標(biāo)
2.4.3 F-measure指標(biāo)
第3章 FCM初始聚類中心選擇算法設(shè)計(jì)
3.1 模糊C均值聚類
3.1.1 FCM基本思想
3.1.2 算法描述
3.2 FCM初始聚類中心敏感性分析
3.2.1 數(shù)據(jù)準(zhǔn)備
3.2.2 聚類效果檢驗(yàn)
3.3 ρ-δ決策圖
3.3.1 局部密度定義
3.3.2 相對(duì)距離定義
3.3.3 聚類中心自動(dòng)選擇方法
3.4 DGFCM算法設(shè)計(jì)
3.4.1 設(shè)計(jì)思路
3.4.2 算法步驟
3.4.3 算法性能分析
第4章 DGFCM算法實(shí)驗(yàn)分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 DGFCM與 FCM比較
4.2.1 人工數(shù)據(jù)集實(shí)驗(yàn)
4.2.2 UCI數(shù)據(jù)集實(shí)驗(yàn)
4.3 DGFCM與 DPC比較
4.3.1 人工數(shù)據(jù)集實(shí)驗(yàn)
4.3.2 UCI數(shù)據(jù)集實(shí)驗(yàn)
第5章 結(jié)論與展望
5.1 研究結(jié)論
5.2 研究展望
致謝
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間發(fā)表的論文
附錄2 數(shù)據(jù)
本文編號(hào):3983420
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3983420.html
最近更新
教材專著