基于不同類型數(shù)據(jù)的聚類算法研究
發(fā)布時(shí)間:2021-02-03 11:01
聚類分析是一種無(wú)監(jiān)督的學(xué)習(xí)方式,是數(shù)據(jù)挖掘的重要途徑之一,也是統(tǒng)計(jì)機(jī)器學(xué)習(xí)、模式識(shí)別的重要研究方向之一.目前,針對(duì)數(shù)值型數(shù)據(jù)的聚類研究已取得豐碩的成果,而實(shí)際應(yīng)用中,存在大量的分類型或混合型數(shù)據(jù).因此,研究不同類型數(shù)據(jù)下的聚類算法就尤為重要.而聚類過(guò)程中通常又面臨兩大難題:類中心的選擇和聚類個(gè)數(shù)的確定.為了解決這兩個(gè)問(wèn)題,本文分別以分類型和混合型數(shù)據(jù)為例,取得了以下研究成果:(1)針對(duì)分類型數(shù)據(jù),本文主要研究分類型矩陣對(duì)象數(shù)據(jù)(一個(gè)屬性上有多個(gè)取值的數(shù)據(jù)),并基于矩陣對(duì)象數(shù)據(jù)提出一種改進(jìn)的MD fuzzy(?)-modes算法.該算法拓展了簡(jiǎn)單的“0-1”匹配,重新定義了矩陣對(duì)象數(shù)據(jù)的相異性度量,克服了用傳統(tǒng)算法對(duì)該類型數(shù)據(jù)進(jìn)行聚類會(huì)損失信息的不足.在類中心的選擇上,結(jié)合模糊集概念,提出一種啟發(fā)式更新算法,大大減少了時(shí)間復(fù)雜度.最后,在5個(gè)UCI數(shù)據(jù)集上驗(yàn)證了MD fuzzy(?)-modes算法的有效性.(2)針對(duì)混合型數(shù)據(jù),基于信息熵給出了屬性權(quán)重的新度量方法,并提出一種加權(quán)(?)-prototype算法來(lái)確定聚類個(gè)數(shù).該算法在考慮屬性權(quán)重的情況下,重新定義了混合數(shù)據(jù)缺失某類的類間...
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 分類型數(shù)據(jù)聚類研究現(xiàn)狀
1.2.2 混合型數(shù)據(jù)聚類研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的組織結(jié)構(gòu)
第二章 聚類的相關(guān)理論
2.1 聚類的概念
2.2 聚類分析的基本步驟
2.3 常見(jiàn)的數(shù)據(jù)類型
2.4 聚類分析的應(yīng)用領(lǐng)域
2.5 聚類算法的主要類別
2.6 本章小結(jié)
第三章 基于分類型矩陣對(duì)象數(shù)據(jù)的MD fuzzy k-modes聚類算法
3.1 引言
3.2 回顧fuzzy(?)-modes算法
3.3 基于矩陣對(duì)象數(shù)據(jù)的MD fuzzy(?)-modes聚類算法
3.3.1 矩陣對(duì)象間的相異性度量
3.3.2 啟發(fā)式更新算法
3.3.3 MD fuzzy(?)-modes聚類算法
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 評(píng)價(jià)指標(biāo)
3.4.2 啟發(fā)式與全局性更新類中心算法的比較
3.4.3 MD fuzzy(?)-modes算法與其他算法的比較
3.4.4 (?)與(?)的關(guān)系
3.5 本章小結(jié)
第四章 基于混合型數(shù)據(jù)的加權(quán)k-prototype聚類算法
4.1 引言
4.2 (?)-prototype算法的相關(guān)研究
4.3 一種加權(quán)的混合數(shù)據(jù)聚類個(gè)數(shù)確定算法
4.3.1 混合數(shù)據(jù)的屬性權(quán)重
4.3.2 尋找最壞類的廣義性機(jī)制
4.3.3 混合數(shù)據(jù)聚類的有效性指標(biāo)
4.3.4 混合數(shù)據(jù)相異性度量
4.3.5 加權(quán)(?)-prototype聚類算法
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 評(píng)價(jià)指標(biāo)
4.4.2 加權(quán)(?)-prototype算法與Liang(?)-prototype算法的比較
4.5 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
本文編號(hào):3016392
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 分類型數(shù)據(jù)聚類研究現(xiàn)狀
1.2.2 混合型數(shù)據(jù)聚類研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的組織結(jié)構(gòu)
第二章 聚類的相關(guān)理論
2.1 聚類的概念
2.2 聚類分析的基本步驟
2.3 常見(jiàn)的數(shù)據(jù)類型
2.4 聚類分析的應(yīng)用領(lǐng)域
2.5 聚類算法的主要類別
2.6 本章小結(jié)
第三章 基于分類型矩陣對(duì)象數(shù)據(jù)的MD fuzzy k-modes聚類算法
3.1 引言
3.2 回顧fuzzy(?)-modes算法
3.3 基于矩陣對(duì)象數(shù)據(jù)的MD fuzzy(?)-modes聚類算法
3.3.1 矩陣對(duì)象間的相異性度量
3.3.2 啟發(fā)式更新算法
3.3.3 MD fuzzy(?)-modes聚類算法
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 評(píng)價(jià)指標(biāo)
3.4.2 啟發(fā)式與全局性更新類中心算法的比較
3.4.3 MD fuzzy(?)-modes算法與其他算法的比較
3.4.4 (?)與(?)的關(guān)系
3.5 本章小結(jié)
第四章 基于混合型數(shù)據(jù)的加權(quán)k-prototype聚類算法
4.1 引言
4.2 (?)-prototype算法的相關(guān)研究
4.3 一種加權(quán)的混合數(shù)據(jù)聚類個(gè)數(shù)確定算法
4.3.1 混合數(shù)據(jù)的屬性權(quán)重
4.3.2 尋找最壞類的廣義性機(jī)制
4.3.3 混合數(shù)據(jù)聚類的有效性指標(biāo)
4.3.4 混合數(shù)據(jù)相異性度量
4.3.5 加權(quán)(?)-prototype聚類算法
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 評(píng)價(jià)指標(biāo)
4.4.2 加權(quán)(?)-prototype算法與Liang(?)-prototype算法的比較
4.5 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個(gè)人簡(jiǎn)況及聯(lián)系方式
本文編號(hào):3016392
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3016392.html
最近更新
教材專著