模糊C-means聚類算法的拓展研究
發(fā)布時間:2021-06-15 13:15
聚類分析旨在按照特定準則,將數(shù)據(jù)集中的數(shù)據(jù)點劃分為若干有意義的子集,從而挖掘出數(shù)據(jù)背后的內(nèi)在結(jié)構(gòu)信息。聚類分析屬于無監(jiān)督學習方法,在機器學習、數(shù)據(jù)挖掘和信息處理等領(lǐng)域得到了廣泛的應用和快速的發(fā)展。在諸多聚類算法中,模糊C-Means(Fuzzy C-Means,簡稱FCM)是一種極具競爭力的聚類算法,它以C-Means聚類為基礎,通過引入模糊隸屬度將“硬”聚類推廣為“軟”聚類,從而將聚類問題轉(zhuǎn)化為對數(shù)據(jù)點的模糊劃分問題。盡管FCM受到了大量地關(guān)注和研究,但仍存在問題有待研究。例如,i)在傳統(tǒng)FCM的目標函數(shù)中并沒有顧及到數(shù)據(jù)集中可能存在的類不平衡問題,由此FCM不適合于對非平衡數(shù)據(jù)集進行聚類;ii)FCM屬于無監(jiān)督學習方法,沒有利用可獲得的部分先驗(標記)信息,這不符合當前已興起的半監(jiān)督學習潮流。因此,如何將傳統(tǒng)FCM拓展為更普適的形式是一個值得研究的問題。為了迎合更廣泛的應用場景,本文對傳統(tǒng)FCM在類不平衡情形和半監(jiān)督環(huán)境下的拓展問題進行了研究。主要研究成果如下:1)提出了一種平衡化FCM聚類算法(Balanced FCM,簡稱BFCM算法)。針對FCM在聚類非平衡數(shù)據(jù)集時會產(chǎn)生“均...
【文章來源】:云南師范大學云南省
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【部分圖文】:
BFCM和FCM在四種數(shù)據(jù)集上不同平滑指數(shù)m下的聚類純度
第 3 章 一種平衡的模糊 C-Means 聚類方法越能使隸屬度矩陣逼近正交。但是對于一些數(shù)據(jù)集,隸屬度正交條件可能會導致聚類遠離數(shù)據(jù)的真實分布結(jié)構(gòu),因此 的選擇尚沒有理論指導。為了說明不同 值對聚類純度的影響,我們選擇數(shù)據(jù)集 soybean 和 spiral 進行實驗,圖 3.2 中是所得實驗結(jié)果。
第 4 章 半監(jiān)督平衡化模糊 C-Means 聚類4.4.3 監(jiān)督信息量對聚類效果的影響為了考察不同監(jiān)督規(guī)模對 SBFCM 的影響,在數(shù)據(jù)集 protein, heart, soybean和 sonar 上,圖 4.1 給出了 SBFCM 隨監(jiān)督信息量變化的聚類純度圖。在圖 4.1的各子圖中,橫軸表示給定的類標記數(shù)相對于總樣本數(shù)的比重,縱軸表示獲得的聚類純度。從 4 個子圖可以看出,隨著監(jiān)督標記量的增加,SBFCM 獲得的聚類純度也相應提高。特別地,對 soybean 數(shù)據(jù)集,當監(jiān)督標記量為 60%時,獲得的聚類純度已達 100%。
【參考文獻】:
期刊論文
[1]半監(jiān)督模糊聚類算法的研究與改進[J]. 白福均,高建瓴,宋文慧,賀思云. 通信技術(shù). 2018(05)
[2]一種基于網(wǎng)格與加權(quán)信息熵的OPTICS改進算法[J]. 安建瑞,張龍波,王雷,金超,懷浩,王曉丹. 計算機工程. 2017(02)
[3]廣義均衡模糊C均值聚類算法[J]. 文傳軍,詹永照,柯佳. 系統(tǒng)工程理論與實踐. 2012(12)
[4]AGNES算法在K-means算法中的應用[J]. 周愛武,潘勇,崔丹丹,肖云. 微型機與應用. 2011(23)
[5]基于F檢驗的模糊聚類小額農(nóng)貸信用風險預測[J]. 韋艷玲. 安徽農(nóng)業(yè)科學. 2011(01)
[6]基于特征加權(quán)距離的雙指數(shù)模糊子空間聚類算法[J]. 王駿,王士同,王曉明. 控制與決策. 2010(08)
[7]模糊聚類理論發(fā)展及其應用[J]. 謝維信,高新波,裴繼紅. 中國體視學與圖像分析. 1999(02)
[8]模糊聚類分析的傳遞方法[J]. 吳福保,李奇,宋文忠. 東南大學學報. 1999(02)
博士論文
[1]基于目標函數(shù)的模糊聚類新算法及其應用研究[D]. 汪慶淼.江蘇大學 2014
本文編號:3231123
【文章來源】:云南師范大學云南省
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【部分圖文】:
BFCM和FCM在四種數(shù)據(jù)集上不同平滑指數(shù)m下的聚類純度
第 3 章 一種平衡的模糊 C-Means 聚類方法越能使隸屬度矩陣逼近正交。但是對于一些數(shù)據(jù)集,隸屬度正交條件可能會導致聚類遠離數(shù)據(jù)的真實分布結(jié)構(gòu),因此 的選擇尚沒有理論指導。為了說明不同 值對聚類純度的影響,我們選擇數(shù)據(jù)集 soybean 和 spiral 進行實驗,圖 3.2 中是所得實驗結(jié)果。
第 4 章 半監(jiān)督平衡化模糊 C-Means 聚類4.4.3 監(jiān)督信息量對聚類效果的影響為了考察不同監(jiān)督規(guī)模對 SBFCM 的影響,在數(shù)據(jù)集 protein, heart, soybean和 sonar 上,圖 4.1 給出了 SBFCM 隨監(jiān)督信息量變化的聚類純度圖。在圖 4.1的各子圖中,橫軸表示給定的類標記數(shù)相對于總樣本數(shù)的比重,縱軸表示獲得的聚類純度。從 4 個子圖可以看出,隨著監(jiān)督標記量的增加,SBFCM 獲得的聚類純度也相應提高。特別地,對 soybean 數(shù)據(jù)集,當監(jiān)督標記量為 60%時,獲得的聚類純度已達 100%。
【參考文獻】:
期刊論文
[1]半監(jiān)督模糊聚類算法的研究與改進[J]. 白福均,高建瓴,宋文慧,賀思云. 通信技術(shù). 2018(05)
[2]一種基于網(wǎng)格與加權(quán)信息熵的OPTICS改進算法[J]. 安建瑞,張龍波,王雷,金超,懷浩,王曉丹. 計算機工程. 2017(02)
[3]廣義均衡模糊C均值聚類算法[J]. 文傳軍,詹永照,柯佳. 系統(tǒng)工程理論與實踐. 2012(12)
[4]AGNES算法在K-means算法中的應用[J]. 周愛武,潘勇,崔丹丹,肖云. 微型機與應用. 2011(23)
[5]基于F檢驗的模糊聚類小額農(nóng)貸信用風險預測[J]. 韋艷玲. 安徽農(nóng)業(yè)科學. 2011(01)
[6]基于特征加權(quán)距離的雙指數(shù)模糊子空間聚類算法[J]. 王駿,王士同,王曉明. 控制與決策. 2010(08)
[7]模糊聚類理論發(fā)展及其應用[J]. 謝維信,高新波,裴繼紅. 中國體視學與圖像分析. 1999(02)
[8]模糊聚類分析的傳遞方法[J]. 吳福保,李奇,宋文忠. 東南大學學報. 1999(02)
博士論文
[1]基于目標函數(shù)的模糊聚類新算法及其應用研究[D]. 汪慶淼.江蘇大學 2014
本文編號:3231123
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3231123.html
最近更新
教材專著