天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于遷移學(xué)習(xí)的模糊聚類算法研究

發(fā)布時間:2021-10-11 08:41
  在數(shù)據(jù)挖掘領(lǐng)域,聚類算法因其具有簡單、靈活、高效等優(yōu)勢,被廣泛用于各種數(shù)據(jù)挖掘任務(wù)中。但當聚類數(shù)據(jù)不足時,傳統(tǒng)聚類算法很難取得較好的聚類結(jié)果。隨著機器學(xué)習(xí)技術(shù)的發(fā)展,遷移學(xué)習(xí)方法已被成功用于解決數(shù)據(jù)不足導(dǎo)致的訓(xùn)練效果差的問題。該方法通過從訓(xùn)練效果好的模型提取信息,應(yīng)用到目標數(shù)據(jù)中,以提升目標數(shù)據(jù)的訓(xùn)練效果。借鑒遷移學(xué)習(xí)的思想,遷移聚類方法被提出用于解決相關(guān)數(shù)據(jù)聚類的問題。遷移聚類就是將源域數(shù)據(jù)的知識加入到目標域數(shù)據(jù)的聚類過程中,以獲得目標域數(shù)據(jù)的更好分割。圍繞遷移聚類,本文對現(xiàn)有的集中式聚類和分布式協(xié)同聚類方法進行改進,以提升相關(guān)算法的聚類效果。主要的創(chuàng)新性工作和成果如下。1.改進集中式聚類方法,提出面向高維數(shù)據(jù)的基于遷移學(xué)習(xí)的屬性熵加權(quán)模糊聚類算法(TEWFCM)和面向非線性數(shù)據(jù)的基于遷移學(xué)習(xí)的核模糊聚類算法(TKFCM)。應(yīng)用遷移學(xué)習(xí)技術(shù),將源域數(shù)據(jù)的類中心及維度權(quán)重遷移到目標域數(shù)據(jù)中,輔助目標域數(shù)據(jù)的聚類。實驗測試結(jié)果表明遷移技術(shù)可以有效地提升屬性熵加權(quán)模糊聚類算法(EWFCM)和核模糊聚類算法(KFCM)的聚類效果。2.改進分布式協(xié)同聚類方法,提出基于遷移學(xué)習(xí)的分布式協(xié)同模糊c... 

【文章來源】:濟南大學(xué)山東省

【文章頁數(shù)】:80 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于遷移學(xué)習(xí)的模糊聚類算法研究


研究內(nèi)容及方案

網(wǎng)絡(luò)拓撲圖,人工數(shù)據(jù),鄰接矩陣,網(wǎng)絡(luò)拓撲圖


濟南大學(xué)碩士學(xué)位論文15據(jù)。報文數(shù)據(jù)是當前流行的真實高維數(shù)據(jù),用來檢測算法對大規(guī)模數(shù)據(jù)的處理能力。一般是根據(jù)20種確定的主題,將20000個報文分為20類。再根據(jù)[57]方法去掉停止詞、語氣詞和出現(xiàn)頻率多的詞,通過tf·idf標準[58]將剩余的詞語設(shè)置為數(shù)據(jù)維度。而本文使用的四種報文數(shù)據(jù)子集中,每個數(shù)據(jù)子集的不同類的主題都是相異的。0001000110001011001001001010011000001111011001001001001000100011000001100100001011011101010011001010(a)(b)圖2.1人工數(shù)據(jù)網(wǎng)絡(luò)拓撲圖及鄰接矩陣。(a)網(wǎng)絡(luò)拓撲圖;(b)鄰接矩陣測試中使用的模糊指數(shù)α均設(shè)為2.0,正則項調(diào)節(jié)參數(shù)的范圍是0.01~1.01,學(xué)習(xí)因子的調(diào)節(jié)范圍是0.001~100,算法閾值設(shè)為10-8。測試語言為c語言,測試機器為使用3.1GH因特爾處理器和32G內(nèi)存的電腦。2.6.2評價指標本文采用分類精確度(CR)、歸一化互信息(NMI)兩種評價指標來評價聚類算法的效果,并采用程序迭代次數(shù)(IN)來衡量聚類算法的效率。下面是三種評價指標的定義。分類精確度是用來衡量聚類結(jié)果好壞的指標[59],其定義為:1KkknCRN(2.28)其中nk表示第k個類中被正確分類的數(shù)據(jù)點的數(shù)量,N表示所有數(shù)據(jù)點的個數(shù)。歸一化互信息是用來測量兩個分布之間相關(guān)性的統(tǒng)計測度[58]。其定義為:11(,)(,)log()()(,)()()IJijPijPijPiPjNMIRQHRHQ(2.29)

數(shù)據(jù)分布,數(shù)據(jù)分布


濟南大學(xué)碩士學(xué)位論文21子的范圍設(shè)為0~100,算法閾值設(shè)為10-8,具體的實驗參數(shù)如表3.1所示。本節(jié)使用的數(shù)據(jù)分為兩部分,分別是源域數(shù)據(jù)(樣本名:Cluster600,數(shù)量:600,維度:4,類:3)和目標域數(shù)據(jù)(樣本名:Cluster60,數(shù)量:60,維度:4,類:3)。具體的數(shù)據(jù)分布如圖3.2、圖3.3所示。表3.1測試數(shù)據(jù)集及參數(shù)設(shè)置實驗設(shè)置測試數(shù)據(jù)人造數(shù)據(jù)模糊系數(shù)=2正則項調(diào)節(jié)參數(shù)0.011.01D學(xué)習(xí)參數(shù)1、20100tT算法閾值810圖3.2源域數(shù)據(jù)分布

【參考文獻】:
期刊論文
[1]自動確定聚類個數(shù)的模糊聚類算法[J]. 陳海鵬,申鉉京,龍建武,呂穎達.  電子學(xué)報. 2017(03)
[2]k-DmeansWM:一種基于P2P網(wǎng)絡(luò)的分布式聚類算法[J]. 李榴,唐九陽,葛斌,肖衛(wèi)東,湯大權(quán).  計算機科學(xué). 2010(01)
[3]一種隸屬關(guān)系不確定的可能性模糊聚類方法[J]. 陳健美,陸虎,宋余慶,宋順林,徐景,謝從華,倪巍偉.  計算機研究與發(fā)展. 2008(09)
[4]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇.  軟件學(xué)報. 2008(01)
[5]核函數(shù)方法及其模型選擇[J]. 王華忠,俞金壽.  江南大學(xué)學(xué)報. 2006(04)
[6]特征選擇方法綜述[J]. 王娟,慈林林,姚康澤.  計算機工程與科學(xué). 2005(12)
[7]不確定性人工智能[J]. 李德毅,劉常昱,杜鹢,韓旭.  軟件學(xué)報. 2004(11)
[8]基于劃分的模糊聚類算法[J]. 張敏,于劍.  軟件學(xué)報. 2004(06)
[9]核聚類算法[J]. 張莉,周偉達,焦李成.  計算機學(xué)報. 2002(06)



本文編號:3430177

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3430177.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶552d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com