天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于遷移學習的模糊聚類算法研究

發(fā)布時間:2021-10-11 08:41
  在數(shù)據挖掘領域,聚類算法因其具有簡單、靈活、高效等優(yōu)勢,被廣泛用于各種數(shù)據挖掘任務中。但當聚類數(shù)據不足時,傳統(tǒng)聚類算法很難取得較好的聚類結果。隨著機器學習技術的發(fā)展,遷移學習方法已被成功用于解決數(shù)據不足導致的訓練效果差的問題。該方法通過從訓練效果好的模型提取信息,應用到目標數(shù)據中,以提升目標數(shù)據的訓練效果。借鑒遷移學習的思想,遷移聚類方法被提出用于解決相關數(shù)據聚類的問題。遷移聚類就是將源域數(shù)據的知識加入到目標域數(shù)據的聚類過程中,以獲得目標域數(shù)據的更好分割。圍繞遷移聚類,本文對現(xiàn)有的集中式聚類和分布式協(xié)同聚類方法進行改進,以提升相關算法的聚類效果。主要的創(chuàng)新性工作和成果如下。1.改進集中式聚類方法,提出面向高維數(shù)據的基于遷移學習的屬性熵加權模糊聚類算法(TEWFCM)和面向非線性數(shù)據的基于遷移學習的核模糊聚類算法(TKFCM)。應用遷移學習技術,將源域數(shù)據的類中心及維度權重遷移到目標域數(shù)據中,輔助目標域數(shù)據的聚類。實驗測試結果表明遷移技術可以有效地提升屬性熵加權模糊聚類算法(EWFCM)和核模糊聚類算法(KFCM)的聚類效果。2.改進分布式協(xié)同聚類方法,提出基于遷移學習的分布式協(xié)同模糊c... 

【文章來源】:濟南大學山東省

【文章頁數(shù)】:80 頁

【學位級別】:碩士

【部分圖文】:

基于遷移學習的模糊聚類算法研究


研究內容及方案

網絡拓撲圖,人工數(shù)據,鄰接矩陣,網絡拓撲圖


濟南大學碩士學位論文15據。報文數(shù)據是當前流行的真實高維數(shù)據,用來檢測算法對大規(guī)模數(shù)據的處理能力。一般是根據20種確定的主題,將20000個報文分為20類。再根據[57]方法去掉停止詞、語氣詞和出現(xiàn)頻率多的詞,通過tf·idf標準[58]將剩余的詞語設置為數(shù)據維度。而本文使用的四種報文數(shù)據子集中,每個數(shù)據子集的不同類的主題都是相異的。0001000110001011001001001010011000001111011001001001001000100011000001100100001011011101010011001010(a)(b)圖2.1人工數(shù)據網絡拓撲圖及鄰接矩陣。(a)網絡拓撲圖;(b)鄰接矩陣測試中使用的模糊指數(shù)α均設為2.0,正則項調節(jié)參數(shù)的范圍是0.01~1.01,學習因子的調節(jié)范圍是0.001~100,算法閾值設為10-8。測試語言為c語言,測試機器為使用3.1GH因特爾處理器和32G內存的電腦。2.6.2評價指標本文采用分類精確度(CR)、歸一化互信息(NMI)兩種評價指標來評價聚類算法的效果,并采用程序迭代次數(shù)(IN)來衡量聚類算法的效率。下面是三種評價指標的定義。分類精確度是用來衡量聚類結果好壞的指標[59],其定義為:1KkknCRN(2.28)其中nk表示第k個類中被正確分類的數(shù)據點的數(shù)量,N表示所有數(shù)據點的個數(shù)。歸一化互信息是用來測量兩個分布之間相關性的統(tǒng)計測度[58]。其定義為:11(,)(,)log()()(,)()()IJijPijPijPiPjNMIRQHRHQ(2.29)

數(shù)據分布,數(shù)據分布


濟南大學碩士學位論文21子的范圍設為0~100,算法閾值設為10-8,具體的實驗參數(shù)如表3.1所示。本節(jié)使用的數(shù)據分為兩部分,分別是源域數(shù)據(樣本名:Cluster600,數(shù)量:600,維度:4,類:3)和目標域數(shù)據(樣本名:Cluster60,數(shù)量:60,維度:4,類:3)。具體的數(shù)據分布如圖3.2、圖3.3所示。表3.1測試數(shù)據集及參數(shù)設置實驗設置測試數(shù)據人造數(shù)據模糊系數(shù)=2正則項調節(jié)參數(shù)0.011.01D學習參數(shù)1、20100tT算法閾值810圖3.2源域數(shù)據分布

【參考文獻】:
期刊論文
[1]自動確定聚類個數(shù)的模糊聚類算法[J]. 陳海鵬,申鉉京,龍建武,呂穎達.  電子學報. 2017(03)
[2]k-DmeansWM:一種基于P2P網絡的分布式聚類算法[J]. 李榴,唐九陽,葛斌,肖衛(wèi)東,湯大權.  計算機科學. 2010(01)
[3]一種隸屬關系不確定的可能性模糊聚類方法[J]. 陳健美,陸虎,宋余慶,宋順林,徐景,謝從華,倪巍偉.  計算機研究與發(fā)展. 2008(09)
[4]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇.  軟件學報. 2008(01)
[5]核函數(shù)方法及其模型選擇[J]. 王華忠,俞金壽.  江南大學學報. 2006(04)
[6]特征選擇方法綜述[J]. 王娟,慈林林,姚康澤.  計算機工程與科學. 2005(12)
[7]不確定性人工智能[J]. 李德毅,劉常昱,杜鹢,韓旭.  軟件學報. 2004(11)
[8]基于劃分的模糊聚類算法[J]. 張敏,于劍.  軟件學報. 2004(06)
[9]核聚類算法[J]. 張莉,周偉達,焦李成.  計算機學報. 2002(06)



本文編號:3430177

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3430177.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶552d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com