天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于近鄰相似圖的譜聚類算法研究與應(yīng)用

發(fā)布時間:2022-01-16 06:27
  譜聚類算法是基于譜圖劃分理論的一種聚類算法,由于其對非凸數(shù)據(jù)集具有優(yōu)越的性能而廣受歡迎。因為譜聚類算法中的相似圖構(gòu)造的好壞往往會直接關(guān)系到數(shù)據(jù)集內(nèi)數(shù)據(jù)點之間的相似度是否符合真實情況,從而進一步影響到譜聚類算法的聚類性能,所以本文針對這一問題進行了研究。本文內(nèi)容緊緊圍繞譜聚類算法中的相似圖構(gòu)造,提出了兩種基于不同相似圖的譜聚類算法,其中一種為半監(jiān)督算法。最后本文還將這兩種算法進行了融合,得到一種新的算法,并將其應(yīng)用到了實際的文本聚類當(dāng)中。以下是本文的主要研究工作及成果:首先,提出了基于密度自適應(yīng)鄰域相似圖的半監(jiān)督譜聚類算法(DAN-SSC)。該算法先是將半監(jiān)督信息的一種——成對約束先驗信息擴散到整個聚類空間,然后再合理地利用這些信息來指導(dǎo)DAN算法當(dāng)中的相似度矩陣的構(gòu)造過程,接著才繼續(xù)完成規(guī)范化譜聚類的流程。最后還需檢驗之前的聚類結(jié)果是否滿足先驗信息的約束條件,若不滿足則需對其進行調(diào)整,調(diào)整之后才能得到最終的聚類結(jié)果。通過對比實驗及分析,證明了DAN-SSC算法充分利用了有標(biāo)簽數(shù)據(jù)且避免了少量有標(biāo)簽數(shù)據(jù)可能會對聚類過程進行錯誤指導(dǎo)的情況,該算法在實驗數(shù)據(jù)集上獲得了比傳統(tǒng)無監(jiān)督譜聚類算法和... 

【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校

【文章頁數(shù)】:69 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于近鄰相似圖的譜聚類算法研究與應(yīng)用


典型的數(shù)據(jù)挖掘系統(tǒng)

狀態(tài)圖,凝聚法,數(shù)據(jù)點,數(shù)學(xué)模型


圖 1-2 凝聚法和分裂法基于模型的聚類方法(Model-based Clustering Methods),顧名思義,先要為每個簇假設(shè)一個數(shù)學(xué)模型,接著再去發(fā)現(xiàn)符合模型的數(shù)據(jù)點,最后也是最關(guān)鍵的一步是將給定的數(shù)據(jù)與某個模型達成最佳的擬合狀態(tài)。模型聚類的代表性算法是高斯混合聚類[25],該算法選取高斯混合分布作為模型,先初始化模型參數(shù),然后利用 EM 算法對模型參數(shù)進行迭代更新直到滿足停止條件,在迭代過程的同時就已經(jīng)完成聚類;趫D論的譜聚類方法是本文的研究重點,譜聚類算法的本質(zhì)是利用譜松弛方法將聚類問題轉(zhuǎn)化為圖的劃分問題。該算法雖然于近二十年才被提出,但是由于其對非凸數(shù)據(jù)集有著優(yōu)越的性能而廣受歡迎。模糊聚類方法和以上六種聚類方法都不同,后者全部屬于絕對化聚類,也稱之為硬聚類,即每個數(shù)據(jù)點僅僅屬于一個簇,不存在某個數(shù)據(jù)點同時屬于多個簇的情況,簇和簇之間是不存在交集關(guān)系的。而模糊聚類則打破了這個限定,樣本不再是剛性地屬于某一個簇了,而是給出其屬于各個簇的概率,這種聚類方法被稱為軟聚類。模糊聚類的代表性算法是 FCM[26],它是由 Bezdke JC 于 1973 年提出的。FCM 是目前最流行且應(yīng)用最廣泛的模糊聚類算法,相比于 k-means 算法,它能夠部分避免陷入局部最優(yōu),而局部最

頂點,集合論,核半徑,邊權(quán)


222exp2i jijx xsσ = 斯核半徑,又稱尺度參數(shù),往往需要根據(jù)經(jīng)驗手動設(shè)理論圖的一個重要分支,它通常使用集合論的方法來研究圖。般用頂點的集合 V 和邊的集合 E 來描述,即無向的集合 V 不光代表著所有的頂點,一般也對應(yīng)表示著}n,頂點和數(shù)據(jù)點之間是一一對應(yīng)的關(guān)系。另外,對于接,也可以沒有邊連接,其中邊是無方向的。意兩點iv 和jv ,一般把它們之間的邊權(quán)值定義為ijw 。i。通常情況下 0ijw > ,如果 0ijw = 則說明點iv 與jv 之間 0。一個無向加權(quán)圖的例子如下圖 2-1 所示:

【參考文獻】:
期刊論文
[1]基于互信息改進算法的新詞發(fā)現(xiàn)對中文分詞系統(tǒng)改進[J]. 杜麗萍,李曉戈,于根,劉春麗,劉睿.  北京大學(xué)學(xué)報(自然科學(xué)版). 2016(01)
[2]半監(jiān)督學(xué)習(xí)方法[J]. 劉建偉,劉媛,羅雄麟.  計算機學(xué)報. 2015(08)
[3]基于數(shù)據(jù)場的改進DBSCAN聚類算法[J]. 楊靜,高嘉偉,梁吉業(yè),劉楊磊.  計算機科學(xué)與探索. 2012(10)
[4]一種基于流形距離核的譜聚類算法[J]. 陶新民,宋少宇,曹盼東,付丹丹.  信息與控制. 2012(03)
[5]基于改進CURE聚類算法的無監(jiān)督異常檢測方法[J]. 周亞建,徐晨,李繼國.  通信學(xué)報. 2010(07)
[6]一種有效的用于數(shù)據(jù)挖掘的動態(tài)概念聚類算法[J]. 郭建生,趙奕,施鵬飛.  軟件學(xué)報. 2001(04)
[7]基于數(shù)據(jù)倉庫的決策支持系統(tǒng)框架[J]. 謝榕.  系統(tǒng)工程理論與實踐. 2000(04)



本文編號:3592116

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3592116.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f0352***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com