天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于鄰域信息的聚類和社區(qū)發(fā)現算法研究

發(fā)布時間:2017-12-10 21:15

  本文關鍵詞:基于鄰域信息的聚類和社區(qū)發(fā)現算法研究


  更多相關文章: 聚類 社區(qū)發(fā)現 鄰域信息 模糊關系


【摘要】:隨著數據挖掘技術在各行各業(yè)的廣泛應用,人們對這一領域的相關技術越來越關注。數據聚類和社區(qū)發(fā)現是數據挖掘領域中十分重要的兩個課題,它們之間也有一些共性。聚類是指將數據對象分為若干個簇,使得簇內的對象關系緊密,而簇之間的對象關系疏遠。社區(qū)發(fā)現可以認為是聚類思想在網絡數據中的延伸,它是指將網絡中的節(jié)點指派給若干個社區(qū),使得同一個社區(qū)內的節(jié)點聯(lián)系緊密,而來自不同社區(qū)的節(jié)點間聯(lián)系比較疏遠。目前已有大量的關于聚類算法和社區(qū)發(fā)現算法的研究工作。本文針對已有的經典聚類算法FDP中存在的不足,探索了鄰域信息在聚類中的作用,然后提出了一種新的聚類算法NIDD。接著,將NIDD的思想推廣到社交網絡中,在引入基于鄰域信息的模糊中心度和模糊隸屬度的基礎上,提出了一個新的社區(qū)發(fā)現算法FCFM。最后,將聚類算法FDP的核心思想推廣到社區(qū)發(fā)現中,研究了基于鄰域信息的模糊關系及其作用,提出了基于模糊關系的社區(qū)發(fā)現算法CDFR。具體來說,本文工作主要包括以下3個方面。(1)提出了基于鄰域交集和密度差異的聚類算法NIDD。在分析聚類算法FDP的過程中,發(fā)現它在某些數據集上的效果并不理想。針對FDP的一些不足,提出了聚類算法NIDD。該算法的思想是:第一,在簇的擴展過程中會選擇一個內部點作為參考點,然后考察參考點鄰域內的所有點;如果參考點和待擴展點的密度變化較小,那么它們屬于同一個簇,并且該待擴展點還可以繼續(xù)擴展;反之,如果參考點和待擴展點的密度變化相對較大,那么該待擴展點被歸為當前簇,但是該數據點不可以繼續(xù)擴展。第二,如果參考點和待擴展點之間的k最近鄰交集率很小,說明它們之間的公共鄰居占據的比例很小,此時不管它們密度是否相似,它們會被劃分在不同的簇中。實驗結果表明了 NIDD算法的有效性。(2)提出了基于模糊中心度和模糊隸屬度的非重疊社區(qū)發(fā)現算法FCFM。FCFM是一種無參數的社區(qū)發(fā)現算法,其主要思想是:第一,基于鄰域信息的模糊中心度來組織網絡中節(jié)點的處理順序;第二,在一個社區(qū)中擁有最大的模糊中心度的節(jié)點被認為是這個社區(qū)的中心,社區(qū)從這個節(jié)點開始向外擴展;第三,在社區(qū)擴展的過程中,模糊隸屬度被用來決定是否繼續(xù)擴展當前社區(qū)。對比了FCFM和經典的社區(qū)發(fā)現算法在真實的網絡數據集上的實驗結果,實驗結果驗證了 FCFM算法的有效性。(3)提出了基于模糊關系的社區(qū)發(fā)現算法CDFR。首先,提出NGC(Nearest Greater Centrality)節(jié)點的概念。然后,引入了基于鄰域信息的模糊關系的概念,并且給出了計算每個節(jié)點到其NGC節(jié)點的模糊關系的方法。這種模糊關系可以看做是節(jié)點對其NGC節(jié)點的依賴程度。依賴程度越小說明該節(jié)點的自治性越大,換句話說,該節(jié)點成為社區(qū)中心節(jié)點的可能性越大。最后,每個節(jié)點屬于哪個社區(qū)取決于其NGC節(jié)點以及它們之間的模糊關系。實驗結果表明,CDFR算法對于非重疊社區(qū)檢測是有效的。本文工作不僅在聚類方法研究方面具有參考價值,而且對于社交網絡中的社區(qū)發(fā)現研究也具有參考價值。
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13

【參考文獻】

中國期刊全文數據庫 前2條

1 WANG Shuliang;WANG Dakui;LI Caoyuan;LI Yan;DING Gangyi;;Clustering by Fast Search and Find of Density Peaks with Data Field[J];Chinese Journal of Electronics;2016年03期

2 武志昊;林友芳;Steve Gregory;萬懷宇School of Computer and Information Technology,Beijing Jiaotong University;田盛豐;;Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks[J];Journal of Computer Science & Technology;2012年03期

,

本文編號:1275911

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1275911.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶6101d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com