基于模糊密度峰值聚類的復雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)研究
發(fā)布時間:2021-11-27 06:23
復雜網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)研究對發(fā)現(xiàn)復雜網(wǎng)絡(luò)中隱藏的規(guī)律和預測復雜網(wǎng)絡(luò)的行為具有重要的意義,是近十幾年的研究熱點之一。許多聚類分析算法也被應(yīng)用于社區(qū)發(fā)現(xiàn)中。密度峰值聚類算法(Clustering by Fast Search and Find of Density Peak,DPC)是一種簡潔的基于密度的聚類算法。本文在DPC算法的基礎(chǔ)上,提出一種截斷距離參數(shù)和類簇中心自動選擇策略,并結(jié)合模糊聚類思想探測復雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)。本文的主要工作如下:1、基于數(shù)據(jù)場與信息熵理論改進DPC算法。針對DPC算法需要人為地選擇聚類中心,且不同閾值的選擇對聚類結(jié)果影響大等缺點,提出了基于數(shù)據(jù)場與信息熵改進的算法(FDPC)。算法通過引入數(shù)據(jù)場理論指導閾值的自適應(yīng)選取,并依據(jù)數(shù)據(jù)集的最大信息熵降低分割方法自動確定聚類中心,同時還進一步優(yōu)化了離群點的檢測條件。2、引入模糊聚類思想,結(jié)合FDPC算法發(fā)現(xiàn)復雜網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)。首先,提出了一種新的節(jié)點距離度量方式,然后應(yīng)用FDPC算法確定核心社區(qū),再使用模糊聚類思想確定各點的隸屬度,完成剩余節(jié)點的分配...
【文章來源】:武漢科技大學湖北省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)研究現(xiàn)狀
1.2.2 聚類分析研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的結(jié)構(gòu)安排
第2章 聚類分析與復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
2.1 聚類分析
2.1.1 聚類的相似性度量
2.1.2 聚類算法介紹
2.1.3 聚類算法評價指標
2.2 復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
2.2.1 復雜網(wǎng)絡(luò)概念
2.2.2 社區(qū)發(fā)現(xiàn)算法
2.2.3 社區(qū)發(fā)現(xiàn)評價指標
2.3 本章小結(jié)
第3章 基于數(shù)據(jù)場與信息熵改進的密度峰值聚類算法
3.1 密度峰值聚類算法
3.2 密度峰值聚類算法的優(yōu)化
3.2.1 基于數(shù)據(jù)場理論確定閾值
3.2.2 基于信息熵理論選擇類簇中心
3.2.3 離群點檢測
3.2.4 改進的密度峰值聚類算法步驟
3.3 對比實驗分析
3.3.1 實驗數(shù)據(jù)集
3.3.2 人工數(shù)據(jù)集實驗對比
3.3.3 真實數(shù)據(jù)集實驗對比
3.4 本章小結(jié)
第4章 基于模糊密度峰值聚類的復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
4.1 算法思想
4.1.1 計算距離矩陣
4.1.2 選擇社區(qū)的核心節(jié)點
4.1.3 計算隸屬度矩陣
4.1.4 區(qū)分重疊節(jié)點
4.1.5 CDFDPC算法步驟
4.2 對比實驗分析
4.2.1 實驗網(wǎng)絡(luò)
4.2.2 人工網(wǎng)絡(luò)實驗對比
4.2.3 真實網(wǎng)絡(luò)實驗對比
4.3 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
附錄1 攻讀碩士學位期間發(fā)表的論文
詳細摘要
【參考文獻】:
期刊論文
[1]模糊譜聚類重疊社區(qū)發(fā)現(xiàn)算法[J]. 閆曉鵬,孫永波. 自動化儀表. 2016(03)
[2]一種改進的基于局部密度的聚類算法[J]. 關(guān)曉惠,錢亞冠,孫欣欣. 電信科學. 2016(01)
[3]數(shù)據(jù)科學與社會網(wǎng)絡(luò):大數(shù)據(jù),小世界[J]. 汪小帆. 科學與社會. 2014(01)
[4]基于網(wǎng)格和信息熵的多密度聚類算法[J]. 周悅來,譚建豪. 計算機系統(tǒng)應(yīng)用. 2011(10)
[5]一維Renyi熵閾值法中參數(shù)的自適應(yīng)選取[J]. 雷博,范九倫. 光子學報. 2009(09)
[6]聚類有效性評價綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計算機應(yīng)用研究. 2008(06)
[7]信息熵在數(shù)據(jù)集分割中的應(yīng)用研究[J]. 苗卿,單立新,裘昱. 電腦知識與技術(shù)(學術(shù)交流). 2007(05)
[8]文本聚類算法的比較[J]. 李偉,黃穎. 科技情報開發(fā)與經(jīng)濟. 2006(22)
[9]基于減法聚類與聚類有效性評判的FCM聚類[J]. 張栒,鄧輝文. 重慶工學院學報. 2006(05)
[10]一種基于數(shù)據(jù)場的層次聚類方法[J]. 淦文燕,李德毅,王建民. 電子學報. 2006(02)
博士論文
[1]聚類分析中若干關(guān)鍵技術(shù)的研究[D]. 楊小兵.浙江大學 2005
碩士論文
[1]基于密度的層次聚類算法研究[D]. 張文開.中國科學技術(shù)大學 2015
[2]基于密度峰值的重疊社區(qū)發(fā)現(xiàn)算法研究[D]. 馮國香.吉林大學 2015
[3]基于論文引用關(guān)系的學術(shù)社團發(fā)現(xiàn)方法及其研究[D]. 馮凱.華南理工大學 2016
[4]微博網(wǎng)絡(luò)輿情熱點生長分析模型研究[D]. 邱晨子.大連海事大學 2013
本文編號:3521722
【文章來源】:武漢科技大學湖北省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)研究現(xiàn)狀
1.2.2 聚類分析研究現(xiàn)狀
1.3 本文的主要工作
1.4 本文的結(jié)構(gòu)安排
第2章 聚類分析與復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
2.1 聚類分析
2.1.1 聚類的相似性度量
2.1.2 聚類算法介紹
2.1.3 聚類算法評價指標
2.2 復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
2.2.1 復雜網(wǎng)絡(luò)概念
2.2.2 社區(qū)發(fā)現(xiàn)算法
2.2.3 社區(qū)發(fā)現(xiàn)評價指標
2.3 本章小結(jié)
第3章 基于數(shù)據(jù)場與信息熵改進的密度峰值聚類算法
3.1 密度峰值聚類算法
3.2 密度峰值聚類算法的優(yōu)化
3.2.1 基于數(shù)據(jù)場理論確定閾值
3.2.2 基于信息熵理論選擇類簇中心
3.2.3 離群點檢測
3.2.4 改進的密度峰值聚類算法步驟
3.3 對比實驗分析
3.3.1 實驗數(shù)據(jù)集
3.3.2 人工數(shù)據(jù)集實驗對比
3.3.3 真實數(shù)據(jù)集實驗對比
3.4 本章小結(jié)
第4章 基于模糊密度峰值聚類的復雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)
4.1 算法思想
4.1.1 計算距離矩陣
4.1.2 選擇社區(qū)的核心節(jié)點
4.1.3 計算隸屬度矩陣
4.1.4 區(qū)分重疊節(jié)點
4.1.5 CDFDPC算法步驟
4.2 對比實驗分析
4.2.1 實驗網(wǎng)絡(luò)
4.2.2 人工網(wǎng)絡(luò)實驗對比
4.2.3 真實網(wǎng)絡(luò)實驗對比
4.3 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻
致謝
附錄1 攻讀碩士學位期間發(fā)表的論文
詳細摘要
【參考文獻】:
期刊論文
[1]模糊譜聚類重疊社區(qū)發(fā)現(xiàn)算法[J]. 閆曉鵬,孫永波. 自動化儀表. 2016(03)
[2]一種改進的基于局部密度的聚類算法[J]. 關(guān)曉惠,錢亞冠,孫欣欣. 電信科學. 2016(01)
[3]數(shù)據(jù)科學與社會網(wǎng)絡(luò):大數(shù)據(jù),小世界[J]. 汪小帆. 科學與社會. 2014(01)
[4]基于網(wǎng)格和信息熵的多密度聚類算法[J]. 周悅來,譚建豪. 計算機系統(tǒng)應(yīng)用. 2011(10)
[5]一維Renyi熵閾值法中參數(shù)的自適應(yīng)選取[J]. 雷博,范九倫. 光子學報. 2009(09)
[6]聚類有效性評價綜述[J]. 楊燕,靳蕃,KAMEL Mohamed. 計算機應(yīng)用研究. 2008(06)
[7]信息熵在數(shù)據(jù)集分割中的應(yīng)用研究[J]. 苗卿,單立新,裘昱. 電腦知識與技術(shù)(學術(shù)交流). 2007(05)
[8]文本聚類算法的比較[J]. 李偉,黃穎. 科技情報開發(fā)與經(jīng)濟. 2006(22)
[9]基于減法聚類與聚類有效性評判的FCM聚類[J]. 張栒,鄧輝文. 重慶工學院學報. 2006(05)
[10]一種基于數(shù)據(jù)場的層次聚類方法[J]. 淦文燕,李德毅,王建民. 電子學報. 2006(02)
博士論文
[1]聚類分析中若干關(guān)鍵技術(shù)的研究[D]. 楊小兵.浙江大學 2005
碩士論文
[1]基于密度的層次聚類算法研究[D]. 張文開.中國科學技術(shù)大學 2015
[2]基于密度峰值的重疊社區(qū)發(fā)現(xiàn)算法研究[D]. 馮國香.吉林大學 2015
[3]基于論文引用關(guān)系的學術(shù)社團發(fā)現(xiàn)方法及其研究[D]. 馮凱.華南理工大學 2016
[4]微博網(wǎng)絡(luò)輿情熱點生長分析模型研究[D]. 邱晨子.大連海事大學 2013
本文編號:3521722
本文鏈接:http://sikaile.net/kejilunwen/yysx/3521722.html
最近更新
教材專著