基于PageRank和對象關(guān)系的聚類算法研究
本文關(guān)鍵詞:基于PageRank和對象關(guān)系的聚類算法研究
更多相關(guān)文章: 聚類 PageRank 二分查找 數(shù)據(jù)挖掘
【摘要】:對聚類算法的研究已經(jīng)有很長時間的歷史,但是當前許多聚類算法對非凸形簇或者無法有效判別中心點的簇的聚類結(jié)果并不理想。另外,很多算法對噪聲點和離群點比較敏感,這也會導致聚類效果的不理想。為了改善這些問題,我們提出了一個基于PageRank和對象關(guān)系且效果顯著的聚類算法——K-PRSCAN。根據(jù)全局的對象關(guān)系,PageRank算法會評估待聚類的每個對象的重要程度。K-PRSCAN算法通過基于全局角度以及局部角度對數(shù)據(jù)集進行聚類,可以有效的識別球形簇和非球形簇,并可以將數(shù)據(jù)集拆分成指定的k個簇或者接近k個簇。同時由于在K-PRSCAN算法中噪聲點和離群點的重要程度很小,它們的副作用也被較大地削弱。在本文中K-PRSCAN算法和多個常用的聚類算法在聚類效果和時間這兩個維度上進行了比較,結(jié)果表明K-PRSCAN算法的表現(xiàn)要更好。
【關(guān)鍵詞】:聚類 PageRank 二分查找 數(shù)據(jù)挖掘
【學位授予單位】:蘭州大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-14
- 1.1 研究背景與意義7
- 1.2 常見聚類算法概述7-11
- 1.3 PageRank算法概述11-12
- 1.4 論文內(nèi)容與撰寫安排12-14
- 第二章 研究基礎(chǔ)14-20
- 2.1 PageRank算法的基本原理14-17
- 2.2 二分查找算法的基本原理17-19
- 2.3 本章小結(jié)19-20
- 第三章 PRSCAN算法原理與實現(xiàn)20-25
- 3.1 預(yù)處理原始數(shù)據(jù)集20-21
- 3.2 聚類21
- 3.3 PRSCAN算法描述與分析21-24
- 3.4 本章小結(jié)24-25
- 第四章 K-PRSCAN算法原理與實現(xiàn)25-30
- 4.1 PRSCAN相關(guān)定理25-28
- 4.1.1 定理 125-26
- 4.1.2 定理 226-27
- 4.1.3 定理 327-28
- 4.2 K-PRSCAN算法描述與分析28-29
- 4.3 本章小結(jié)29-30
- 第五章 實驗結(jié)果與分析30-45
- 5.1 數(shù)據(jù)集介紹30-31
- 5.2 評價標準31-32
- 5.3 實現(xiàn)細節(jié)32
- 5.4 2 維數(shù)據(jù)集實現(xiàn)結(jié)果與分析32-39
- 5.5 Dataset DIM032實現(xiàn)結(jié)果與分析39-41
- 5.6 Dataset Digit實現(xiàn)結(jié)果與分析41-42
- 5.7 Dataset Race Walking實現(xiàn)結(jié)果與分析42-43
- 5.8 各個聚類算法運行時間的比較43
- 5.9 本章小結(jié)43-45
- 第六章 K-PRSCAN算法參數(shù)和離散點分析45-55
- 6.1 阻尼因子對K-PRSCAN算法的影響45-48
- 6.2 距離函數(shù)、相似性函數(shù)對K-PRSCAN算法的影響48-53
- 6.3 離散點對K-PRSCAN算法的影響53-54
- 6.4 本章小結(jié)54-55
- 第七章 總結(jié)與展望55-57
- 7.1 總結(jié)55-56
- 7.2 展望56-57
- 參考文獻57-59
- 在學期間的研究成果59-60
- 致謝60
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 鐘靈;章云;曾啟杰;羅文良;;能見度與缺失分析的改進PageRank算法[J];微計算機信息;2009年15期
2 LIU Gui-mei;;An adaptive improvement on PageRank algorithm[J];Applied Mathematics:A Journal of Chinese Universities(Series B);2013年01期
3 史銘茗;;加權(quán)PageRank算法研究綜述[J];軟件導刊;2013年02期
4 劉悅;程學旗;李國杰;;提高PageRank算法效率的方法初探[J];計算機科學;2002年06期
5 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計算機應(yīng)用;2005年07期
6 戚華春,黃德才,鄭月鋒;具有時間反饋的PageRank改進算法[J];浙江工業(yè)大學學報;2005年03期
7 黃德才;戚華春;;PageRank算法研究[J];計算機工程;2006年04期
8 楊彬;康慕寧;;基于概念的權(quán)重PageRank改進算法[J];情報雜志;2006年11期
9 張麗;;PageRank算法的改進[J];科學技術(shù)與工程;2007年05期
10 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國控制與決策會議論文集(3)[C];2009年
2 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計算方法[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
3 藺繼國;徐錫山;;一種基于用戶點擊數(shù)據(jù)的個性化PageRank算法[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
4 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
5 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁質(zhì)量的PageRank算法改進[A];第26屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2009年
6 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁排序研究[A];第三屆學生計算語言學研討會論文集[C];2006年
7 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點重要性度量[A];第29屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
9 劉建毅;王菁華;王樅;;基于語言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全國復雜系統(tǒng)研究論壇論文集(一)[C];2005年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 何逍;復雜網(wǎng)絡(luò)的可視化顯示[D];電子科技大學;2015年
2 李金圻;基于Hadoop的微博輿情分析[D];北京郵電大學;2015年
3 孫樂天;基于PageRank和對象關(guān)系的聚類算法研究[D];蘭州大學;2016年
4 蔡建超;基于PageRank算法的搜索引擎優(yōu)化研究[D];江南大學;2008年
5 邵晶晶;基于PageRank排序算法改進的若干研究[D];華中師范大學;2009年
6 王磊;PageRank的算法改進[D];上海交通大學;2009年
7 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學;2005年
8 姜sバ,
本文編號:1068505
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1068505.html