基于PageRank和對(duì)象關(guān)系的聚類算法研究
本文關(guān)鍵詞:基于PageRank和對(duì)象關(guān)系的聚類算法研究
更多相關(guān)文章: 聚類 PageRank 二分查找 數(shù)據(jù)挖掘
【摘要】:對(duì)聚類算法的研究已經(jīng)有很長(zhǎng)時(shí)間的歷史,但是當(dāng)前許多聚類算法對(duì)非凸形簇或者無(wú)法有效判別中心點(diǎn)的簇的聚類結(jié)果并不理想。另外,很多算法對(duì)噪聲點(diǎn)和離群點(diǎn)比較敏感,這也會(huì)導(dǎo)致聚類效果的不理想。為了改善這些問(wèn)題,我們提出了一個(gè)基于PageRank和對(duì)象關(guān)系且效果顯著的聚類算法——K-PRSCAN。根據(jù)全局的對(duì)象關(guān)系,PageRank算法會(huì)評(píng)估待聚類的每個(gè)對(duì)象的重要程度。K-PRSCAN算法通過(guò)基于全局角度以及局部角度對(duì)數(shù)據(jù)集進(jìn)行聚類,可以有效的識(shí)別球形簇和非球形簇,并可以將數(shù)據(jù)集拆分成指定的k個(gè)簇或者接近k個(gè)簇。同時(shí)由于在K-PRSCAN算法中噪聲點(diǎn)和離群點(diǎn)的重要程度很小,它們的副作用也被較大地削弱。在本文中K-PRSCAN算法和多個(gè)常用的聚類算法在聚類效果和時(shí)間這兩個(gè)維度上進(jìn)行了比較,結(jié)果表明K-PRSCAN算法的表現(xiàn)要更好。
【關(guān)鍵詞】:聚類 PageRank 二分查找 數(shù)據(jù)挖掘
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-14
- 1.1 研究背景與意義7
- 1.2 常見(jiàn)聚類算法概述7-11
- 1.3 PageRank算法概述11-12
- 1.4 論文內(nèi)容與撰寫(xiě)安排12-14
- 第二章 研究基礎(chǔ)14-20
- 2.1 PageRank算法的基本原理14-17
- 2.2 二分查找算法的基本原理17-19
- 2.3 本章小結(jié)19-20
- 第三章 PRSCAN算法原理與實(shí)現(xiàn)20-25
- 3.1 預(yù)處理原始數(shù)據(jù)集20-21
- 3.2 聚類21
- 3.3 PRSCAN算法描述與分析21-24
- 3.4 本章小結(jié)24-25
- 第四章 K-PRSCAN算法原理與實(shí)現(xiàn)25-30
- 4.1 PRSCAN相關(guān)定理25-28
- 4.1.1 定理 125-26
- 4.1.2 定理 226-27
- 4.1.3 定理 327-28
- 4.2 K-PRSCAN算法描述與分析28-29
- 4.3 本章小結(jié)29-30
- 第五章 實(shí)驗(yàn)結(jié)果與分析30-45
- 5.1 數(shù)據(jù)集介紹30-31
- 5.2 評(píng)價(jià)標(biāo)準(zhǔn)31-32
- 5.3 實(shí)現(xiàn)細(xì)節(jié)32
- 5.4 2 維數(shù)據(jù)集實(shí)現(xiàn)結(jié)果與分析32-39
- 5.5 Dataset DIM032實(shí)現(xiàn)結(jié)果與分析39-41
- 5.6 Dataset Digit實(shí)現(xiàn)結(jié)果與分析41-42
- 5.7 Dataset Race Walking實(shí)現(xiàn)結(jié)果與分析42-43
- 5.8 各個(gè)聚類算法運(yùn)行時(shí)間的比較43
- 5.9 本章小結(jié)43-45
- 第六章 K-PRSCAN算法參數(shù)和離散點(diǎn)分析45-55
- 6.1 阻尼因子對(duì)K-PRSCAN算法的影響45-48
- 6.2 距離函數(shù)、相似性函數(shù)對(duì)K-PRSCAN算法的影響48-53
- 6.3 離散點(diǎn)對(duì)K-PRSCAN算法的影響53-54
- 6.4 本章小結(jié)54-55
- 第七章 總結(jié)與展望55-57
- 7.1 總結(jié)55-56
- 7.2 展望56-57
- 參考文獻(xiàn)57-59
- 在學(xué)期間的研究成果59-60
- 致謝60
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 鐘靈;章云;曾啟杰;羅文良;;能見(jiàn)度與缺失分析的改進(jìn)PageRank算法[J];微計(jì)算機(jī)信息;2009年15期
2 LIU Gui-mei;;An adaptive improvement on PageRank algorithm[J];Applied Mathematics:A Journal of Chinese Universities(Series B);2013年01期
3 史銘茗;;加權(quán)PageRank算法研究綜述[J];軟件導(dǎo)刊;2013年02期
4 劉悅;程學(xué)旗;李國(guó)杰;;提高PageRank算法效率的方法初探[J];計(jì)算機(jī)科學(xué);2002年06期
5 張巍,李志蜀;基于PageRank算法的搜索引擎優(yōu)化策略[J];計(jì)算機(jī)應(yīng)用;2005年07期
6 戚華春,黃德才,鄭月鋒;具有時(shí)間反饋的PageRank改進(jìn)算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2005年03期
7 黃德才;戚華春;;PageRank算法研究[J];計(jì)算機(jī)工程;2006年04期
8 楊彬;康慕寧;;基于概念的權(quán)重PageRank改進(jìn)算法[J];情報(bào)雜志;2006年11期
9 張麗;;PageRank算法的改進(jìn)[J];科學(xué)技術(shù)與工程;2007年05期
10 孔娟;馬亨冰;;PageRank算法的原理與解析[J];福建電腦;2007年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中國(guó)控制與決策會(huì)議論文集(3)[C];2009年
2 劉松彬;都云程;施水才;;基于分解轉(zhuǎn)移矩陣的PageRank迭代計(jì)算方法[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 藺繼國(guó);徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個(gè)性化PageRank算法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
4 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁(yè)質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁(yè)排序研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
7 李洋濤;李川;許超;雷曉;徐洪宇;唐常杰;楊寧;;空間評(píng)分:基于PageRank的信息網(wǎng)絡(luò)可視化中節(jié)點(diǎn)重要性度量[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
9 劉建毅;王菁華;王樅;;基于語(yǔ)言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全國(guó)復(fù)雜系統(tǒng)研究論壇論文集(一)[C];2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 何逍;復(fù)雜網(wǎng)絡(luò)的可視化顯示[D];電子科技大學(xué);2015年
2 李金圻;基于Hadoop的微博輿情分析[D];北京郵電大學(xué);2015年
3 孫樂(lè)天;基于PageRank和對(duì)象關(guān)系的聚類算法研究[D];蘭州大學(xué);2016年
4 蔡建超;基于PageRank算法的搜索引擎優(yōu)化研究[D];江南大學(xué);2008年
5 邵晶晶;基于PageRank排序算法改進(jìn)的若干研究[D];華中師范大學(xué);2009年
6 王磊;PageRank的算法改進(jìn)[D];上海交通大學(xué);2009年
7 張巍;基于PageRank算法的搜索引擎優(yōu)化策略研究[D];四川大學(xué);2005年
8 姜sバ,
本文編號(hào):1068505
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1068505.html