一種改進的基于密度的半監(jiān)督聚類及其在測井巖性識別中的應(yīng)用
【學位單位】:中國地質(zhì)大學(北京)
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP311.13;P631.81
【部分圖文】:
度對樣本點間相似關(guān)系的傳遞,DBSCAN 保證了樣本的連通性和最大型(孫凌燕,2009)。下圖則很好地說明了 DBSCAN 的計算過程。圖3-1 密度聚類過程示意圖算法的偽代碼如下算法1 DBSCAN輸入:D, Eps, MinPts輸出: cluster,noiseC = 0(1) for each unvisited point P in dataset Dmark P as visited
于密度的檢測聚類的方法是基于這樣的思想,即簇內(nèi)數(shù)據(jù)點的密度,或者密度變化與其他簇相比通常是大的。同時,也可以利用距離鄰域的形狀和大小。此外,包含噪聲數(shù)據(jù)點的區(qū)域的密度低于任何里的關(guān)鍵思想是簇內(nèi)鄰域半徑中的每個數(shù)據(jù)點附近的數(shù)字數(shù)據(jù)點總據(jù)點(周紅芳, 2012)。顯然,屬于聚類的每個數(shù)據(jù)點附近的密度應(yīng)鄰域半徑的預(yù)定義閾值,否則點被認為是噪聲(吳月嫻等, 2006)。于在進行聚類時,傳統(tǒng)的 DBSCAN 算法使用的是全局密度參數(shù),類的錯誤。如圖 3-2 所示,在同一類的軌跡中,明顯存在密度不同的用固定的全局密度,會把同一類的樣本點錯誤地劃分到不同的類別 2015)。如圖,在密度出現(xiàn)變化的區(qū)間,就可能產(chǎn)生錯誤。如果選擇會使同屬一類但密度較稀疏點,尤其為邊界點不能聚類在一起,出結(jié)果。而如果選擇較小的 Eps,則會把距離較近但不屬于一類的樣于同一類。
1) 相同路徑矩形所包含的面積應(yīng)該取最小,盡可能不要被上級矩形和下級形所覆蓋。2) 為了減少運算時間,不同路徑的矩形的面積不要有重疊。3) 矩形的邊長盡可能為最小。由幾何知識可知,正方形可使得滿足包含條的邊長最小(李春葆等, 2007)。為了減小矩形面積,也可以把邊長方差小的矩形 包含在一起。4) 優(yōu)化存儲空間。保持樹的結(jié)構(gòu)在一個較低的高度,可以有效提高查詢效有證據(jù)表明,樹的高度對查詢的速度影響很大。經(jīng)典的 R 樹結(jié)構(gòu)如下所示
【相似文獻】
相關(guān)期刊論文 前10條
1 熊忠陽,孫思,張玉芳,王秀瓊;一種基于劃分的不同參數(shù)值的DBSCAN算法[J];計算機工程與設(shè)計;2005年09期
2 蔡穎琨,謝昆青,馬修軍;屏蔽了輸入?yún)?shù)敏感性的DBSCAN改進算法[J];北京大學學報(自然科學版);2004年03期
3 張楓;邱保志;;基于網(wǎng)格的高效DBSCAN算法[J];計算機工程與應(yīng)用;2007年17期
4 張燦龍;李忠利;陳華彬;;一種改進DBSCAN密度聚類算法[J];數(shù)字技術(shù)與應(yīng)用;2016年11期
5 馮少榮;肖文俊;;一種提高DBSCAN聚類算法質(zhì)量的新方法[J];西安電子科技大學學報;2008年03期
6 趙文;夏桂書;茍智堅;閆振興;;一種改進的DBSCAN算法[J];四川師范大學學報(自然科學版);2013年02期
7 陳敏;高學東;;并行DBSCAN聚類算法[J];中國管理信息化;2010年05期
8 王小龍;;論DBSCAN算法在圖像分割中分類的實現(xiàn)[J];電子技術(shù)與軟件工程;2013年12期
9 陳立潮;聶躍光;李靜;姜燕;;DBSCAN算法在公路選線中的應(yīng)用[J];計算機應(yīng)用;2008年S1期
10 王桂芝;王廣亮;;快速DBSCAN算法的研究與實現(xiàn)[J];福建電腦;2010年06期
相關(guān)會議論文 前10條
1 宮蕊;舒紅平;郭遠遠;;基于DBSCAN的密度聚類算法的研究[A];2008'中國信息技術(shù)與應(yīng)用學術(shù)論壇論文集(二)[C];2008年
2 馬帥;宋國杰;唐世渭;楊冬青;王騰蛟;;基于單元劃分的DBSCAN聚類算法[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年
3 朵春紅;王翠茹;;基于取樣的DBSCAN聚類算法及其遺傳優(yōu)化[A];第一屆中國高校通信類院系學術(shù)研討會論文集[C];2007年
4 張偉;徐遠;;兩步聚類方法[A];全國第十屆企業(yè)信息化與工業(yè)工程學術(shù)年會論文集[C];2006年
5 王李_g;孫斌;;基于改進的DBSCAN聚類算法的云任務(wù)調(diào)度策略研究[A];2016年全國通信軟件學術(shù)會議程序冊與交流文集[C];2016年
6 于健;陳子軍;李霞;李煒;;一種新的多密度聚類算法[A];2007北京地區(qū)高校研究生學術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
7 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國數(shù)據(jù)庫學術(shù)會議論文集(一)[C];2008年
8 劉彤;孫永香;張振洪;;一種有效的基于密度和層次的聚類算法[A];2007'儀表,自動化及先進集成技術(shù)大會論文集(一)[C];2007年
9 曹晶;周水庚;范曄;周傲英;;數(shù)據(jù)分區(qū):一種改善基于密度的聚類算法的方法[A];第十六屆全國數(shù)據(jù)庫學術(shù)會議論文集[C];1999年
10 任偉;閆桂英;;利用聚類算法來研究基因選擇問題[A];中國運籌學會第八屆學術(shù)交流會論文集[C];2006年
相關(guān)重要報紙文章 前3條
1 張秋;突破聚類市場的信息化盲區(qū)[N];中國計算機報;2007年
2 特約記者 白陽 王剛 顏冬;山東電信開放聚類市場承包經(jīng)營[N];通信信息報;2012年
3 本報記者 張軼群;聚類成為大數(shù)據(jù)認知突破口[N];中國電子報;2015年
相關(guān)博士學位論文 前10條
1 王振佳;基于基因表達數(shù)據(jù)的雙聚類算法研究[D];山東大學;2016年
2 張強;聚類算法的維度分析[D];天津大學;2007年
3 張琳;基于期刊聚類的科學結(jié)構(gòu)研究[D];大連理工大學;2010年
4 任亞洲;高維數(shù)據(jù)上的聚類方法研究[D];華南理工大學;2014年
5 許玉杰;云計算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學;2014年
6 朱紅;粒度聚類方法研究[D];中國礦業(yè)大學;2013年
7 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學;2012年
8 李颯;數(shù)據(jù)流軟聚類理論及其在瓦斯災(zāi)害預(yù)警中的應(yīng)用[D];遼寧工程技術(shù)大學;2014年
9 王佐;基于粗糙集的聚類算法研究[D];吉林大學;2013年
10 蘭遠東;基于圖的半監(jiān)督學習理論、算法及應(yīng)用研究[D];華南理工大學;2012年
相關(guān)碩士學位論文 前10條
1 丁寧;一種改進的基于密度的半監(jiān)督聚類及其在測井巖性識別中的應(yīng)用[D];中國地質(zhì)大學(北京);2018年
2 李靜;結(jié)合蟻群算法與基于劃分的DBSCAN聚類算法的研究[D];東北師范大學;2011年
3 王俊;面向大數(shù)據(jù)的DBSCAN聚類算法研究[D];解放軍信息工程大學;2017年
4 田路強;基于DBSCAN的分布式聚類及增量聚類的研究與應(yīng)用[D];北京工業(yè)大學;2016年
5 張楓;基于網(wǎng)格的DBSCAN算法和聚類邊界技術(shù)的研究[D];鄭州大學;2007年
6 白雪;一種基于網(wǎng)格的密度聚類算法研究及應(yīng)用[D];哈爾濱工程大學;2009年
7 馮振華;基于DBSCAN聚類算法的研究與應(yīng)用[D];江南大學;2016年
8 虞倩倩;基于數(shù)據(jù)劃分的DBSCAN算法研究[D];江南大學;2013年
9 王實美;基于DBSCAN的自適應(yīng)非均勻密度聚類算法研究[D];北京交通大學;2017年
10 吳林敏;針對非均勻數(shù)據(jù)集的DBSCAN過濾式改進算法[D];重慶大學;2009年
本文編號:2825932
本文鏈接:http://sikaile.net/kejilunwen/diqiudizhi/2825932.html