天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 地質(zhì)論文 >

一種改進的基于密度的半監(jiān)督聚類及其在測井巖性識別中的應(yīng)用

發(fā)布時間:2020-09-24 15:53
   隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)的規(guī)模呈現(xiàn)爆炸式增長。從錯綜復(fù)雜的數(shù)據(jù)中挖掘出有價值的信息具有巨大的實際意義。聚類算法作為機器學習領(lǐng)域中的一類重要方法,被廣泛應(yīng)用于數(shù)據(jù)分析與挖掘中。DBSCAN算法是一種典型的聚類算法,以數(shù)據(jù)密度為度量,可以識別數(shù)據(jù)集中任意形狀的類及噪音點。但是,算法在聚類過程中使用固定的參數(shù)聚類,對于非均勻密度的樣本的聚類效果會大打折扣。本文以DBSCAN算法為研究對象,針對其對聚類參數(shù)敏感、在處理非均勻密度數(shù)據(jù)集時效果不理想等問題進行研究,提出了改進方法V-DBSCAN算法。V-DBSCAN可以更好的適合非均勻密度聚類。該算法的主要思想是先找出高密度的類簇,然后改變參數(shù)值繼續(xù)聚類,發(fā)現(xiàn)較低密度的類簇。不斷改變參數(shù)的值,這樣不同密度的類簇就會被區(qū)分。在不斷的聚類過程中也伴隨著類簇的合并。這時加入半監(jiān)督的學習方法,用已知點的標簽信息或者約束信息實現(xiàn)已生成的類簇的合并,提高合并過程的速度和精度。同時,建立了R樹索引,以提高程序的運行效率。由于地質(zhì)儲層數(shù)據(jù)的復(fù)雜性,傳統(tǒng)的測井巖性識別方法效果并不理想,所以將本文改進的方法運用在巖性識別上,作為改進的算法的實際應(yīng)用檢驗。實驗在測井巖性識別上運用了V-DBSCAN算法,采用了三種不同的距離與K-means,KNN和NBC算法做比較,分析了這四種算法在巖性識別的準確率上的差異,實驗結(jié)果說明了該算法應(yīng)用在測井數(shù)據(jù)的巖性識別的準確性高于其他算法,證明了V-DBSCAN能較好地應(yīng)用于測井巖性識別。
【學位單位】:中國地質(zhì)大學(北京)
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:TP311.13;P631.81
【部分圖文】:

示意圖,聚類過程,密度,示意圖


度對樣本點間相似關(guān)系的傳遞,DBSCAN 保證了樣本的連通性和最大型(孫凌燕,2009)。下圖則很好地說明了 DBSCAN 的計算過程。圖3-1 密度聚類過程示意圖算法的偽代碼如下算法1 DBSCAN輸入:D, Eps, MinPts輸出: cluster,noiseC = 0(1) for each unvisited point P in dataset Dmark P as visited

聚類數(shù)據(jù),密度


于密度的檢測聚類的方法是基于這樣的思想,即簇內(nèi)數(shù)據(jù)點的密度,或者密度變化與其他簇相比通常是大的。同時,也可以利用距離鄰域的形狀和大小。此外,包含噪聲數(shù)據(jù)點的區(qū)域的密度低于任何里的關(guān)鍵思想是簇內(nèi)鄰域半徑中的每個數(shù)據(jù)點附近的數(shù)字數(shù)據(jù)點總據(jù)點(周紅芳, 2012)。顯然,屬于聚類的每個數(shù)據(jù)點附近的密度應(yīng)鄰域半徑的預(yù)定義閾值,否則點被認為是噪聲(吳月嫻等, 2006)。于在進行聚類時,傳統(tǒng)的 DBSCAN 算法使用的是全局密度參數(shù),類的錯誤。如圖 3-2 所示,在同一類的軌跡中,明顯存在密度不同的用固定的全局密度,會把同一類的樣本點錯誤地劃分到不同的類別 2015)。如圖,在密度出現(xiàn)變化的區(qū)間,就可能產(chǎn)生錯誤。如果選擇會使同屬一類但密度較稀疏點,尤其為邊界點不能聚類在一起,出結(jié)果。而如果選擇較小的 Eps,則會把距離較近但不屬于一類的樣于同一類。

樹結(jié)構(gòu)


1) 相同路徑矩形所包含的面積應(yīng)該取最小,盡可能不要被上級矩形和下級形所覆蓋。2) 為了減少運算時間,不同路徑的矩形的面積不要有重疊。3) 矩形的邊長盡可能為最小。由幾何知識可知,正方形可使得滿足包含條的邊長最小(李春葆等, 2007)。為了減小矩形面積,也可以把邊長方差小的矩形 包含在一起。4) 優(yōu)化存儲空間。保持樹的結(jié)構(gòu)在一個較低的高度,可以有效提高查詢效有證據(jù)表明,樹的高度對查詢的速度影響很大。經(jīng)典的 R 樹結(jié)構(gòu)如下所示

【相似文獻】

相關(guān)期刊論文 前10條

1 熊忠陽,孫思,張玉芳,王秀瓊;一種基于劃分的不同參數(shù)值的DBSCAN算法[J];計算機工程與設(shè)計;2005年09期

2 蔡穎琨,謝昆青,馬修軍;屏蔽了輸入?yún)?shù)敏感性的DBSCAN改進算法[J];北京大學學報(自然科學版);2004年03期

3 張楓;邱保志;;基于網(wǎng)格的高效DBSCAN算法[J];計算機工程與應(yīng)用;2007年17期

4 張燦龍;李忠利;陳華彬;;一種改進DBSCAN密度聚類算法[J];數(shù)字技術(shù)與應(yīng)用;2016年11期

5 馮少榮;肖文俊;;一種提高DBSCAN聚類算法質(zhì)量的新方法[J];西安電子科技大學學報;2008年03期

6 趙文;夏桂書;茍智堅;閆振興;;一種改進的DBSCAN算法[J];四川師范大學學報(自然科學版);2013年02期

7 陳敏;高學東;;并行DBSCAN聚類算法[J];中國管理信息化;2010年05期

8 王小龍;;論DBSCAN算法在圖像分割中分類的實現(xiàn)[J];電子技術(shù)與軟件工程;2013年12期

9 陳立潮;聶躍光;李靜;姜燕;;DBSCAN算法在公路選線中的應(yīng)用[J];計算機應(yīng)用;2008年S1期

10 王桂芝;王廣亮;;快速DBSCAN算法的研究與實現(xiàn)[J];福建電腦;2010年06期

相關(guān)會議論文 前10條

1 宮蕊;舒紅平;郭遠遠;;基于DBSCAN的密度聚類算法的研究[A];2008'中國信息技術(shù)與應(yīng)用學術(shù)論壇論文集(二)[C];2008年

2 馬帥;宋國杰;唐世渭;楊冬青;王騰蛟;;基于單元劃分的DBSCAN聚類算法[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年

3 朵春紅;王翠茹;;基于取樣的DBSCAN聚類算法及其遺傳優(yōu)化[A];第一屆中國高校通信類院系學術(shù)研討會論文集[C];2007年

4 張偉;徐遠;;兩步聚類方法[A];全國第十屆企業(yè)信息化與工業(yè)工程學術(shù)年會論文集[C];2006年

5 王李_g;孫斌;;基于改進的DBSCAN聚類算法的云任務(wù)調(diào)度策略研究[A];2016年全國通信軟件學術(shù)會議程序冊與交流文集[C];2016年

6 于健;陳子軍;李霞;李煒;;一種新的多密度聚類算法[A];2007北京地區(qū)高校研究生學術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年

7 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國數(shù)據(jù)庫學術(shù)會議論文集(一)[C];2008年

8 劉彤;孫永香;張振洪;;一種有效的基于密度和層次的聚類算法[A];2007'儀表,自動化及先進集成技術(shù)大會論文集(一)[C];2007年

9 曹晶;周水庚;范曄;周傲英;;數(shù)據(jù)分區(qū):一種改善基于密度的聚類算法的方法[A];第十六屆全國數(shù)據(jù)庫學術(shù)會議論文集[C];1999年

10 任偉;閆桂英;;利用聚類算法來研究基因選擇問題[A];中國運籌學會第八屆學術(shù)交流會論文集[C];2006年

相關(guān)重要報紙文章 前3條

1 張秋;突破聚類市場的信息化盲區(qū)[N];中國計算機報;2007年

2 特約記者 白陽 王剛 顏冬;山東電信開放聚類市場承包經(jīng)營[N];通信信息報;2012年

3 本報記者 張軼群;聚類成為大數(shù)據(jù)認知突破口[N];中國電子報;2015年

相關(guān)博士學位論文 前10條

1 王振佳;基于基因表達數(shù)據(jù)的雙聚類算法研究[D];山東大學;2016年

2 張強;聚類算法的維度分析[D];天津大學;2007年

3 張琳;基于期刊聚類的科學結(jié)構(gòu)研究[D];大連理工大學;2010年

4 任亞洲;高維數(shù)據(jù)上的聚類方法研究[D];華南理工大學;2014年

5 許玉杰;云計算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學;2014年

6 朱紅;粒度聚類方法研究[D];中國礦業(yè)大學;2013年

7 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學;2012年

8 李颯;數(shù)據(jù)流軟聚類理論及其在瓦斯災(zāi)害預(yù)警中的應(yīng)用[D];遼寧工程技術(shù)大學;2014年

9 王佐;基于粗糙集的聚類算法研究[D];吉林大學;2013年

10 蘭遠東;基于圖的半監(jiān)督學習理論、算法及應(yīng)用研究[D];華南理工大學;2012年

相關(guān)碩士學位論文 前10條

1 丁寧;一種改進的基于密度的半監(jiān)督聚類及其在測井巖性識別中的應(yīng)用[D];中國地質(zhì)大學(北京);2018年

2 李靜;結(jié)合蟻群算法與基于劃分的DBSCAN聚類算法的研究[D];東北師范大學;2011年

3 王俊;面向大數(shù)據(jù)的DBSCAN聚類算法研究[D];解放軍信息工程大學;2017年

4 田路強;基于DBSCAN的分布式聚類及增量聚類的研究與應(yīng)用[D];北京工業(yè)大學;2016年

5 張楓;基于網(wǎng)格的DBSCAN算法和聚類邊界技術(shù)的研究[D];鄭州大學;2007年

6 白雪;一種基于網(wǎng)格的密度聚類算法研究及應(yīng)用[D];哈爾濱工程大學;2009年

7 馮振華;基于DBSCAN聚類算法的研究與應(yīng)用[D];江南大學;2016年

8 虞倩倩;基于數(shù)據(jù)劃分的DBSCAN算法研究[D];江南大學;2013年

9 王實美;基于DBSCAN的自適應(yīng)非均勻密度聚類算法研究[D];北京交通大學;2017年

10 吳林敏;針對非均勻數(shù)據(jù)集的DBSCAN過濾式改進算法[D];重慶大學;2009年



本文編號:2825932

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/diqiudizhi/2825932.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7bd4c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com