天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于勢能場模型的層次優(yōu)化聚類算法研究

發(fā)布時間:2020-12-13 22:48
  隨著信息技術(shù)的飛速發(fā)展,信息量呈爆炸式增長從而產(chǎn)生了海量數(shù)據(jù),為了從中提取有價值的信息,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,而聚類分析技術(shù)又是數(shù)據(jù)挖掘領(lǐng)域中的一項重要任務(wù),在各行各業(yè)均有廣泛的應(yīng)用。盡管聚類分析技術(shù)近些年已經(jīng)得到了長足的發(fā)展,如何綜合利用各種聚類思想的長處,提出更加優(yōu)秀的聚類算法依然是一大研究熱點。密度峰搜索聚類算法是2014年在Science雜志上提出的一種融合密度與劃分思想的新型聚類算法,其思路新穎并且具有良好的聚類能力。經(jīng)過深入研究和分析,本文借鑒了該算法的優(yōu)點,并對其存在的不足之處進(jìn)行改進(jìn),提出了一種基于勢能場模型的層次優(yōu)化聚類算法。傳統(tǒng)密度模型對鄰域半徑敏感,在計算過程中僅考慮局部數(shù)據(jù)對象,往往效果一般。改進(jìn)算法在首階段引入了勢能場模型,利用數(shù)據(jù)集的整體分布信息實現(xiàn)對數(shù)據(jù)對象的精確描述,而構(gòu)造基于勢能的邊緣加權(quán)樹可以對原始分配策略進(jìn)行良好的優(yōu)化。此外,在決策值的計算上,算法也充分考慮了數(shù)據(jù)集的分布特征,利用離散程度自動確定參數(shù)的權(quán)重,并在此基礎(chǔ)上結(jié)合正態(tài)分布的思想,以積極的策略將決策值大于置信區(qū)間上限的數(shù)據(jù)點全部選取為潛在聚類中心,進(jìn)而獲得多個初始聚類子簇。密度峰搜索聚類算... 

【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于勢能場模型的層次優(yōu)化聚類算法研究


基于歐式距離的簡單聚類實例

決策圖,數(shù)據(jù)點


據(jù)點 的局部密度定義如下:= (2-1)其中,當(dāng) < 0時,χ = 1,否則χ = 0, 是由用戶指定的截斷距離,顯然 的值等于距數(shù)據(jù)點 的距離小于 的樣本點個數(shù)。從公式中可以看出,盡管 CDP 算法核心關(guān)注點在于聚類中心,然而局部密度值的計算也同樣依賴于傳統(tǒng)的密度模型。數(shù)據(jù)點 到具有更高局部密度數(shù)據(jù)點的最小距離定義為該數(shù)據(jù)點的高密度距離:=:(2-2)對于具有最高密度的數(shù)據(jù)點,高密度距離的計算如下:= max(2-3)

實例圖,實例,勢能場,數(shù)據(jù)點


圖 2-4 邊緣加權(quán)樹的構(gòu)造實例(a)圖展示了二維空間坐標(biāo)系中六個數(shù)據(jù)點的分布情況,每個數(shù)據(jù)點的勢能已經(jīng)計算并標(biāo)注在數(shù)據(jù)點的標(biāo)簽上,數(shù)據(jù)點及其父結(jié)點通過線段連接并標(biāo)注了距離。(b)圖展示了基于(a)圖中數(shù)據(jù)分布所構(gòu)造的邊緣加權(quán)樹,箭頭用于指向和表明該數(shù)據(jù)點的孩子結(jié)點。2.3 基于勢能場模型的密度峰搜索聚類算法通過對 CDP 算法的詳細(xì)分析可以發(fā)現(xiàn),看似優(yōu)雅的 CDP 算法盡管特點鮮明,極具創(chuàng)新性,但是在面對一些特殊情況時,其表現(xiàn)并不能令人滿意,因此如何在保留該算法優(yōu)點的同時,改進(jìn)其不足之處值得深入研究。受到層次聚類思想的啟發(fā),本文提出了一種包含兩個聚類階段的改進(jìn)方法,即基于勢能場模型的層次優(yōu)化聚類算法。首階段在類比 CDP 算法聚類過程的基礎(chǔ)上引入勢能場模型,并構(gòu)造邊緣加權(quán)樹,通過在勢能場中積極選取潛在聚類中

【參考文獻(xiàn)】:
期刊論文
[1]一種基于密度的分布式聚類方法[J]. 王巖,彭濤,韓佳育,劉露.  軟件學(xué)報. 2017(11)
[2]一種改進(jìn)的多視圖聚類集成算法[J]. 鄧強,楊燕,王浩.  計算機科學(xué). 2017(01)
[3]一種基于擴展區(qū)域查詢的密度聚類算法[J]. 楊杰明,吳啟龍,曲朝陽,張慧莉,藺洪文,呂正卓.  計算機應(yīng)用研究. 2017(10)
[4]引入信息熵的CURE聚類算法[J]. 伍恒,李文杰,蔣旻.  計算機應(yīng)用研究. 2017(08)
[5]基于層次與密度的任意形狀聚類算法[J]. 許合利,牛麗君.  計算機工程. 2016(07)
[6]Clustering by Fast Search and Find of Density Peaks with Data Field[J]. WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.  Chinese Journal of Electronics. 2016(03)
[7]自動確定聚類中心的密度峰聚類[J]. 李濤,葛洪偉,蘇樹智.  計算機科學(xué)與探索. 2016(11)
[8]基于動態(tài)近鄰的DBSCAN算法[J]. 李陽,馬驪,樊鎖海.  計算機工程與應(yīng)用. 2016(20)
[9]聚類方法綜述[J]. 金建國.  計算機科學(xué). 2014(S2)
[10]基于密度的改進(jìn)BIRCH聚類算法[J]. 韋相.  計算機工程與應(yīng)用. 2013(10)

碩士論文
[1]基于正態(tài)分布的密度峰聚類算法的研究[D]. 鄭倞.浙江工業(yè)大學(xué) 2016
[2]基于密度的改進(jìn)型層次聚類算法研究[D]. 李彩云.蘭州大學(xué) 2016
[3]基于密度的層次聚類算法研究[D]. 張文開.中國科學(xué)技術(shù)大學(xué) 2015
[4]鐵路貨運大數(shù)據(jù)平臺下基于聚類的客戶細(xì)分應(yīng)用研究[D]. 劉明樺.北京交通大學(xué) 2015
[5]一種新的基于密度的聚類算法研究[D]. 廖禮.蘭州大學(xué) 2013



本文編號:2915312

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2915312.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f8248***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com