天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于自動(dòng)檢測(cè)密度峰值的聚類算法研究

發(fā)布時(shí)間:2021-10-23 11:42
  隨著大數(shù)據(jù)技術(shù)的快速發(fā)展和智能產(chǎn)業(yè)的迅速擴(kuò)張,數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)別的增長(zhǎng),如何從海量的數(shù)據(jù)中提取有價(jià)值的信息,成為各行各界關(guān)心的問(wèn)題。數(shù)據(jù)挖掘作為一種獲取有效信息的技術(shù)手段,近年來(lái)的關(guān)注度持續(xù)飆升,而聚類分析作為數(shù)據(jù)挖掘領(lǐng)域的一種重要分支,發(fā)展也十分迅速,如今已經(jīng)在生命科學(xué),圖像分割、金融風(fēng)險(xiǎn)等諸多領(lǐng)域中廣泛應(yīng)用。快速搜索密度峰值聚類算法(Clustering by fast search and find of density peaks,DPC)是由Alex Rodriguez等人于2014年發(fā)表在《Science》雜志上的一種新型的密度聚類算法,其具有簡(jiǎn)單高效、參數(shù)依賴性低、適應(yīng)非凸數(shù)據(jù)集的特點(diǎn)。盡管密度峰值聚類算法相較之前的算法已經(jīng)有了較大的改進(jìn),但仍存在一些缺陷:(1)沒(méi)有統(tǒng)一密度度量準(zhǔn)則,需要根據(jù)樣本集的狀況選擇對(duì)應(yīng)的密度計(jì)算公式,也沒(méi)有解決密度相等時(shí)的樣本點(diǎn)分配問(wèn)題。(2)截?cái)嗑嚯xdc的選擇較為敏感,較小差異的截?cái)嗑嚯xdc就會(huì)嚴(yán)重影響樣本的密度估計(jì)。(3)使用歐氏距離定義樣本相似性過(guò)于簡(jiǎn)單,在非球面等復(fù)雜的數(shù)據(jù)集上存在局限性。(4)... 

【文章來(lái)源】:長(zhǎng)春工業(yè)大學(xué)吉林省

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于自動(dòng)檢測(cè)密度峰值的聚類算法研究


決策圖

基于自動(dòng)檢測(cè)密度峰值的聚類算法研究


γ決策圖

正態(tài)分布,正態(tài)分布


第3章一種改進(jìn)的自動(dòng)選擇密度峰值的聚類算法16本中的異常點(diǎn)。詳細(xì)的檢驗(yàn)法則如下:首先需要設(shè)定兩個(gè)對(duì)立的假設(shè)條件,分別為原假設(shè)0和對(duì)立面的備擇假設(shè)1。若檢驗(yàn)的方差為,則可以將檢驗(yàn)的過(guò)程轉(zhuǎn)換為檢驗(yàn)均值過(guò)程,因?yàn)榈挠^察值在某種程度上體現(xiàn)了檢驗(yàn)方差的大校若0假設(shè)成立,則|0|的值較校如果|0|的值較大,就可以拒絕0的正確性,進(jìn)而選擇接受1。假若此時(shí)的0成立,則統(tǒng)計(jì)量為|0|/√~(0,1),進(jìn)而可以將|0|的大小等價(jià)為統(tǒng)計(jì)量|0|/√的大小,因此,可以得到一個(gè)正數(shù),假若|0|/√≥時(shí),就拒絕0,若|0|/√<時(shí),就接受0。結(jié)合標(biāo)準(zhǔn)正態(tài)分布分位點(diǎn)的定義和上述假設(shè)可得以下公式:P{|0|/√≥|0為真}=P{|0|/√≥12|0為真}=α(3.5)當(dāng)|0|/√≥12時(shí),就拒絕0。當(dāng)|0|/√<12時(shí),就接受0。所以,|0|/√即為檢驗(yàn)統(tǒng)計(jì)量。正態(tài)分布樣本圖如下所示:圖3.3正態(tài)分布圖圖3.3中的曲線代表樣本的正態(tài)分布狀態(tài),假若樣本符合正態(tài)分布,首先應(yīng)該計(jì)算μ和σ,再計(jì)算出μ±3σ的范圍區(qū)間,最后落在范圍區(qū)間外的點(diǎn)即為異常點(diǎn)。3.2.1Grubb檢測(cè)Grubbs’sTest是一種假設(shè)檢驗(yàn)的方法,通常檢測(cè)符合正態(tài)分布的數(shù)據(jù)集中是否存在唯一的異常值,若存在,此樣本點(diǎn)一定為數(shù)據(jù)集中的最大值或最小值。

【參考文獻(xiàn)】:
期刊論文
[1]快速特征映射優(yōu)化的流形密度峰聚類[J]. 朱慶峰,葛洪偉.  南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2018(04)
[2]基于密度二分法的密度峰值聚類方法[J]. 許朝陽(yáng),林耀海,張萍.  計(jì)算機(jī)工程與應(yīng)用. 2018(12)
[3]基于密度比例的密度峰值聚類算法[J]. 高詩(shī)瑩,周曉鋒,李帥.  計(jì)算機(jī)工程與應(yīng)用. 2017(16)
[4]一種改進(jìn)的搜索密度峰值的聚類算法[J]. 淦文燕,劉沖.  智能系統(tǒng)學(xué)報(bào). 2017(02)
[5]基于趨勢(shì)函數(shù)的空間數(shù)據(jù)聚類方法[J]. 李建勛,申靜靜,李維乾,王婉琳.  計(jì)算機(jī)工程與應(yīng)用. 2017(06)
[6]一種基于簇中心點(diǎn)自動(dòng)選擇策略的密度峰值聚類算法[J]. 馬春來(lái),單洪,馬濤.  計(jì)算機(jī)科學(xué). 2016(07)
[7]Clustering by Fast Search and Find of Density Peaks with Data Field[J]. WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.  Chinese Journal of Electronics. 2016(03)
[8]自動(dòng)確定聚類中心的密度峰聚類[J]. 李濤,葛洪偉,蘇樹智.  計(jì)算機(jī)科學(xué)與探索. 2016(11)
[9]K近鄰優(yōu)化的密度峰值快速搜索聚類算法[J]. 謝娟英,高紅超,謝維信.  中國(guó)科學(xué):信息科學(xué). 2016(02)
[10]快速搜索與發(fā)現(xiàn)密度峰值聚類算法的優(yōu)化研究[J]. 蔣禮青,張明新,鄭金龍,戴嬌,尚趙偉.  計(jì)算機(jī)應(yīng)用研究. 2016(11)

碩士論文
[1]改進(jìn)K-means聚類算法的研究[D]. 李婷婷.安徽大學(xué) 2015



本文編號(hào):3453124

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3453124.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶de277***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com