基于最近鄰思想的Chameleon聚類算法研究
發(fā)布時(shí)間:2021-09-03 09:09
近年來,隨著科學(xué)技術(shù)的進(jìn)步,數(shù)據(jù)收集與數(shù)據(jù)存儲(chǔ)的能力也得到了進(jìn)一步的發(fā)展,從而使人們可以獲取海量數(shù)據(jù),如何從海量的數(shù)據(jù)中尋找有用的信息已經(jīng)成為一個(gè)迫切需要解決的問題,數(shù)據(jù)挖掘技術(shù)的產(chǎn)生為人們解決這一問題提供了方法。數(shù)據(jù)挖掘技術(shù)將各種數(shù)據(jù)分析方法與處理海量數(shù)據(jù)的算法結(jié)合,為探究新的數(shù)據(jù)類型和使用新方法處理舊數(shù)據(jù)類型提供了新的解決思路。數(shù)據(jù)挖掘技術(shù)的任務(wù)可以分為四種,其中聚類分析方法是數(shù)據(jù)挖掘技術(shù)中應(yīng)用最為廣泛的一個(gè)分支,在應(yīng)用統(tǒng)計(jì)學(xué)、信息檢索、生物研究以及商業(yè)等方面都有應(yīng)用。Chamelcon聚類算法是一種凝聚的層次聚類算法,它使用有效的圖分區(qū)算法將數(shù)據(jù)的初始分區(qū)與一種層次聚類方案相結(jié)合,利用一種新穎的相似性度量函數(shù)將圖的子類組合在一起以獲得最終的聚類結(jié)果。Chameleon算法可以適用于不同形狀、密度和大小的數(shù)據(jù)集,但它仍存在一定的局限:Chameleon聚類算法在多個(gè)關(guān)鍵階段需要確定參數(shù),聚類結(jié)果對(duì)參數(shù)較敏感;算法中使用距離度量相似性對(duì)于高維數(shù)據(jù)而言不太適用,導(dǎo)致最終聚類結(jié)果較差。本文主要對(duì)Chameleon聚類算法進(jìn)行了相關(guān)研究,具體研究?jī)?nèi)容和研究結(jié)果如下:1.提出了基于自然鄰居的...
【文章來源】:西安理工大學(xué)陜西省
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
聚類分析算法的分類Fig.2-1Classificationofclusteranalysisalgorithma.分層聚類
預(yù)備知識(shí)9的兩個(gè)元素,因此單鏈接也稱為最小距離法。在此聚類過程中,兩個(gè)簇之間的距離由這兩個(gè)簇各自的數(shù)據(jù)對(duì)象決定,如果數(shù)據(jù)對(duì)象具有相似性,則兩個(gè)簇之間的相似性等于從一個(gè)簇中的任何成員到另一個(gè)簇中的任何成員的最大相似性,即最短距離。單鏈接技術(shù)適合處理非橢圓形狀的簇,缺點(diǎn)在于對(duì)異常點(diǎn)敏感。單鏈接技術(shù)中,兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(min),(CbCb(2-2)圖2-2單鏈接示意圖Fig.2-2Singlelinkschematic(2)完全鏈接技術(shù)[38]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的最長(zhǎng)距離確定。使用圖的術(shù)語,若我們將所有點(diǎn)作為單點(diǎn)簇開始,每次在點(diǎn)之間加上一條鏈,最短的鏈先加,則一組點(diǎn)直到其中所有的點(diǎn)都完全被鏈接,即形成團(tuán),從而形成一個(gè)簇。完全鏈接對(duì)噪聲和離群點(diǎn)不太敏感,但是可能會(huì)使大的簇破裂,并且偏好球形數(shù)據(jù)集。完全鏈接兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(max),(CbCb(2-3)圖2-3全鏈接示意圖Fig.2-3Fulllinkschematic(3)平均鏈接技術(shù)[39]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的平均距離確定。這是一種介于單鏈和全鏈之間的折中方法。平均鏈接兩組簇iC和jC之間的鄰近度定義如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分別代表簇iC和jC的所含數(shù)據(jù)點(diǎn)的個(gè)數(shù)。
預(yù)備知識(shí)9的兩個(gè)元素,因此單鏈接也稱為最小距離法。在此聚類過程中,兩個(gè)簇之間的距離由這兩個(gè)簇各自的數(shù)據(jù)對(duì)象決定,如果數(shù)據(jù)對(duì)象具有相似性,則兩個(gè)簇之間的相似性等于從一個(gè)簇中的任何成員到另一個(gè)簇中的任何成員的最大相似性,即最短距離。單鏈接技術(shù)適合處理非橢圓形狀的簇,缺點(diǎn)在于對(duì)異常點(diǎn)敏感。單鏈接技術(shù)中,兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(min),(CbCb(2-2)圖2-2單鏈接示意圖Fig.2-2Singlelinkschematic(2)完全鏈接技術(shù)[38]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的最長(zhǎng)距離確定。使用圖的術(shù)語,若我們將所有點(diǎn)作為單點(diǎn)簇開始,每次在點(diǎn)之間加上一條鏈,最短的鏈先加,則一組點(diǎn)直到其中所有的點(diǎn)都完全被鏈接,即形成團(tuán),從而形成一個(gè)簇。完全鏈接對(duì)噪聲和離群點(diǎn)不太敏感,但是可能會(huì)使大的簇破裂,并且偏好球形數(shù)據(jù)集。完全鏈接兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(max),(CbCb(2-3)圖2-3全鏈接示意圖Fig.2-3Fulllinkschematic(3)平均鏈接技術(shù)[39]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的平均距離確定。這是一種介于單鏈和全鏈之間的折中方法。平均鏈接兩組簇iC和jC之間的鄰近度定義如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分別代表簇iC和jC的所含數(shù)據(jù)點(diǎn)的個(gè)數(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于共享自然近鄰的自適應(yīng)譜聚類算法[J]. 史佳昕,朱慶生. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2019(11)
[2]一種基于共享近鄰的密度峰值聚類算法[J]. 劉奕志,程汝峰,梁永全. 計(jì)算機(jī)科學(xué). 2018(02)
[3]基于DPC算法與模塊密度的改進(jìn)Chameleon算法[J]. 宮峰勛,邢晨,馬艷秋. 中國(guó)民航大學(xué)學(xué)報(bào). 2017(06)
[4]基于MCL與Chameleon的混合聚類算法[J]. 楊連群,劉樹發(fā),溫晉英,劉功申. 電子設(shè)計(jì)工程. 2017(06)
[5]一種改進(jìn)CHAMELEON算法的聚類算法COCK[J]. 朱燁行,李艷玲,楊獻(xiàn)文. 微電子學(xué)與計(jì)算機(jī). 2015(12)
[6]引入共享近鄰加權(quán)圖的Chameleon算法[J]. 薛文娟,劉培玉,劉棟. 計(jì)算機(jī)應(yīng)用. 2012(10)
[7]一種改進(jìn)的Chameleon聚類算法[J]. 曹長(zhǎng)虎,李亞非. 科學(xué)技術(shù)與工程. 2010(33)
[8]一種基于動(dòng)態(tài)近鄰選擇模型的Chameleon算法[J]. 趙學(xué)鋒,楊海斌,王秀花. 西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(06)
[9]密度敏感的多智能體進(jìn)化聚類算法[J]. 潘曉英,劉芳,焦李成. 軟件學(xué)報(bào). 2010(10)
[10]Chameleon算法的改進(jìn)[J]. 蔣盛益,龐觀松,張黎莎. 小型微型計(jì)算機(jī)系統(tǒng). 2010(08)
碩士論文
[1]結(jié)合AP算法的Chameleon聚類算法研究[D]. 吳雲(yún)玲.東北師范大學(xué) 2014
本文編號(hào):3380833
【文章來源】:西安理工大學(xué)陜西省
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
聚類分析算法的分類Fig.2-1Classificationofclusteranalysisalgorithma.分層聚類
預(yù)備知識(shí)9的兩個(gè)元素,因此單鏈接也稱為最小距離法。在此聚類過程中,兩個(gè)簇之間的距離由這兩個(gè)簇各自的數(shù)據(jù)對(duì)象決定,如果數(shù)據(jù)對(duì)象具有相似性,則兩個(gè)簇之間的相似性等于從一個(gè)簇中的任何成員到另一個(gè)簇中的任何成員的最大相似性,即最短距離。單鏈接技術(shù)適合處理非橢圓形狀的簇,缺點(diǎn)在于對(duì)異常點(diǎn)敏感。單鏈接技術(shù)中,兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(min),(CbCb(2-2)圖2-2單鏈接示意圖Fig.2-2Singlelinkschematic(2)完全鏈接技術(shù)[38]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的最長(zhǎng)距離確定。使用圖的術(shù)語,若我們將所有點(diǎn)作為單點(diǎn)簇開始,每次在點(diǎn)之間加上一條鏈,最短的鏈先加,則一組點(diǎn)直到其中所有的點(diǎn)都完全被鏈接,即形成團(tuán),從而形成一個(gè)簇。完全鏈接對(duì)噪聲和離群點(diǎn)不太敏感,但是可能會(huì)使大的簇破裂,并且偏好球形數(shù)據(jù)集。完全鏈接兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(max),(CbCb(2-3)圖2-3全鏈接示意圖Fig.2-3Fulllinkschematic(3)平均鏈接技術(shù)[39]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的平均距離確定。這是一種介于單鏈和全鏈之間的折中方法。平均鏈接兩組簇iC和jC之間的鄰近度定義如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分別代表簇iC和jC的所含數(shù)據(jù)點(diǎn)的個(gè)數(shù)。
預(yù)備知識(shí)9的兩個(gè)元素,因此單鏈接也稱為最小距離法。在此聚類過程中,兩個(gè)簇之間的距離由這兩個(gè)簇各自的數(shù)據(jù)對(duì)象決定,如果數(shù)據(jù)對(duì)象具有相似性,則兩個(gè)簇之間的相似性等于從一個(gè)簇中的任何成員到另一個(gè)簇中的任何成員的最大相似性,即最短距離。單鏈接技術(shù)適合處理非橢圓形狀的簇,缺點(diǎn)在于對(duì)異常點(diǎn)敏感。單鏈接技術(shù)中,兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(min),(CbCb(2-2)圖2-2單鏈接示意圖Fig.2-2Singlelinkschematic(2)完全鏈接技術(shù)[38]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的最長(zhǎng)距離確定。使用圖的術(shù)語,若我們將所有點(diǎn)作為單點(diǎn)簇開始,每次在點(diǎn)之間加上一條鏈,最短的鏈先加,則一組點(diǎn)直到其中所有的點(diǎn)都完全被鏈接,即形成團(tuán),從而形成一個(gè)簇。完全鏈接對(duì)噪聲和離群點(diǎn)不太敏感,但是可能會(huì)使大的簇破裂,并且偏好球形數(shù)據(jù)集。完全鏈接兩組簇iC和jC之間的鄰近度定義如下:jijiCadCpa,:),(max),(CbCb(2-3)圖2-3全鏈接示意圖Fig.2-3Fulllinkschematic(3)平均鏈接技術(shù)[39]兩個(gè)簇之間的距離由一個(gè)簇的任何成員到另一簇的任何成員的平均距離確定。這是一種介于單鏈和全鏈之間的折中方法。平均鏈接兩組簇iC和jC之間的鄰近度定義如下:ijjiCaCbjibadmmCCp),(1),((2-4)其中,im和jm分別代表簇iC和jC的所含數(shù)據(jù)點(diǎn)的個(gè)數(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于共享自然近鄰的自適應(yīng)譜聚類算法[J]. 史佳昕,朱慶生. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2019(11)
[2]一種基于共享近鄰的密度峰值聚類算法[J]. 劉奕志,程汝峰,梁永全. 計(jì)算機(jī)科學(xué). 2018(02)
[3]基于DPC算法與模塊密度的改進(jìn)Chameleon算法[J]. 宮峰勛,邢晨,馬艷秋. 中國(guó)民航大學(xué)學(xué)報(bào). 2017(06)
[4]基于MCL與Chameleon的混合聚類算法[J]. 楊連群,劉樹發(fā),溫晉英,劉功申. 電子設(shè)計(jì)工程. 2017(06)
[5]一種改進(jìn)CHAMELEON算法的聚類算法COCK[J]. 朱燁行,李艷玲,楊獻(xiàn)文. 微電子學(xué)與計(jì)算機(jī). 2015(12)
[6]引入共享近鄰加權(quán)圖的Chameleon算法[J]. 薛文娟,劉培玉,劉棟. 計(jì)算機(jī)應(yīng)用. 2012(10)
[7]一種改進(jìn)的Chameleon聚類算法[J]. 曹長(zhǎng)虎,李亞非. 科學(xué)技術(shù)與工程. 2010(33)
[8]一種基于動(dòng)態(tài)近鄰選擇模型的Chameleon算法[J]. 趙學(xué)鋒,楊海斌,王秀花. 西北師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(06)
[9]密度敏感的多智能體進(jìn)化聚類算法[J]. 潘曉英,劉芳,焦李成. 軟件學(xué)報(bào). 2010(10)
[10]Chameleon算法的改進(jìn)[J]. 蔣盛益,龐觀松,張黎莎. 小型微型計(jì)算機(jī)系統(tǒng). 2010(08)
碩士論文
[1]結(jié)合AP算法的Chameleon聚類算法研究[D]. 吳雲(yún)玲.東北師范大學(xué) 2014
本文編號(hào):3380833
本文鏈接:http://sikaile.net/wenyilunwen/sixiangpinglunlunwen/3380833.html
最近更新
教材專著