天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 數學論文 >

ISODATA模型及其Gap統(tǒng)計應用研究

發(fā)布時間:2021-12-11 09:47
  Gap Statistics是在K-means基礎上建立的,考慮到K-means算法容易受初始聚類中心以及簇的數目的影響,并且通過Gap Statistics方法估計聚類數能夠得到數據集的粗略分類,不能進一步對數據集進行細分類。針對這一不足,本文將ISODATA算法引入到Gap Statistics中。首先,由于ISODATA算法需要估計初始聚類數目這一參數,本文驗證了多維切比雪夫不等式與馬氏距離之間的關系,并基于它們之間的關系提出了聚類初始數目的估計方法。而后提出了改進的ISODATA算法,即MISODATA算法,繼而提出了MIGS模型。實證分析了MIGS模型的可行性與有效性,MIGS模型不僅可以實現數據集的細分類,而且通過MIGS模型估計數據集的最佳聚類數的準確率高于原GS模型。其次,改進后的MIGS模型雖說有很多優(yōu)點,但是MISODATA算法中仍需要人工設定控制分裂和合并的參數,對于不同的數據集,這兩個參數值的選取也不同,取值屬于零至正無窮范圍內,故兩個參數值難以確定。針對這一不足,對MISODATA算法進行改進,引入了合并度和分裂度的概念,提出了基于變異系數的分裂度估計模型和基... 

【文章來源】:南京理工大學江蘇省 211工程院校

【文章頁數】:47 頁

【學位級別】:碩士

【部分圖文】:

ISODATA模型及其Gap統(tǒng)計應用研究


圖3.1:?Iris數據集的Gap和MIGap關于聚類數的變化曲線.??

曲線,聚類數,數據集,曲線


圖3.2:?Glass數據集的Gap和MIGap關于聚類數的變化曲線.??對Glass數據集而言,ISODATA算法選取的參數值為:知=5也=2.5辦=??0.2,L?=?2,了?=?100。由圖3.2可知,通過MIGS方法得至IJ的最佳聚類數的估計值為7,??而GS方法得到的最佳聚類數的估計數為2,這是因為IS0DATA算法中引入的自動地??分裂和合并的機制,對于類別較多的數據集來說,可以通過MIGS方法實現對數據集??的細分類。??(3)?Haberman數據集??Haberman數據集有306個樣本,其中每個樣本有3個屬性。數據集被分為2類,??包括進行手術后存活5年或者更久的226個樣本,以及患者在5年內死亡的80個樣本。??'?7\ ̄'?I—-tSs'piS?nl?,J?'?'?^??卜?\?卜靜1?/\/?1??\?,6[?/??18?■?/?\?■?'1?卜、/??a1.6.?/?\?.?,?/??備?\?I13-?/??\?-?、/??V^\?.?'?■??Nl?1?./?.??1?-?、:?J??〇8??1?1?1?1?1?1??68?1?1?1???1?1???.1?2345678?1?-?J?4?5?6?7?c?9??*4unl?r?of?Cius;ers??Nunber?of?Clusters??圖3.3:?Haberman數據集的Gap和MIGap關于聚類數的變化曲線.??對Haberman數據集而言

曲線,聚類數,數據集,曲線


?545678??Number?of?Clusters??圖3.2:?Glass數據集的Gap和MIGap關于聚類數的變化曲線.??對Glass數據集而言,ISODATA算法選取的參數值為:知=5也=2.5辦=??0.2,L?=?2,了?=?100。由圖3.2可知,通過MIGS方法得至IJ的最佳聚類數的估計值為7,??而GS方法得到的最佳聚類數的估計數為2,這是因為IS0DATA算法中引入的自動地??分裂和合并的機制,對于類別較多的數據集來說,可以通過MIGS方法實現對數據集??的細分類。??(3)?Haberman數據集??Haberman數據集有306個樣本,其中每個樣本有3個屬性。數據集被分為2類,??包括進行手術后存活5年或者更久的226個樣本,以及患者在5年內死亡的80個樣本。??'?7\ ̄'?I—-tSs'piS?nl?,J?'?'?^??卜?\?卜靜1?/\/?1??\?

【參考文獻】:
期刊論文
[1]改進的自適應模糊ISODATA灰度圖像分割算法[J]. 康永輝,戴激光,王廣哲.  計算機工程與應用. 2016(17)
[2]基于ISODATA聚類的詞匯樹圖像檢索算法[J]. 張婷,戴芳,郭文艷.  計算機科學. 2014(S2)
[3]一種基于同步動力學模型的層次聚類方法[J]. 黃健斌,康劍梅,齊俊杰,孫鶴立.  中國科學:信息科學. 2013(05)
[4]基于改進的ISODATA算法的大樣本數據聚類方法研究[J]. 張麗娜,姜新華,那日蘇.  內蒙古農業(yè)大學學報(自然科學版). 2013(01)
[5]K-means和ISODATA聚類算法的比較研究[J]. 陳平生.  江西理工大學學報. 2012(01)
[6]基于直覺模糊的ISODATA算法[J]. 李前進,王寅龍,李志祥,王希武,林克成.  計算機工程與應用. 2012(09)
[7]Application of Two-Order Difference to Gap Statistic[J]. 岳士弘,王秀秀,魏苗苗.  Transactions of Tianjin University. 2008(03)
[8]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇.  軟件學報. 2008(01)
[9]變異系數——一個衡量離散程度簡單而有用的統(tǒng)計指標[J]. 王文森.  中國統(tǒng)計. 2007(06)
[10]圖像邊緣檢測的多尺度灰度Gap統(tǒng)計模型[J]. 黃陳蓉,張正軍,吳慧中.  中國圖象圖形學報. 2005(08)

碩士論文
[1]改進的近鄰傳播聚類算法及其應用研究[D]. 唐丹.南京理工大學 2017
[2]基于加權MP馬氏距離的GS方法研究[D]. 王振麗.南京理工大學 2016
[3]基于GS方法的圖像分割估計數的多信息動態(tài)研究[D]. 劉倩.南京理工大學 2013
[4]K-Means聚類算法的研究與改進[D]. 崔丹丹.安徽大學 2012
[5]基于MFGS方法圖像最佳分割數的研究[D]. 童波.南京理工大學 2011
[6]基于GS方法的圖像最佳分割的研究[D]. 李娜.南京理工大學 2006



本文編號:3534457

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/3534457.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶28243***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com