逐段均勻條件下的參考分布研究
發(fā)布時間:2022-09-29 18:41
聚類分析的目標是對一組對象進行聚類,使同一集群之間的對象之間在某種意義上比其他集群中的對象更相似,它是探索性數(shù)據(jù)挖掘的主要任務(wù)。聚類分析主要研究兩類問題:一是對給定簇數(shù)如何合理的進行聚類,二是如何合理的估計簇數(shù)。本文研究第二個問題中GS方法的參考分布問題。Tibshirani R等人在2000年提出GS(Gap Statisic)方法,該方法引入一個參考分布,通過比較參考數(shù)據(jù)集和樣本數(shù)據(jù)集的類內(nèi)離差程度來估計最佳聚類數(shù),并得到在分布為對數(shù)凹且一維情況下,參考分布為均勻分布的結(jié)論。因此,根據(jù)已有結(jié)論,GS方法適用于一維且對數(shù)凹情況下的數(shù)據(jù)集,但并不知道是否適用于不滿足該條件數(shù)據(jù)集的最佳聚類數(shù)估計。本文提出研究逐段均勻條件下GS方法不同維度的參考分布問題。首先,應(yīng)用Lagrange乘數(shù)法求解最小化類內(nèi)平方和條件下的參數(shù)估計問題,其次,從范數(shù)的角度對同樣的問題進行更深層次的論證。針對一維、二維的情況,得到了該條件下參考分布仍為均勻分布的結(jié)論,在此基礎(chǔ)上證得在多維邊緣為逐段均勻的條件下,其參考分布仍為均勻分布的結(jié)論。由此做出總結(jié):針對任何有限維,逐段均勻分布條件下GS方法的參考分布都是均勻分布...
【文章頁數(shù)】:43 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題的研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 聚類分析中最佳聚類數(shù)的研究現(xiàn)狀
1.2.2 GS方法研究現(xiàn)狀
1.3 論文研究的主要內(nèi)容
1.3.1 論文的組織
1.3.2 論文的主要工作與創(chuàng)新
2 預(yù)備知識
2.1 聚類分析的定義
2.2 聚類分析算法
2.3 樣本間距離
2.4 最佳聚類數(shù)k的估計
2.5 k-means算法
2.5.1 k-means算法概況
2.5.2 k-means算法定義
2.6 GS方法
2.6.1 選擇參考分布
2.6.2 GS方法運算步驟
2.7 本章小結(jié)
3 基于Lagrange乘數(shù)法的GS方法參考分布研究
3.1 一維情況下GS參考分布研究
3.2 二維情況下GS參考分布研究
3.3 n維情況下GS參考分布研究
3.4 實證分析
3.5 本章小結(jié)
4 基于范數(shù)的GS方法參考分布研究
4.1 范數(shù)的定義
4.1.1 向量范數(shù)的定義
4.1.2 矩陣范數(shù)的定義
4.2 一維情況下GS參考分布研究
4.3 多維情況下GS參考分布研究
4.4 本章小結(jié)
5 結(jié)束語
致謝
參考文獻
附錄
【參考文獻】:
期刊論文
[1]改進K-means算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的出水氨氮預(yù)測[J]. 喬俊飛,孫玉慶,韓紅桂. 控制工程. 2018(03)
[2]基于IGS方法的最佳分類數(shù)研究[J]. 竇婷,張正軍. 重慶工商大學學報(自然科學版). 2017(06)
[3]基于標準化變換的求和法:一種新的樣品聚類分析方法[J]. 郭春雪,沈?qū)?胡良平. 四川精神衛(wèi)生. 2017(03)
[4]函數(shù)型數(shù)據(jù)聚類分析研究綜述與展望[J]. 王德青,朱建平,劉曉葳,何凌云. 數(shù)理統(tǒng)計與管理. 2018(01)
[5]一種加權(quán)主成分距離的聚類分析方法[J]. 呂巖威,李平. 統(tǒng)計研究. 2016(11)
[6]基于Hash改進的k-means算法并行化設(shè)計[J]. 張波,徐蔚鴻,陳沅濤,朱玲. 計算機工程與科學. 2016(10)
[7]基于聚類分析和主成分分析法的楊梅營養(yǎng)品質(zhì)評價研究[J]. 王偉,呂旭健,張玉,王強,邵歆,王君虹,朱作藝,李雪,胡桂仙. 食品工業(yè)科技. 2017(01)
[8]基于聚類分析的三階段二級電壓控制分區(qū)方法[J]. 鮑威,朱濤,趙川,吳濤,郭瑞鵬. 電力系統(tǒng)自動化. 2016(05)
[9]近5年護理研究熱點的共詞聚類分析[J]. 張方圓,李崢. 中華護理雜志. 2016(02)
[10]基于SPSS的共現(xiàn)聚類分析參數(shù)選擇的實例研究[J]. 隋明爽,崔雷. 中華醫(yī)學圖書情報雜志. 2016(01)
碩士論文
[1]K-means聚類算法的改進研究[D]. 宋建林.安徽大學 2016
[2]基于加權(quán)MP馬氏距離的GS方法研究[D]. 王振麗.南京理工大學 2016
[3]基于矩Gap統(tǒng)計的圖像分割方法[D]. 陸琴琴.南京理工大學 2014
[4]基于GS方法的圖像分割估計數(shù)的多信息動態(tài)研究[D]. 劉倩.南京理工大學 2013
[5]基于MFGS方法圖像最佳分割數(shù)的研究[D]. 童波.南京理工大學 2011
本文編號:3683110
【文章頁數(shù)】:43 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題的研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 聚類分析中最佳聚類數(shù)的研究現(xiàn)狀
1.2.2 GS方法研究現(xiàn)狀
1.3 論文研究的主要內(nèi)容
1.3.1 論文的組織
1.3.2 論文的主要工作與創(chuàng)新
2 預(yù)備知識
2.1 聚類分析的定義
2.2 聚類分析算法
2.3 樣本間距離
2.4 最佳聚類數(shù)k的估計
2.5 k-means算法
2.5.1 k-means算法概況
2.5.2 k-means算法定義
2.6 GS方法
2.6.1 選擇參考分布
2.6.2 GS方法運算步驟
2.7 本章小結(jié)
3 基于Lagrange乘數(shù)法的GS方法參考分布研究
3.1 一維情況下GS參考分布研究
3.2 二維情況下GS參考分布研究
3.3 n維情況下GS參考分布研究
3.4 實證分析
3.5 本章小結(jié)
4 基于范數(shù)的GS方法參考分布研究
4.1 范數(shù)的定義
4.1.1 向量范數(shù)的定義
4.1.2 矩陣范數(shù)的定義
4.2 一維情況下GS參考分布研究
4.3 多維情況下GS參考分布研究
4.4 本章小結(jié)
5 結(jié)束語
致謝
參考文獻
附錄
【參考文獻】:
期刊論文
[1]改進K-means算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的出水氨氮預(yù)測[J]. 喬俊飛,孫玉慶,韓紅桂. 控制工程. 2018(03)
[2]基于IGS方法的最佳分類數(shù)研究[J]. 竇婷,張正軍. 重慶工商大學學報(自然科學版). 2017(06)
[3]基于標準化變換的求和法:一種新的樣品聚類分析方法[J]. 郭春雪,沈?qū)?胡良平. 四川精神衛(wèi)生. 2017(03)
[4]函數(shù)型數(shù)據(jù)聚類分析研究綜述與展望[J]. 王德青,朱建平,劉曉葳,何凌云. 數(shù)理統(tǒng)計與管理. 2018(01)
[5]一種加權(quán)主成分距離的聚類分析方法[J]. 呂巖威,李平. 統(tǒng)計研究. 2016(11)
[6]基于Hash改進的k-means算法并行化設(shè)計[J]. 張波,徐蔚鴻,陳沅濤,朱玲. 計算機工程與科學. 2016(10)
[7]基于聚類分析和主成分分析法的楊梅營養(yǎng)品質(zhì)評價研究[J]. 王偉,呂旭健,張玉,王強,邵歆,王君虹,朱作藝,李雪,胡桂仙. 食品工業(yè)科技. 2017(01)
[8]基于聚類分析的三階段二級電壓控制分區(qū)方法[J]. 鮑威,朱濤,趙川,吳濤,郭瑞鵬. 電力系統(tǒng)自動化. 2016(05)
[9]近5年護理研究熱點的共詞聚類分析[J]. 張方圓,李崢. 中華護理雜志. 2016(02)
[10]基于SPSS的共現(xiàn)聚類分析參數(shù)選擇的實例研究[J]. 隋明爽,崔雷. 中華醫(yī)學圖書情報雜志. 2016(01)
碩士論文
[1]K-means聚類算法的改進研究[D]. 宋建林.安徽大學 2016
[2]基于加權(quán)MP馬氏距離的GS方法研究[D]. 王振麗.南京理工大學 2016
[3]基于矩Gap統(tǒng)計的圖像分割方法[D]. 陸琴琴.南京理工大學 2014
[4]基于GS方法的圖像分割估計數(shù)的多信息動態(tài)研究[D]. 劉倩.南京理工大學 2013
[5]基于MFGS方法圖像最佳分割數(shù)的研究[D]. 童波.南京理工大學 2011
本文編號:3683110
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3683110.html
最近更新
教材專著