基于流型的貝葉斯層次聚類分析
發(fā)布時(shí)間:2021-09-17 15:29
聚類分析是一類重要的無監(jiān)督學(xué)習(xí)算法,其目的是在沒有樣本標(biāo)簽的情況下將數(shù)據(jù)總體劃分為彼此性質(zhì)不同的子集。由于沒有標(biāo)簽指導(dǎo)訓(xùn)練過程,聚類分析中兩個(gè)關(guān)鍵的問題是子類個(gè)數(shù)的選擇和類間距離度量標(biāo)準(zhǔn)的選取。當(dāng)樣本的維數(shù)很高時(shí),聚類分析還需要對(duì)樣本進(jìn)行降維,以達(dá)到減少計(jì)算量,舍棄無用信息的目的。高維數(shù)據(jù)的潛在結(jié)構(gòu)雖然是低維的,但往往是非線性的,因此傳統(tǒng)的線性降維方法,如主成分分析等在降維時(shí)會(huì)丟失數(shù)據(jù)集的內(nèi)部結(jié)構(gòu)。目前尚沒有一種能夠?qū)Ω呔S數(shù)據(jù)進(jìn)行有效聚類分析的算法。為了能對(duì)高維圖像數(shù)據(jù)進(jìn)行有效的降維,同時(shí)在聚類時(shí)避免主觀選擇類的個(gè)數(shù)和樣本間的距離度量標(biāo)準(zhǔn),本文考慮基于流型的貝葉斯層析聚類分析,即首先用適當(dāng)?shù)牧餍蛯W(xué)習(xí)算法對(duì)圖像數(shù)據(jù)進(jìn)行有效的降維,對(duì)降維后的數(shù)據(jù)進(jìn)行貝葉斯層次聚類分析。本文選用手寫數(shù)字識(shí)別、物體識(shí)別和人臉識(shí)別共三組實(shí)際高維圖像數(shù)據(jù)進(jìn)行聚類分析,分析結(jié)果表明,流型學(xué)習(xí)能夠在降維的同時(shí)最大程度的保留圖像數(shù)據(jù)集的內(nèi)部結(jié)構(gòu)。同時(shí),與傳統(tǒng)的聚類算法以及基于線性降維的貝葉斯層次聚類算法相比,基于流型降維的貝葉斯層次聚類法能夠以較低的計(jì)算量自動(dòng)的選擇出接近真實(shí)值的子類個(gè)數(shù),同時(shí)對(duì)數(shù)據(jù)進(jìn)行恰當(dāng)?shù)木垲悺?nbsp;
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:48 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
每個(gè)MNIST樣本是2828的灰度圖片
線性整體結(jié)構(gòu)有時(shí)不利于聚類分析
手寫數(shù)字‘3’在三維流型中變化
本文編號(hào):3399002
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:48 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
每個(gè)MNIST樣本是2828的灰度圖片
線性整體結(jié)構(gòu)有時(shí)不利于聚類分析
手寫數(shù)字‘3’在三維流型中變化
本文編號(hào):3399002
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3399002.html
最近更新
教材專著