基于深度學(xué)習(xí)的聚類個(gè)數(shù)確定及聚類方法的研究
發(fā)布時(shí)間:2021-08-04 18:01
聚類是機(jī)器學(xué)習(xí)中最重要的研究問題之一,關(guān)于聚類的工作一直層出不窮。大部分傳統(tǒng)聚類算法都是直接作用于原始輸入空間,而當(dāng)原始輸入數(shù)據(jù)屬于高維空間時(shí),它們的性能都會(huì)受到嚴(yán)重的負(fù)面影響。最近提出的深度聚類方法提出利用深度神經(jīng)網(wǎng)絡(luò)對原始輸入數(shù)據(jù)進(jìn)行特征提取,再在特征空間進(jìn)行聚類任務(wù)。盡管在不同的數(shù)據(jù)集中都能取得令人滿意的結(jié)果,現(xiàn)有的深度聚類方法都有一個(gè)共同缺陷,它們都要求提前獲知數(shù)據(jù)集的聚類個(gè)數(shù)。然而,在現(xiàn)實(shí)應(yīng)用中,聚類個(gè)數(shù)通常是未知的。為了解決這個(gè)問題,我們對現(xiàn)有的深度聚類算法進(jìn)行了深入的分析,嘗試去找到它們問題的本質(zhì)。論文具體工作可概括為以下兩個(gè)方面:(1)提出了深度嵌入確定聚類個(gè)數(shù)法(DED)。這是一個(gè)能夠同時(shí)確定數(shù)據(jù)集聚類個(gè)數(shù)和特征學(xué)習(xí)的方法。DED方法由一個(gè)特征提取器和一個(gè)基于密度的聚類個(gè)數(shù)確定方法組成,它的特征提取器充分結(jié)合了卷積自編碼器和t-SNE方法的優(yōu)點(diǎn),在降低原始輸入數(shù)據(jù)維度的同時(shí),能夠很好地保存原始輸入數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)信息和點(diǎn)對相似度信息,所以其特征提取器能夠從原始輸入數(shù)據(jù)中提取有效的低維特征用于聚類個(gè)數(shù)確定。在提取了有效低維特征后,DED方法通過一個(gè)基于密度的聚類個(gè)數(shù)判定方...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
“軸”方法示意圖
國防科技大學(xué)研究生院碩士學(xué)位論文圖2.1自編碼器模型的概要結(jié)構(gòu)圖圖2.2一個(gè)有著三個(gè)全連接隱層的自編碼器的結(jié)構(gòu)圖2.2.2卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是一類多層前饋神經(jīng)網(wǎng)絡(luò),最早由Lecun在MNIST數(shù)據(jù)集上的識(shí)別問題中提出并利用,其特別擅長處理圖片相關(guān)的問題。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成,其與普通神經(jīng)網(wǎng)絡(luò)最大的不同在于卷積層和池化層。卷積層的涉及是基于局部感知野,將全連接變成了部分連接,其中部分連接通過卷積核實(shí)現(xiàn),一個(gè)卷積核在特征層上不斷地移動(dòng)并于部分特征依次相乘,得到下一個(gè)特征層的特征,卷積核亦可以被看作濾波器,檢測出底層輸入的局部特征。例如,第一層或者第二層的卷積層可能檢測出圖片中的一些低級特征,如“角”、“曲線”和“線段”等,高層的卷積層可能檢測出由這些低級特征組成的高級語義信息,如“貓”和“狗”之類的。具體的卷積操作示例可見圖2.3,給定一個(gè)4*4的圖片特征和一個(gè)2*2的卷積核,輸出如圖。卷積神經(jīng)網(wǎng)絡(luò)中的另一個(gè)重要操作是在池化層,池化本質(zhì)上是一種降采樣。存在多種形式的池化函數(shù),其中“最大池化”是最常用的。具體來說,“最大池化”是將輸入的特征矩陣劃分為不同的區(qū)域,取每個(gè)區(qū)域的最大值作為輸出,這種操作的直覺在于,局域特征之間的相對位置關(guān)系遠(yuǎn)比區(qū)域特征的具體位置重要。如圖2.4所示,給定一個(gè)4*4的第12頁
國防科技大學(xué)研究生院碩士學(xué)位論文圖2.1自編碼器模型的概要結(jié)構(gòu)圖圖2.2一個(gè)有著三個(gè)全連接隱層的自編碼器的結(jié)構(gòu)圖2.2.2卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是一類多層前饋神經(jīng)網(wǎng)絡(luò),最早由Lecun在MNIST數(shù)據(jù)集上的識(shí)別問題中提出并利用,其特別擅長處理圖片相關(guān)的問題。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成,其與普通神經(jīng)網(wǎng)絡(luò)最大的不同在于卷積層和池化層。卷積層的涉及是基于局部感知野,將全連接變成了部分連接,其中部分連接通過卷積核實(shí)現(xiàn),一個(gè)卷積核在特征層上不斷地移動(dòng)并于部分特征依次相乘,得到下一個(gè)特征層的特征,卷積核亦可以被看作濾波器,檢測出底層輸入的局部特征。例如,第一層或者第二層的卷積層可能檢測出圖片中的一些低級特征,如“角”、“曲線”和“線段”等,高層的卷積層可能檢測出由這些低級特征組成的高級語義信息,如“貓”和“狗”之類的。具體的卷積操作示例可見圖2.3,給定一個(gè)4*4的圖片特征和一個(gè)2*2的卷積核,輸出如圖。卷積神經(jīng)網(wǎng)絡(luò)中的另一個(gè)重要操作是在池化層,池化本質(zhì)上是一種降采樣。存在多種形式的池化函數(shù),其中“最大池化”是最常用的。具體來說,“最大池化”是將輸入的特征矩陣劃分為不同的區(qū)域,取每個(gè)區(qū)域的最大值作為輸出,這種操作的直覺在于,局域特征之間的相對位置關(guān)系遠(yuǎn)比區(qū)域特征的具體位置重要。如圖2.4所示,給定一個(gè)4*4的第12頁
【參考文獻(xiàn)】:
期刊論文
[1]自適應(yīng)仿射傳播聚類[J]. 王開軍,張軍英,李丹,張新娜,郭濤. 自動(dòng)化學(xué)報(bào). 2007(12)
本文編號(hào):3322151
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
“軸”方法示意圖
國防科技大學(xué)研究生院碩士學(xué)位論文圖2.1自編碼器模型的概要結(jié)構(gòu)圖圖2.2一個(gè)有著三個(gè)全連接隱層的自編碼器的結(jié)構(gòu)圖2.2.2卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是一類多層前饋神經(jīng)網(wǎng)絡(luò),最早由Lecun在MNIST數(shù)據(jù)集上的識(shí)別問題中提出并利用,其特別擅長處理圖片相關(guān)的問題。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成,其與普通神經(jīng)網(wǎng)絡(luò)最大的不同在于卷積層和池化層。卷積層的涉及是基于局部感知野,將全連接變成了部分連接,其中部分連接通過卷積核實(shí)現(xiàn),一個(gè)卷積核在特征層上不斷地移動(dòng)并于部分特征依次相乘,得到下一個(gè)特征層的特征,卷積核亦可以被看作濾波器,檢測出底層輸入的局部特征。例如,第一層或者第二層的卷積層可能檢測出圖片中的一些低級特征,如“角”、“曲線”和“線段”等,高層的卷積層可能檢測出由這些低級特征組成的高級語義信息,如“貓”和“狗”之類的。具體的卷積操作示例可見圖2.3,給定一個(gè)4*4的圖片特征和一個(gè)2*2的卷積核,輸出如圖。卷積神經(jīng)網(wǎng)絡(luò)中的另一個(gè)重要操作是在池化層,池化本質(zhì)上是一種降采樣。存在多種形式的池化函數(shù),其中“最大池化”是最常用的。具體來說,“最大池化”是將輸入的特征矩陣劃分為不同的區(qū)域,取每個(gè)區(qū)域的最大值作為輸出,這種操作的直覺在于,局域特征之間的相對位置關(guān)系遠(yuǎn)比區(qū)域特征的具體位置重要。如圖2.4所示,給定一個(gè)4*4的第12頁
國防科技大學(xué)研究生院碩士學(xué)位論文圖2.1自編碼器模型的概要結(jié)構(gòu)圖圖2.2一個(gè)有著三個(gè)全連接隱層的自編碼器的結(jié)構(gòu)圖2.2.2卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)是一類多層前饋神經(jīng)網(wǎng)絡(luò),最早由Lecun在MNIST數(shù)據(jù)集上的識(shí)別問題中提出并利用,其特別擅長處理圖片相關(guān)的問題。卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層、池化層和全連接層組成,其與普通神經(jīng)網(wǎng)絡(luò)最大的不同在于卷積層和池化層。卷積層的涉及是基于局部感知野,將全連接變成了部分連接,其中部分連接通過卷積核實(shí)現(xiàn),一個(gè)卷積核在特征層上不斷地移動(dòng)并于部分特征依次相乘,得到下一個(gè)特征層的特征,卷積核亦可以被看作濾波器,檢測出底層輸入的局部特征。例如,第一層或者第二層的卷積層可能檢測出圖片中的一些低級特征,如“角”、“曲線”和“線段”等,高層的卷積層可能檢測出由這些低級特征組成的高級語義信息,如“貓”和“狗”之類的。具體的卷積操作示例可見圖2.3,給定一個(gè)4*4的圖片特征和一個(gè)2*2的卷積核,輸出如圖。卷積神經(jīng)網(wǎng)絡(luò)中的另一個(gè)重要操作是在池化層,池化本質(zhì)上是一種降采樣。存在多種形式的池化函數(shù),其中“最大池化”是最常用的。具體來說,“最大池化”是將輸入的特征矩陣劃分為不同的區(qū)域,取每個(gè)區(qū)域的最大值作為輸出,這種操作的直覺在于,局域特征之間的相對位置關(guān)系遠(yuǎn)比區(qū)域特征的具體位置重要。如圖2.4所示,給定一個(gè)4*4的第12頁
【參考文獻(xiàn)】:
期刊論文
[1]自適應(yīng)仿射傳播聚類[J]. 王開軍,張軍英,李丹,張新娜,郭濤. 自動(dòng)化學(xué)報(bào). 2007(12)
本文編號(hào):3322151
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3322151.html
最近更新
教材專著