基于深度學(xué)習(xí)的聚類關(guān)鍵技術(shù)研究
本文關(guān)鍵詞:基于深度學(xué)習(xí)的聚類關(guān)鍵技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:自從2006年以來深度學(xué)習(xí)已經(jīng)成為人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的一大熱點(diǎn)。并且在無監(jiān)督特征學(xué)習(xí)領(lǐng)域展現(xiàn)出了巨大的潛力。深度學(xué)習(xí)是一系列深度學(xué)習(xí)算法的統(tǒng)稱,其利用深度結(jié)構(gòu)來學(xué)習(xí)數(shù)據(jù)中存在的深層模式和隱含特征。聚類技術(shù)是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的一大研究熱點(diǎn),是一種無監(jiān)督學(xué)習(xí)方法。聚類是在不需要先驗(yàn)知識(shí)的情況下,自主地學(xué)習(xí)原始數(shù)據(jù)中的隱含簇結(jié)構(gòu)。本論文提出一種基于深度學(xué)習(xí)的聚類模型,并利用深度信念網(wǎng)(DBN)和Fuzzy C-means (FCM)實(shí)現(xiàn)一種聚類算法。該模型分成兩個(gè)部分:預(yù)訓(xùn)練部分和微調(diào)部分。預(yù)訓(xùn)練部分由深層結(jié)構(gòu)和預(yù)聚類層組成。首先預(yù)訓(xùn)練部分為:使用多層限制性玻爾茲曼機(jī)進(jìn)行網(wǎng)絡(luò)預(yù)訓(xùn)練,以此得到深層結(jié)構(gòu)預(yù)訓(xùn)練的深層特征表示,然后通過預(yù)聚類層使用一種簡單的聚類算法對預(yù)訓(xùn)練得到的深層特征表示進(jìn)行預(yù)聚類,并得到初步的聚類中心和類標(biāo)簽。接下來是微調(diào)部分,微調(diào)部分為:使用展開后的微調(diào)網(wǎng)絡(luò)對預(yù)訓(xùn)練部分已經(jīng)學(xué)習(xí)到的網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),同時(shí)進(jìn)行聚類優(yōu)化學(xué)習(xí)。微調(diào)部分的結(jié)構(gòu)是將預(yù)訓(xùn)練深層結(jié)構(gòu)展開并加上聚類層。微調(diào)部分采用交叉迭代的方法對目標(biāo)公式進(jìn)行優(yōu)化,使得聚類結(jié)果和特征學(xué)習(xí)能夠同時(shí)達(dá)到最優(yōu)的效果。該模型充分利用了深度學(xué)習(xí)和聚類技術(shù)的無監(jiān)督學(xué)習(xí)的共性,將深度學(xué)習(xí)的優(yōu)勢和聚類相結(jié)合,使得聚類效果更好和對高維數(shù)據(jù)聚類時(shí)更加便捷。在該模型的基礎(chǔ)上,本文又采用深度信念網(wǎng)和FCM算法實(shí)現(xiàn)一種聚類算法(DBNOC)。該算法既有深度信念網(wǎng)的優(yōu)點(diǎn),同時(shí)又是一種軟聚類方法。該算法在微調(diào)優(yōu)化的過程中主要采用了BP反向傳播的方法。最后,通過在高維度數(shù)據(jù)和低維度數(shù)據(jù)上實(shí)驗(yàn)驗(yàn)證本論文所提出模型的有效性。實(shí)驗(yàn)結(jié)果表明該模型具有很好泛化性,在低維數(shù)據(jù)和高維數(shù)據(jù)上都表現(xiàn)良好。相比于普通的聚類算法表現(xiàn)出更好的聚類效果。相對于較繁瑣原始數(shù)據(jù)與處理過程,該模型則簡單,適應(yīng)性更好。
【關(guān)鍵詞】:深度學(xué)習(xí) 聚類 特征表示 無監(jiān)督學(xué)習(xí) 深度結(jié)構(gòu)
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP181;TP311.13
【目錄】:
- 摘要6-7
- Abstract7-11
- 第1章 緒論11-18
- 1.1 本研究課題的背景和意義11-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-16
- 1.2.1 深度學(xué)習(xí)研究現(xiàn)狀13-15
- 1.2.2 聚類技術(shù)整體現(xiàn)狀15-16
- 1.3 本文主要研究內(nèi)容和結(jié)構(gòu)安排16-18
- 第2章 深度學(xué)習(xí)和聚類技術(shù)18-28
- 2.1 深度學(xué)習(xí)的概念和理論18-22
- 2.1.1 人工神經(jīng)網(wǎng)絡(luò)18-20
- 2.1.2 深度結(jié)構(gòu)的優(yōu)點(diǎn)和訓(xùn)練方法20-22
- 2.1.3 深度結(jié)構(gòu)分類22
- 2.2 深度學(xué)習(xí)的應(yīng)用22-24
- 2.3 聚類技術(shù)分析24-26
- 2.3.1 聚類的定義24-25
- 2.3.2 聚類的分類25-26
- 2.4 本章小結(jié)26-28
- 第3章 基于深度學(xué)習(xí)的聚類模型28-41
- 3.1 深度學(xué)習(xí)的基本結(jié)構(gòu)28-33
- 3.1.1 玻爾茲曼機(jī)28-29
- 3.1.2 受限玻爾茲曼機(jī)29-32
- 3.1.3 自動(dòng)編碼機(jī)32-33
- 3.2 基于深度學(xué)習(xí)的聚類模型結(jié)構(gòu)33-36
- 3.3 基于深度學(xué)習(xí)的聚類模型的特點(diǎn)和目標(biāo)公式36-38
- 3.4 基于RBM編碼的聚類方法38-40
- 3.4.1 RBM編碼38-39
- 3.4.2 RBM中的Gibbs采樣39
- 3.4.3 基于RBM編碼的聚類39-40
- 3.5 本章小結(jié)40-41
- 第4章 基于DBN和FCM的聚類算法41-49
- 4.1 DBN和FCM算法41-44
- 4.1.1 DBN算法41-42
- 4.1.2 FCM算法42-44
- 4.2 算法思想44
- 4.3 基于DBN和FCM的聚類算法44-47
- 4.3.1 算法描述44-46
- 4.3.2 算法流程46-47
- 4.4 本章小結(jié)47-49
- 第5章 實(shí)驗(yàn)結(jié)果與分析49-63
- 5.1 實(shí)驗(yàn)評價(jià)標(biāo)準(zhǔn)49
- 5.2 基于RBM編碼聚類實(shí)驗(yàn)參數(shù)49-50
- 5.2.1 實(shí)驗(yàn)參數(shù)49-50
- 5.3 基于RBM編碼聚類實(shí)驗(yàn)結(jié)果分析50-53
- 5.3.1 實(shí)驗(yàn)數(shù)據(jù)集50-51
- 5.3.2 結(jié)果分析51-53
- 5.4 DBNOC算法實(shí)驗(yàn)結(jié)果與分析53-62
- 5.4.1 實(shí)驗(yàn)數(shù)據(jù)集53-54
- 5.4.2 實(shí)算法中網(wǎng)絡(luò)節(jié)點(diǎn)設(shè)置54-55
- 5.4.3 聚類結(jié)果分析55-57
- 5.4.4 實(shí)驗(yàn)算法微調(diào)部分收斂性分析57-62
- 5.5 本章小結(jié)62-63
- 總結(jié)與展望63-65
- 致謝65-66
- 參考文獻(xiàn)66-71
- 攻讀碩士學(xué)位期間發(fā)表的論文71
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 全燮,許建峰,楊鳳林,郎佩珍;模糊混合聚類法對污染物優(yōu)先排序及分類的探討[J];大連理工大學(xué)學(xué)報(bào);1993年04期
2 宋云昌;;基于分類的聚類方法研究及其應(yīng)用[J];電腦編程技巧與維護(hù);2011年10期
3 陳曉云;敏玉芳;鄭良仁;楊麗;;一種快速山峰聚類算法[J];計(jì)算機(jī)應(yīng)用研究;2008年07期
4 蔣永福,李景正;論知識(shí)聚類[J];圖書情報(bào)工作;2000年12期
5 王倫文;;聚類的粒度分析[J];計(jì)算機(jī)工程與應(yīng)用;2006年05期
6 沈晶;顧國昌;劉海波;;基于免疫聚類的自動(dòng)分層強(qiáng)化學(xué)習(xí)方法研究[J];哈爾濱工程大學(xué)學(xué)報(bào);2007年04期
7 趙珩君;;客觀聚類在客戶價(jià)值細(xì)分中的研究[J];情報(bào)雜志;2009年03期
8 鄧青;;基于區(qū)域密度的山峰聚類算法[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年12期
9 周麗華,王麗珍;基于聚類的比例規(guī)則[J];計(jì)算機(jī)工程與應(yīng)用;2001年14期
10 楊燕;張昭濤;;基于閾值和蟻群算法結(jié)合的聚類方法[J];西南交通大學(xué)學(xué)報(bào);2006年06期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前3條
1 彭澤映;俞曉明;許洪波;;大規(guī)模短文本的不完全聚類[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 余琳;鄧玲;;常見聚類算法的比較以及DSS系統(tǒng)中的應(yīng)用[A];湖北省通信學(xué)會(huì)、武漢通信學(xué)會(huì)2009年學(xué)術(shù)年會(huì)論文集[C];2009年
3 王靜紅;劉教民;李筆;;基于聚類的噪音消除方法[A];2006中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
中國重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 大摩多因子基金經(jīng)理 張靖;聚類法擴(kuò)大超額收益空間[N];中國證券報(bào);2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 呂宗磊;對聚類及聚類評價(jià)若干問題的研究[D];南京航空航天大學(xué);2009年
2 張強(qiáng);聚類算法的維度分析[D];天津大學(xué);2007年
3 陳樹;聚類算法模型的研究及應(yīng)用[D];江南大學(xué);2007年
4 朱紅;粒度聚類方法研究[D];中國礦業(yè)大學(xué);2013年
5 劉培強(qiáng);兩元矩陣聚類算法研究[D];山東大學(xué);2013年
6 劉位龍;面向不確定性數(shù)據(jù)的聚類算法研究[D];山東師范大學(xué);2011年
7 李桃迎;交通領(lǐng)域中的聚類分析方法研究[D];大連海事大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳月敏;基于改進(jìn)聚類的電網(wǎng)支路參數(shù)多代理辨識(shí)與估計(jì)[D];燕山大學(xué);2015年
2 關(guān)夢園;基于聚類的流場簡化[D];北京理工大學(xué);2015年
3 何翔;匿名路由器識(shí)別新方法的研究[D];電子科技大學(xué);2015年
4 楊琪;基于深度學(xué)習(xí)的聚類關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2016年
5 張?jiān)?圖聚類質(zhì)量評價(jià)指標(biāo)體系的對比分析研究[D];山西大學(xué);2012年
6 王瑩;應(yīng)用于體質(zhì)分類的聚類方法研究及改進(jìn)[D];西安電子科技大學(xué);2007年
7 吳艷文;聚類中的特征學(xué)習(xí)研究[D];合肥工業(yè)大學(xué);2007年
8 羅如意;反饋式聚類算法研究[D];華中科技大學(xué);2008年
9 王麗娟;特征權(quán)學(xué)習(xí)在無導(dǎo)師聚類中的應(yīng)用[D];河北大學(xué);2003年
10 馬倩;基于模式聚類的理論研究[D];燕山大學(xué);2007年
本文關(guān)鍵詞:基于深度學(xué)習(xí)的聚類關(guān)鍵技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):467651
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/467651.html