面向復(fù)雜結(jié)構(gòu)數(shù)據(jù)的近鄰傳播聚類算法研究
本文關(guān)鍵詞:面向復(fù)雜結(jié)構(gòu)數(shù)據(jù)的近鄰傳播聚類算法研究
更多相關(guān)文章: 近鄰傳播聚類算法 奇異值分解 煙花爆炸優(yōu)化算法 低秩表示 結(jié)構(gòu)相似度 半監(jiān)督學(xué)習(xí) 果蠅優(yōu)化
【摘要】:隨著大數(shù)據(jù)庫的建立和海量數(shù)據(jù)的不斷涌現(xiàn),數(shù)據(jù)挖掘技術(shù)越來越受到眾多領(lǐng)域的廣泛關(guān)注。聚類技術(shù)作為數(shù)據(jù)挖掘的重要分支,通過無監(jiān)督學(xué)習(xí),從海量數(shù)據(jù)中找出數(shù)據(jù)潛在的內(nèi)部結(jié)構(gòu),已然成為人工智能領(lǐng)域的研究熱點(diǎn)。近鄰傳播聚類算法(Affinity Propagation,AP)作為無監(jiān)督學(xué)習(xí)領(lǐng)域極具競爭力的聚類技術(shù),迄今為止已得到各領(lǐng)域廣泛認(rèn)可。盡管如此,AP算法仍然存在不足之處:(1)只能處理聚類結(jié)構(gòu)清晰的超球形數(shù)據(jù)聚類問題,面對結(jié)構(gòu)復(fù)雜的數(shù)據(jù)聚類效果不佳;(2)歐式距離無法準(zhǔn)確反映高維數(shù)據(jù)間的相似性(3)AP算法的參數(shù)需要手動調(diào)節(jié),增加算法的使用成本。鑒于上述問題,本文以構(gòu)建相似性度量和相關(guān)參數(shù)優(yōu)化為突破口,分別針對不同問題提出不同的改進(jìn)方案:(1)針對近鄰傳播聚類算法難以處理高維數(shù)據(jù)的聚類問題,提出基于奇異值分解的自適應(yīng)近鄰傳播聚類算法(Self-adapting affinity propagation clustering algorithm based on singular value decomposition,SVD-SAP)。該算法通過對高維數(shù)據(jù)進(jìn)行奇異值分解,消除數(shù)據(jù)的冗余維度,采用非線性函數(shù)策略調(diào)整阻尼系數(shù),提高算法的聚類性能。(2)針對近鄰傳播聚類算法的偏向參數(shù)無法合理地確定,提出基于煙花爆炸優(yōu)化的半監(jiān)督近鄰傳播聚類算法(Semi-supervised affinity propagation based on fireworks explosion optimization,FEO-SAP)。該算法利用成對約束信息調(diào)整相似度矩陣,并在算法迭代過程中引入煙花爆炸的思想,雙向搜索偏向參數(shù)空間以獲得最佳聚類結(jié)構(gòu)。(3)為同步優(yōu)化偏向參數(shù)和阻尼因子,提出基于果蠅優(yōu)化的自適應(yīng)近鄰傳播聚類算法(Self-adaptive affinity propagation based on fruit fly optimization algorithm,FOA-SAP)。利用果蠅優(yōu)化算法的全局尋優(yōu)能力,同時尋優(yōu)偏向參數(shù)和阻尼因子兩個參數(shù)空間,并根據(jù)Silhouette有效性指標(biāo)確定最佳聚類。(4)鑒于近鄰傳播聚類算法難以處理具有復(fù)雜結(jié)構(gòu)的數(shù)據(jù)集,提出基于結(jié)構(gòu)相似度的半監(jiān)督自適應(yīng)近鄰傳播聚類算法(Semi-supervised adaptive affinity propagation clustering algorithm based on structural similarity,SAAP-SS)。該算法通過求解一個核低秩表示的優(yōu)化問題,發(fā)現(xiàn)數(shù)據(jù)潛在流形結(jié)構(gòu),并利用煙花算法雙向搜索偏向參數(shù),從而獲得最佳聚類結(jié)果。
【關(guān)鍵詞】:近鄰傳播聚類算法 奇異值分解 煙花爆炸優(yōu)化算法 低秩表示 結(jié)構(gòu)相似度 半監(jiān)督學(xué)習(xí) 果蠅優(yōu)化
【學(xué)位授予單位】:吉林財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-16
- 1.1 選題背景與研究意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-13
- 1.3 主要研究內(nèi)容和組織結(jié)構(gòu)13-15
- 1.3.1 主要研究內(nèi)容13-14
- 1.3.2 本文組織結(jié)構(gòu)14-15
- 1.4 本文主要創(chuàng)新點(diǎn)15-16
- 第2章 聚類算法的理論基礎(chǔ)16-26
- 2.1 相似性度量方式16-17
- 2.2 聚類算法分類17-22
- 2.2.1 基于劃分的方法18
- 2.2.2 基于層次的方法18-19
- 2.2.3 基于密度的方法19-21
- 2.2.4 基于模型的方法21
- 2.2.5 基于網(wǎng)格的方法21-22
- 2.3 近鄰傳播聚類算法22-23
- 2.4 聚類有效性評價指標(biāo)23-26
- 第3章 基于奇異值分解的自適應(yīng)近鄰傳播聚類算法26-33
- 3.1 基于奇異值分解的自適應(yīng)近鄰傳播聚類算法26-28
- 3.1.1 奇異值分解26
- 3.1.2 基于奇異值分解的降維過程26-27
- 3.1.3 動態(tài)阻尼因子策略27-28
- 3.1.4 SVD-SAP算法流程28
- 3.2 仿真實驗與分析28-30
- 3.2.1 實驗數(shù)據(jù)28-29
- 3.2.2 實驗結(jié)果與分析29-30
- 3.3 SVD-SAP聚類算法在股市板塊的應(yīng)用30-32
- 3.3.1 數(shù)據(jù)選取30-31
- 3.3.2 聚類結(jié)果及分析31-32
- 3.4 本章小結(jié)32-33
- 第4章 基于煙花爆炸優(yōu)化的半監(jiān)督近鄰傳播聚類算法33-40
- 4.1 煙花爆炸優(yōu)化算法33-36
- 4.1.1 算法思想33
- 4.1.2 算法描述33-35
- 4.1.3 半監(jiān)督約束規(guī)則35-36
- 4.1.4 FEO-SAP算法流程36
- 4.2 仿真實驗與分析36-39
- 4.2.1 實驗數(shù)據(jù)36-37
- 4.2.2 實驗結(jié)果與分析37-39
- 4.3 本章小結(jié)39-40
- 第5章 基于果蠅優(yōu)化的自適應(yīng)近鄰傳播聚類算法40-44
- 5.1 基于果蠅優(yōu)化的近鄰傳播聚類算法40-41
- 5.1.1 果蠅優(yōu)化算法40-41
- 5.1.2 FOA-SAP算法流程41
- 5.2 仿真實驗與分析41-43
- 5.2.1 實驗數(shù)據(jù)41-42
- 5.2.2 實驗結(jié)果與分析42-43
- 5.3 本章小結(jié)43-44
- 第6章 基于結(jié)構(gòu)相似度的半監(jiān)督自適應(yīng)近鄰傳播聚類算法44-51
- 6.1 結(jié)構(gòu)相似性度量44-46
- 6.1.1 數(shù)據(jù)低秩轉(zhuǎn)換44-45
- 6.1.2 結(jié)構(gòu)相似度的核設(shè)計45-46
- 6.1.3 算法流程46
- 6.2 仿真實驗與分析46-50
- 6.2.1 實驗數(shù)據(jù)46-47
- 6.2.2 實驗結(jié)果與分析47-50
- 6.3 本章小結(jié)50-51
- 第7章 總結(jié)與展望51-53
- 參考文獻(xiàn)53-57
- 攻讀碩士學(xué)位期間已公開發(fā)表的論文57-58
- 致謝58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 葛磊;武芳;王鵬波;張冬林;;3維建筑綜合中基于最小特征的面平移算法[J];測繪科學(xué)技術(shù)學(xué)報;2009年02期
2 駱雯,孫延明,陳振威,陳錦昌;判斷點(diǎn)與封閉多邊形相對關(guān)系的改進(jìn)算法[J];機(jī)械;1999年03期
3 李林;盧顯良;;一種基于切割映射的規(guī)則沖突消除算法[J];電子學(xué)報;2008年02期
4 劉巧玲;張紅英;林茂松;;一種簡單快速的圖像去霧算法[J];計算機(jī)應(yīng)用與軟件;2013年07期
5 林亞平,楊小林;快速概率分析進(jìn)化算法及其性能研究[J];電子學(xué)報;2001年02期
6 章郡鋒;吳曉紅;黃曉強(qiáng);何小海;;基于暗原色先驗去霧的改進(jìn)算法[J];電視技術(shù);2013年23期
7 楊鐵軍;靳婷;;一種動態(tài)整周模糊值求解算法及其仿真分析[J];系統(tǒng)工程與電子技術(shù);2007年01期
8 周秀玲;郭平;陳寶維;王靜;;幾種計算超體積算法的比較研究[J];計算機(jī)工程;2011年03期
9 吳一戎,胡東輝,彭海良;Chirp Scaling SAR成象算法及其實現(xiàn)[J];電子科學(xué)學(xué)刊;1995年03期
10 王貴竹;一種產(chǎn)生單向分解值的算法[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2001年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 尹冀鋒;;一種新的圖象自適應(yīng)增強(qiáng)算法[A];四川省通信學(xué)會一九九二年學(xué)術(shù)年會論文集[C];1992年
2 寧春平;田家瑋;郭延輝;王影;張英濤;鄭桂霞;劉研;;計算機(jī)輔助增強(qiáng)、分割算法在鑒別乳腺良、惡性腫塊中的應(yīng)用價值[A];中華醫(yī)學(xué)會第十次全國超聲醫(yī)學(xué)學(xué)術(shù)會議論文匯編[C];2009年
3 謝麗聰;;SVB查詢改寫算法的改進(jìn)[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
4 鄭存紅;;復(fù)雜背景下相關(guān)跟蹤算法研究及DSP實現(xiàn)[A];中國光學(xué)學(xué)會2010年光學(xué)大會論文集[C];2010年
5 楊文杰;吳軍;;RFID抗沖突算法研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2008年
6 高山;畢篤彥;魏娜;;一種基于UPF的小目標(biāo)TBD算法[A];第十四屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2008年
7 周磊;張衛(wèi)華;王曉奇;張軍;;基于流水算法的智能路障機(jī)器人設(shè)計[A];2011年全國電子信息技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2011年
8 潘巍;李戰(zhàn)懷;陳群;索博;李衛(wèi)榜;;面向MapReduce的非對稱分片復(fù)制連接算法優(yōu)化技術(shù)研究[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
9 李偉偉;蔡康穎;鄭新;王文成;;3D模型中重復(fù)結(jié)構(gòu)的多尺度快速檢測算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計算學(xué)術(shù)會議(PCC2010)論文集[C];2010年
10 楊任爾;陳懇;勵金祥;;基于棱邊方向檢測的運(yùn)動自適應(yīng)去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 國泰君安資產(chǎn)管理部;“算法交易”是道指暴跌罪魁禍?zhǔn)?[N];上海證券報;2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 馮輝;網(wǎng)絡(luò)化的并行與分布式優(yōu)化算法研究及應(yīng)用[D];復(fù)旦大學(xué);2013年
2 許玉杰;云計算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學(xué);2014年
3 李琰;基于貓群算法的高光譜遙感森林類型識別研究[D];東北林業(yè)大學(xué);2015年
4 陳加順;海洋環(huán)境下聚類算法的研究[D];南京航空航天大學(xué);2014年
5 王洋;基于群體智能的通信網(wǎng)絡(luò)告警關(guān)聯(lián)規(guī)則挖掘算法研究[D];太原理工大學(xué);2015年
6 雷雨;面向考試時間表問題的啟發(fā)式進(jìn)化算法研究[D];西安電子科技大學(xué);2015年
7 熊霖;大數(shù)據(jù)下的數(shù)據(jù)選擇與學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2015年
8 周雷;基于圖結(jié)構(gòu)的目標(biāo)檢測與分割算法研究[D];上海交通大學(xué);2014年
9 王冰;人工蜂群算法的改進(jìn)及相關(guān)應(yīng)用的研究[D];北京理工大學(xué);2015年
10 蔣亦樟;多視角和遷移學(xué)習(xí)識別方法和智能建模研究[D];江南大學(xué);2015年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 姚鑫宇;EMD去噪與MUSIC算法在DOA估計中的聯(lián)合應(yīng)用[D];昆明理工大學(xué);2015年
2 陸進(jìn);面向含噪數(shù)據(jù)聚類相關(guān)算法的研究[D];復(fù)旦大學(xué);2014年
3 李家昌;基于能量約束的超聲圖像自動分割算法[D];華南理工大學(xué);2015年
4 陳堅;基于密度和約束的數(shù)據(jù)流聚類算法研究[D];蘭州大學(xué);2015年
5 高健;基于Zynq7000平臺的去霧算法研究及實現(xiàn)[D];南京理工大學(xué);2015年
6 顧磊;基于Hadoop的聚類算法的數(shù)據(jù)優(yōu)化及其應(yīng)用研究[D];南京信息工程大學(xué);2015年
7 楊燕霞;基于Hadoop平臺的并行關(guān)聯(lián)規(guī)則挖掘算法研究[D];四川師范大學(xué);2015年
8 王羽;基于MapReduce的社區(qū)發(fā)現(xiàn)算法的設(shè)計與實現(xiàn)[D];南京理工大學(xué);2015年
9 許振佳;流式數(shù)據(jù)的并行聚類算法研究[D];曲阜師范大學(xué);2015年
10 董琴;人工蜂群算法的改進(jìn)與應(yīng)用[D];大連海事大學(xué);2015年
,本文編號:684761
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/684761.html