基于不定核的大間隔聚類算法研究
本文關(guān)鍵詞:基于不定核的大間隔聚類算法研究
更多相關(guān)文章: 不定核學(xué)習(xí) 大間隔聚類 支持向量機(jī) 核方法
【摘要】:核方法是機(jī)器學(xué)習(xí)領(lǐng)域中解決非線性學(xué)習(xí)問題的一種有效方法,大都要求核函數(shù)正定,然而,在實(shí)際問題中這樣的要求常常很難滿足;相反,在某些情況下,使用不定核往往能取得比正定核更好的效果,如基因識別、目標(biāo)檢測問題等。近年來,不定核問題越來越受到研究者們的關(guān)注,多種解決不定核分類問題的方法被提出并取得很好的效果,如譜變換方法、正定核替代策略等。然而,關(guān)于不定核聚類問題的研究卻相對較少,現(xiàn)有基于核的聚類算法也大都基于正定核,不能直接處理核函數(shù)不定的情況。鑒于已有不定核方法在分類問題中的優(yōu)異表現(xiàn),本文希望借助這些方法研究基于不定核的聚類問題。具體地,本文以經(jīng)典的基于核的大間隔聚類模型(Maximum Margin Clustering, MMC)為基礎(chǔ),提出了一種基于不定核的大間隔聚類模型(Indefinite Kernel Maximum Margin Clustering, IKMMC)。IKMMC采取正定核替代策略,尋求一個正定核以逼近不定核,并將度量二者差異性的F-范數(shù)作為一個正則化項嵌入到MMC模型中,進(jìn)而得到IKMMC模型。針對該模型,本文選取了迭代優(yōu)化方法進(jìn)行優(yōu)化:首先給樣本賦初始類別標(biāo)記,在每輪迭代中,不定核聚類問題被轉(zhuǎn)化為帶有類平衡約束的不定核支持向量機(jī)(Indefinite Kernel Support Vector Machine, IKSVM)問題,并被進(jìn)一步表達(dá)為半無限規(guī)劃(Semi-infinite Programming, SIP)形式求解;本輪優(yōu)化得到的樣本預(yù)測標(biāo)記作為下輪迭代的樣本初始標(biāo)記,直到樣本預(yù)測錯誤率不再滿足迭代條件;最后,IKMMC以最后一輪的樣本預(yù)測標(biāo)記作為聚類的最終結(jié)果。實(shí)驗(yàn)部分驗(yàn)證了IKMMC及其迭代優(yōu)化算法的有效性。MMC模型主要用于兩類樣本聚類,為了使IKMMC能夠適應(yīng)更為復(fù)雜的多類情況,本文進(jìn)一步提出了多類情況下的IKMMC模型,并給出了相關(guān)優(yōu)化算法,通過在多個數(shù)據(jù)集上的實(shí)驗(yàn)證明了IKMMC及其優(yōu)化算法在多類情況下依然有較好的方法性能。
【關(guān)鍵詞】:不定核學(xué)習(xí) 大間隔聚類 支持向量機(jī) 核方法
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;TP181
【目錄】:
- 摘要5-6
- Abstract6-9
- 第一章 緒論9-15
- 1.1 研究背景與意義9-10
- 1.2 不定核方法研究現(xiàn)狀10-11
- 1.3 基于核的聚類算法研究現(xiàn)狀11-13
- 1.4 本文研究動機(jī)13
- 1.5 研究目標(biāo)及內(nèi)容13
- 1.6 論文結(jié)構(gòu)13-15
- 第二章 基于核的聚類算法15-22
- 2.1 核方法15-18
- 2.1.1 核函數(shù)15-16
- 2.1.2 再生核Hilbert空間16-17
- 2.1.3 常用核函數(shù)17-18
- 2.2 基于核的聚類算法18-21
- 2.2.1 KKM18-19
- 2.2.2 SC19
- 2.2.3 KSOM19-20
- 2.2.4 SVC20
- 2.2.5 MMC20-21
- 2.3 評價準(zhǔn)則21
- 2.3.1 Purity/CE21
- 2.3.2 Rand Index21
- 2.4 本章小結(jié)21-22
- 第三章 兩類情況下基于不定核的大間隔聚類算法研究22-38
- 3.1 模型構(gòu)建22-25
- 3.1.1 SVM二分類模型22-23
- 3.1.2 軟間隔23
- 3.1.3 兩類情況下的MMC模型23-24
- 3.1.4 兩類情況下的IKMMC模型構(gòu)建24-25
- 3.2 模型優(yōu)化25-33
- 3.2.1 對偶形式25-26
- 3.2.2 對偶間隙26-28
- 3.2.3 半無限規(guī)劃28-31
- 3.2.4 兩類情況下的IKMMC模型優(yōu)化算法及分析31-33
- 3.3 實(shí)驗(yàn)33-37
- 3.3.1 實(shí)驗(yàn)設(shè)置33
- 3.3.2 實(shí)驗(yàn)結(jié)果33-37
- 3.4 本章小結(jié)37-38
- 第四章 多類情況下基于不定核的大間隔聚類算法研究38-51
- 4.1 模型構(gòu)建38-41
- 4.1.1 SVM多分類模型38-39
- 4.1.2 多類情況下的MMC模型39-40
- 4.1.3 多類情況下的IKMMC模型構(gòu)建40-41
- 4.2 模型優(yōu)化41-46
- 4.2.1 對偶形式41-42
- 4.2.2 半無限規(guī)劃42-45
- 4.2.3 多類情況下的IKMMC模型優(yōu)化算法及分析45-46
- 4.3 實(shí)驗(yàn)46-50
- 4.3.1 實(shí)驗(yàn)設(shè)置46-47
- 4.3.2 實(shí)驗(yàn)結(jié)果47-50
- 4.4 本章小結(jié)50-51
- 第五章 結(jié)束語51-53
- 5.1 本文工作小結(jié)51-52
- 5.2 進(jìn)一步的工作52-53
- 致謝53-54
- 參考文獻(xiàn)54-58
- 附錄58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 馮舜璽;;新書推薦:《算法分析導(dǎo)論》[J];計算機(jī)教育;2006年05期
2 張力,慕曉冬;計算機(jī)算法分析淺談[J];武警工程學(xué)院學(xué)報;2002年04期
3 馬安光;;飛彈問題的算法分析——2003年第10期題解[J];程序員;2003年12期
4 蘇運(yùn)霖;;《算法分析導(dǎo)論》評介[J];計算機(jī)教育;2006年07期
5 朱力強(qiáng);;培養(yǎng)學(xué)生創(chuàng)新思維與能力的算法分析案例[J];計算機(jī)與信息技術(shù);2007年11期
6 汪菊琴;;幾種常見特殊方陣的算法分析與實(shí)現(xiàn)[J];無錫職業(yè)技術(shù)學(xué)院學(xué)報;2009年05期
7 李涵;;“算法分析與設(shè)計”課程教學(xué)改革和實(shí)踐[J];中國電力教育;2010年16期
8 劉寧;管濤;;淺析案例教學(xué)法在算法分析與設(shè)計課程中的應(yīng)用[J];科技風(fēng);2011年07期
9 胡峰;王國胤;;“算法分析與設(shè)計”教學(xué)模式探索[J];當(dāng)代教育理論與實(shí)踐;2011年12期
10 趙娟;;淺析啟發(fā)式教學(xué)法在《算法分析與設(shè)計》課程中的應(yīng)用[J];福建電腦;2012年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 俞洋;田亞菲;;一種新的變步長LMS算法及其仿真[A];通信理論與信號處理新進(jìn)展——2005年通信理論與信號處理年會論文集[C];2005年
2 周顥;劉振華;趙保華;;構(gòu)造型的D~2FA生成算法[A];中國通信學(xué)會通信軟件技術(shù)委員會2009年學(xué)術(shù)會議論文集[C];2009年
3 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(一)[C];2008年
4 劉遠(yuǎn)新;鄧飛其;羅艷輝;舒添慧;;ERP柔性平臺下物流運(yùn)輸配送系統(tǒng)算法分析[A];第二十六屆中國控制會議論文集[C];2007年
5 王樹西;白碩;姜吉發(fā);;模式合一的“減首去尾”算法[A];第二屆全國學(xué)生計算語言學(xué)研討會論文集[C];2004年
6 王萬青;張曉輝;;改進(jìn)的A~*算法的高效實(shí)現(xiàn)[A];2009全國測繪科技信息交流會暨首屆測繪博客征文頒獎?wù)撐募痆C];2009年
7 孫煥良;邱菲;劉俊嶺;朱葉麗;;IncSNN——一種基于密度的增量聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
8 韓建民;岑婷婷;于娟;;實(shí)現(xiàn)敏感屬性l-多樣性的l-MDAV算法[A];第二十七屆中國控制會議論文集[C];2008年
9 張悅;尤楓;趙瑞蓮;;利用蟻群算法實(shí)現(xiàn)基于程序結(jié)構(gòu)的主變元分析[A];第五屆中國測試學(xué)術(shù)會議論文集[C];2008年
10 王旭東;劉渝;鄧振淼;;正弦波頻率估計的修正Rife算法及其FPGA實(shí)現(xiàn)[A];全國第十屆信號與信息處理、第四屆DSP應(yīng)用技術(shù)聯(lián)合學(xué)術(shù)會議論文集[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 科文;VIXD算法分析Web異常[N];中國計算機(jī)報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 魏哲學(xué);樣本斷點(diǎn)距離問題的算法與復(fù)雜性研究[D];山東大學(xué);2015年
2 劉春明;基于增強(qiáng)學(xué)習(xí)和車輛動力學(xué)的高速公路自主駕駛研究[D];國防科學(xué)技術(shù)大學(xué);2014年
3 張敏霞;生物地理學(xué)優(yōu)化算法及其在應(yīng)急交通規(guī)劃中的應(yīng)用研究[D];浙江工業(yè)大學(xué);2015年
4 李紅;流程挖掘算法研究[D];云南大學(xué);2015年
5 盛歆漪;粒子群優(yōu)化算法及其應(yīng)用研究[D];江南大學(xué);2015年
6 黃磊;高動態(tài)環(huán)境捷聯(lián)慣導(dǎo)信號處理及高精度姿態(tài)速度算法研究[D];南京航空航天大學(xué);2015年
7 劉新旺;多核學(xué)習(xí)算法研究[D];國防科學(xué)技術(shù)大學(xué);2013年
8 于濱;城市公交系統(tǒng)模型與算法研究[D];大連理工大學(xué);2006年
9 曾國強(qiáng);改進(jìn)的極值優(yōu)化算法及其在組合優(yōu)化問題中的應(yīng)用研究[D];浙江大學(xué);2011年
10 肖永豪;蜂群算法及在圖像處理中的應(yīng)用研究[D];華南理工大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 黃廈;基于改進(jìn)蟻群算法的柔性作業(yè)車間調(diào)度問題研究[D];昆明理工大學(xué);2015年
2 李平;基于Hadoop的信息爬取與輿情檢測算法研究[D];昆明理工大學(xué);2015年
3 趙官寶;基于位表的關(guān)聯(lián)規(guī)則挖掘算法研究[D];昆明理工大學(xué);2015年
4 殷文華;移動容遲網(wǎng)絡(luò)中基于社會感知的多播分發(fā)算法研究[D];內(nèi)蒙古大學(xué);2015年
5 徐翔燕;人工魚群優(yōu)化算法及其應(yīng)用研究[D];西南交通大學(xué);2015年
6 李德福;基于小世界模型的啟發(fā)式尋路算法研究[D];華中師范大學(xué);2015年
7 鄭海彬;一種面向MAPREDUCE的DATASHUFFLE的優(yōu)化方法[D];蘇州大學(xué);2015年
8 趙曉寒;輪換步長PSO算法及SMVSC參數(shù)優(yōu)化[D];沈陽理工大學(xué);2015年
9 安豐洋;基于無線網(wǎng)絡(luò)的廣播算法研究[D];曲阜師范大學(xué);2015年
10 李智明;基于改進(jìn)FastICA算法的混合語音盲分離[D];上海交通大學(xué);2015年
,本文編號:544074
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/544074.html