數(shù)據(jù)維數(shù)約簡(jiǎn)及分類(lèi)算法研究
本文關(guān)鍵詞:數(shù)據(jù)維數(shù)約簡(jiǎn)及分類(lèi)算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息技術(shù)的發(fā)展,涌現(xiàn)出海量數(shù)據(jù),推動(dòng)了機(jī)器學(xué)習(xí)理論不斷地向前發(fā)展。樣本數(shù)據(jù)維數(shù)越高,數(shù)據(jù)存儲(chǔ)越困難,同時(shí)數(shù)據(jù)的計(jì)算量也越大;此外,數(shù)據(jù)中還存在著噪聲或者冗余特征。因此,如何降低高維數(shù)據(jù)的維數(shù),避免“維數(shù)災(zāi)難”問(wèn)題,提高數(shù)據(jù)的分類(lèi)精度,已經(jīng)成為機(jī)器學(xué)習(xí)領(lǐng)域關(guān)注的一個(gè)熱點(diǎn)問(wèn)題。非負(fù)矩陣分解作為一種矩陣分解算法,約束待分解矩陣中和因式分解獲得的矩陣中所有的元素為非負(fù)。這種非負(fù)性約束具有明確的物理意義,使得非負(fù)矩陣分解作為一種維數(shù)約簡(jiǎn)算法得到了廣泛關(guān)注。同時(shí),半監(jiān)督學(xué)習(xí)(semi-supervised learning)由于能夠同時(shí)利用少量的已知標(biāo)記樣本和大量未標(biāo)記樣本數(shù)據(jù)進(jìn)行有效的學(xué)習(xí),大大克服了有監(jiān)督學(xué)習(xí)算法中樣本數(shù)量不足問(wèn)題,提高了分類(lèi)的精度,因而半監(jiān)督學(xué)習(xí)方法在圖像分類(lèi)、文本分類(lèi)及郵件分類(lèi)等問(wèn)題中得到了普遍的運(yùn)用。論文集成基于非負(fù)矩陣分解的維數(shù)約簡(jiǎn)算法和基于半監(jiān)督學(xué)習(xí)的分類(lèi)算法,首先提出了一種基于非負(fù)矩陣分解與一致性學(xué)習(xí)的半監(jiān)督學(xué)習(xí)算法。然后,在非負(fù)矩陣分解過(guò)程中引入類(lèi)別信息,提出了一種基于約束非負(fù)矩陣分解與一致性學(xué)習(xí)的半監(jiān)督分類(lèi)算法。該算法在降維過(guò)程中引入少量已知標(biāo)簽類(lèi)別信息作為約束條件,增強(qiáng)數(shù)據(jù)降維后的特征表示能力。最后,引入類(lèi)別之間的依賴性,提出了一種基于構(gòu)建類(lèi)別圖的維數(shù)約減的半監(jiān)督學(xué)習(xí)算法。該算法分別在樣本與樣本之間、類(lèi)與類(lèi)之間創(chuàng)建圖,構(gòu)建基于圖的正則化框架,再通過(guò)求解Sylvester方程得到未標(biāo)記樣本的標(biāo)簽。在公開(kāi)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,論文算法在充分利用少量已知標(biāo)簽的同時(shí)用于數(shù)據(jù)的維數(shù)約簡(jiǎn),不僅能有效地降低了數(shù)據(jù)的維度,還能夠有效地提高分類(lèi)器的泛化能力。
【關(guān)鍵詞】:機(jī)器學(xué)習(xí) 維數(shù)災(zāi)難 維數(shù)約簡(jiǎn) 半監(jiān)督學(xué)習(xí) Sylvester方程
【學(xué)位授予單位】:遼寧工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:O151.21;TP18
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-17
- 1.1 研究背景與意義8-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-15
- 1.2.1 維數(shù)約簡(jiǎn)研究現(xiàn)狀10-13
- 1.2.2 數(shù)據(jù)分類(lèi)研究現(xiàn)狀13-15
- 1.3 論文的主要工作和結(jié)構(gòu)安排15-17
- 1.3.1 論文的主要工作15
- 1.3.2 論文的組織結(jié)構(gòu)15-17
- 2 維數(shù)約簡(jiǎn)與半監(jiān)督學(xué)習(xí)概況17-30
- 2.1 維數(shù)約簡(jiǎn)17-23
- 2.2 半監(jiān)督學(xué)習(xí)的基本知識(shí)23-25
- 2.2.1 半監(jiān)督學(xué)習(xí)基本思想及其未標(biāo)記數(shù)據(jù)的作用23-24
- 2.2.2 半監(jiān)督學(xué)習(xí)假設(shè)24-25
- 2.3 基于圖的半監(jiān)督學(xué)習(xí)25-29
- 2.3.1 基于圖的半監(jiān)督學(xué)習(xí)框架25-26
- 2.3.2 基于圖的半監(jiān)督分類(lèi)算法26-27
- 2.3.3 基于圖的半監(jiān)督學(xué)習(xí)算法27-29
- 2.4 本章小結(jié)29-30
- 3 基于非負(fù)矩陣分解和一致性學(xué)習(xí)的半監(jiān)督分類(lèi)算法30-40
- 3.1 非負(fù)矩陣分解30-34
- 3.1.1 非負(fù)矩陣分解原理30-32
- 3.1.2 非負(fù)矩陣分解算法收斂性證明32-34
- 3.2 基于NMF和一致性學(xué)習(xí)半監(jiān)督分類(lèi)算法34-36
- 3.3 實(shí)驗(yàn)結(jié)果與分析36-39
- 3.3.1 評(píng)價(jià)指標(biāo)36
- 3.3.2 數(shù)據(jù)集與參數(shù)選擇36-37
- 3.3.3 分類(lèi)結(jié)果及分析37-39
- 3.4 本章小結(jié)39-40
- 4 基于約束非負(fù)矩陣分解和一致性學(xué)習(xí)的半監(jiān)督分類(lèi)算法40-52
- 4.1 約束非負(fù)矩陣分解40-45
- 4.1.1 約束非負(fù)矩陣分解原理40-42
- 4.1.2 約束非負(fù)矩陣分解算法收斂性證明42-45
- 4.2 基于CNMF和一致性學(xué)習(xí)的半監(jiān)督分類(lèi)算法45-48
- 4.3 實(shí)驗(yàn)結(jié)果與分析48-51
- 4.3.1 數(shù)據(jù)集與參數(shù)選擇48-49
- 4.3.2 分類(lèi)結(jié)果及分析49-51
- 4.5 本章小結(jié)51-52
- 5 基于構(gòu)建類(lèi)別圖的維數(shù)約簡(jiǎn)半監(jiān)督學(xué)習(xí)52-58
- 5.1 基于類(lèi)別圖的結(jié)構(gòu)框架52-55
- 5.2 基于構(gòu)建類(lèi)別圖的維數(shù)約簡(jiǎn)半監(jiān)督學(xué)習(xí)55-56
- 5.3 實(shí)驗(yàn)結(jié)果及分析56-57
- 5.3.1 評(píng)價(jià)指標(biāo)56
- 5.3.2 數(shù)據(jù)集與參數(shù)選擇56
- 5.3.3 分類(lèi)結(jié)果及分析56-57
- 5.4 本章小結(jié)57-58
- 6 總結(jié)與展望58-60
- 6.1 總結(jié)58
- 6.2 展望58-60
- 參考文獻(xiàn)60-63
- 攻讀碩士期間發(fā)表學(xué)術(shù)論文情況63-64
- 致謝64
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 陳威;;幾種維數(shù)約簡(jiǎn)方法在人臉識(shí)別中的比較研究[J];甘肅聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
2 ;[J];;年期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 陳偉福;馮國(guó)燦;;局部光滑主成分分析[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
2 孫濤;劉靜;劉青山;盧漢清;;半監(jiān)督譜判別式分析[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 侯臣平;基于圖優(yōu)化框架的數(shù)據(jù)維數(shù)約簡(jiǎn)方法及應(yīng)用研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年
2 何力;維數(shù)約簡(jiǎn)中的若干問(wèn)題[D];復(fù)旦大學(xué);2010年
3 殷飛;基于稀疏學(xué)習(xí)的圖像維數(shù)約簡(jiǎn)和目標(biāo)識(shí)別方法研究[D];西安電子科技大學(xué);2014年
4 朱麟;基于圖的嵌入和維數(shù)約簡(jiǎn)方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 周勇;數(shù)據(jù)維數(shù)約簡(jiǎn)及分類(lèi)算法研究[D];遼寧工業(yè)大學(xué);2016年
2 周斯斯;譜聚類(lèi)維數(shù)約簡(jiǎn)算法研究與應(yīng)用[D];西安電子科技大學(xué);2010年
3 胡奎;兩種針對(duì)張量數(shù)據(jù)和多視圖數(shù)據(jù)的半監(jiān)督維數(shù)約簡(jiǎn)方法[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
4 譚龍;基于近似零范數(shù)和無(wú)窮范數(shù)的維數(shù)約簡(jiǎn)[D];天津大學(xué);2014年
本文關(guān)鍵詞:數(shù)據(jù)維數(shù)約簡(jiǎn)及分類(lèi)算法研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):287651
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/287651.html