基于k近鄰多標(biāo)簽學(xué)習(xí)的數(shù)據(jù)降維算法的研究
發(fā)布時間:2017-09-16 00:34
本文關(guān)鍵詞:基于k近鄰多標(biāo)簽學(xué)習(xí)的數(shù)據(jù)降維算法的研究
更多相關(guān)文章: PCAI算法 距離加權(quán) 信息容忍度 MRF-mRMR算法
【摘要】:隨著“互聯(lián)網(wǎng)+”發(fā)展,與人們生活息息相關(guān)的多標(biāo)簽數(shù)據(jù)將會大量產(chǎn)生。由于多標(biāo)簽學(xué)習(xí)過程中需要考慮屬性特征與多個標(biāo)簽、標(biāo)簽之間的相關(guān)性,從而使得多標(biāo)簽學(xué)習(xí)在分類和降維方面比單標(biāo)簽學(xué)習(xí)更為復(fù)雜、更具挑戰(zhàn)性。自上世紀(jì)九十年代末多標(biāo)簽學(xué)習(xí)的概念提出以來,吸引了眾多專家學(xué)者的關(guān)注。多標(biāo)簽學(xué)習(xí)的研究成果如雨后春筍,主要集中在分類和降維兩個研究方向。數(shù)據(jù)降維是機(jī)器學(xué)習(xí)中的重要步驟,是提高數(shù)據(jù)分類性能的重要手段。本文提出了PCAI和MRF-mRMR兩種數(shù)據(jù)降維算法。PCAI算法與原有算法相比,分類效果明顯提升;MRF-mRMR算法在去除冗余屬性特征的同時還能保持屬性特征與標(biāo)簽之間的相關(guān)性。本文對多標(biāo)簽學(xué)習(xí)的研究可以分為兩部分。第一部分提出了基于PCA算法的PCAI數(shù)據(jù)降維算法,并利用ML-kNN分類器對數(shù)據(jù)分類。首先,提出了信息容忍度的概念,并定義了其計(jì)算公式,同時對公式中的參數(shù)取值范圍做了實(shí)驗(yàn)探討;其次,得到數(shù)據(jù)降維后的特征值,并將特征值得應(yīng)用到ML-kNN分類器中對距離的加權(quán)上;最后,將降維后的數(shù)據(jù)集應(yīng)用到改進(jìn)后的ML-kNN分類器中驗(yàn)證降維效果。第二部分講述了Relief算法和mRMR算法,一方面對Relief算法中屬性特征權(quán)重的計(jì)算方式進(jìn)行改進(jìn),另一方面提出了MRF-mRMR組合特征選擇算法。提出的MRF-mRMR算法既保持了mRMR算法最大相關(guān)和最小冗余的優(yōu)勢,又擁有Relief算法對每個屬性特征加權(quán)排序的優(yōu)點(diǎn)。實(shí)驗(yàn)結(jié)果表明,MRF-mRMR組合算法的降維效果明顯優(yōu)于已有算法。綜上所述,本文提出了PCAI和MRF-mMMR兩種降維算法,并以ML-kNN為分類器驗(yàn)證降維效果。實(shí)驗(yàn)結(jié)果表明,數(shù)據(jù)降維效果明顯,且數(shù)據(jù)分類效果也有所提升。
【關(guān)鍵詞】:PCAI算法 距離加權(quán) 信息容忍度 MRF-mRMR算法
【學(xué)位授予單位】:閩南師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要5-6
- Abstract6-10
- 第1章 緒論10-16
- 1.1 研究背景及意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀分析11-14
- 1.2.1 多標(biāo)簽數(shù)據(jù)降維研究現(xiàn)狀12-13
- 1.2.2 多標(biāo)簽數(shù)據(jù)分類研究現(xiàn)狀13-14
- 1.3 本文的主要內(nèi)容和組織結(jié)構(gòu)14-16
- 1.3.1 主要內(nèi)容14-15
- 1.3.2 組織結(jié)構(gòu)15-16
- 第2章 背景知識16-26
- 2.1 多標(biāo)簽學(xué)習(xí)分類16-20
- 2.1.1 問題轉(zhuǎn)換17-19
- 2.1.2 算法改進(jìn)19-20
- 2.2 維數(shù)約簡20-22
- 2.2.1 特征選擇21
- 2.2.2 特征提取21-22
- 2.3 評價指標(biāo)22-23
- 2.4 本章小結(jié)23-26
- 第3章 PCAI數(shù)據(jù)降維算法的研究26-44
- 3.1 相關(guān)知識26-30
- 3.1.1 ML-kNN算法27-29
- 3.1.2 PCA算法29-30
- 3.2 PCAIML算法30-33
- 3.2.1 PCAI算法30-32
- 3.2.2 距離加權(quán)32-33
- 3.2.3 PCAIML算法偽代碼33
- 3.3 信息容忍度分析33-39
- 3.3.1 實(shí)驗(yàn)數(shù)據(jù)34
- 3.3.2 比較方法及參數(shù)說明34-35
- 3.3.3 信息容忍度取值分析35-39
- 3.4 實(shí)驗(yàn)數(shù)據(jù)及結(jié)果分析39-43
- 3.4.1 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)說明39
- 3.4.2 實(shí)驗(yàn)結(jié)果分析39-43
- 3.5 本章小結(jié)43-44
- 第4章 MRF-mRMR組合特征選擇算法44-54
- 4.1 相關(guān)知識44-47
- 4.1.1 Relief特征選擇算法45-46
- 4.1.2 mRMR特征選擇算法46-47
- 4.2 MRF-mRMR組合特征選擇算法47-49
- 4.2.1 MRelief特征選擇算法47-48
- 4.2.2 MRF-mRMR特征選擇算法48-49
- 4.3 實(shí)驗(yàn)結(jié)果及分析49-53
- 4.3.1 實(shí)驗(yàn)數(shù)據(jù)及參數(shù)說明49-50
- 4.3.2 實(shí)驗(yàn)結(jié)果分析50-53
- 4.4 本章小結(jié)53-54
- 第5章 總結(jié)與展望54-56
- 5.1 工作總結(jié)54-55
- 5.2 進(jìn)一步展望55-56
- 參考文獻(xiàn)56-64
- 致謝64-66
- 攻讀學(xué)位期間所發(fā)表的學(xué)術(shù)論文及所參加項(xiàng)目66
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊玉平;向華;;對人臉識別特征數(shù)據(jù)降維算法的優(yōu)化[J];重慶電子工程職業(yè)學(xué)院學(xué)報(bào);2012年01期
2 張國印;樓宋江;王慶軍;程慧杰;;一種基于局部和判別特性的降維算法[J];計(jì)算機(jī)應(yīng)用研究;2009年09期
3 李燕燕;閆德勤;劉勝藍(lán);;基于密度刻畫的降維算法[J];計(jì)算機(jī)工程;2011年21期
4 王立鵬;袁占亭;陳旭輝;周智芳;;基于非線性降維算法的膜蛋白類型識別[J];微計(jì)算機(jī)信息;2010年10期
5 吳正寅;薛安榮;李明;;基于權(quán)值的局部保持半監(jiān)督降維算法[J];計(jì)算機(jī)應(yīng)用研究;2011年04期
6 宋欣;葉世偉;;基于直接估計(jì)梯度思想的數(shù)據(jù)降維算法[J];計(jì)算機(jī)工程;2008年08期
7 劉勝藍(lán);閆德勤;;一種新的全局嵌入降維算法[J];自動化學(xué)報(bào);2011年07期
8 王萬良;陳e,
本文編號:859869
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/859869.html
最近更新
教材專著