基于自我表述的學(xué)習(xí)方法的研究
發(fā)布時(shí)間:2021-05-13 18:23
在高維數(shù)據(jù)中,許多樣本存在冗余或者不相關(guān)的特征,冗余特征的存在會(huì)降低算法的效率,不相關(guān)特征的存在會(huì)對(duì)學(xué)習(xí)算法的效果造成一定的影響。特征選擇能給算法帶來很多好處,如降低計(jì)算代價(jià)、提高效率、增強(qiáng)泛化能力等。而在數(shù)據(jù)樣本不斷增大的同時(shí),數(shù)據(jù)的標(biāo)注結(jié)構(gòu)復(fù)雜程度也在不斷增大。雖然多標(biāo)記學(xué)習(xí)現(xiàn)在已經(jīng)能夠處理大量的標(biāo)記多義性問題,但現(xiàn)實(shí)世界中還有著許多需要反映每個(gè)標(biāo)記對(duì)實(shí)例準(zhǔn)確描述程度的數(shù)據(jù),即標(biāo)記分布型數(shù)據(jù)。針對(duì)以上的數(shù)據(jù)問題,本文將自我表述思想應(yīng)用到學(xué)習(xí)過程中,分別提出基于自我表述的兩種學(xué)習(xí)方法:(1)針對(duì)存在大量冗余特征和不相關(guān)特征的無標(biāo)記數(shù)據(jù),提出基于自我表述依賴度量的無監(jiān)督特征選擇方法(DMSR)。該算法首先定義特征的性能依賴于原始數(shù)據(jù)的自我表述依賴度量原則,即投影后的低維空間數(shù)據(jù)越依賴于原始數(shù)據(jù),則該低維空間越好。然后通過依賴最大化,使投影到低維空間后的數(shù)據(jù)盡可能保持原始數(shù)據(jù)的特征信息,據(jù)此對(duì)原始數(shù)據(jù)進(jìn)行降維。獲得可靠的低維數(shù)據(jù)后,引入稀疏表示技術(shù)進(jìn)行特征選擇。最后,在4個(gè)公開的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),并與3種已有的無監(jiān)督特征選擇算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果表明提出的DMSR特征選擇方法是有效的。(...
【文章來源】:閩南師范大學(xué)福建省
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇的研究現(xiàn)狀
1.2.2 標(biāo)記分布學(xué)習(xí)的研究現(xiàn)狀
1.3 本文主要內(nèi)容和組織結(jié)構(gòu)
1.3.1 本文主要工作
1.3.2 本文組織結(jié)構(gòu)
第2章 背景知識(shí)
2.1 特征選擇
2.1.1 有監(jiān)督特征選擇
2.1.2 無監(jiān)督特征選擇
2.1.3 無監(jiān)督特征選擇算法
2.2 標(biāo)記分布學(xué)習(xí)
2.2.1 多標(biāo)記與標(biāo)記分布
2.2.2 標(biāo)記分布學(xué)習(xí)形式化
2.2.3 標(biāo)記分布學(xué)習(xí)算法
2.3 本章小結(jié)
第3章 基于自我表述依賴度量的無監(jiān)督特征選擇方法
3.1 依賴度量
3.1.1 依賴度量理論
3.1.2 基于自我表述的依賴度量
3.2 自我表述依賴最大化特征選擇方法
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 評(píng)價(jià)指標(biāo)
3.3.2 實(shí)驗(yàn)設(shè)置
3.3.3 實(shí)驗(yàn)結(jié)果分析
3.4 本章小結(jié)
第4章 基于樣本自我表述的標(biāo)記分布學(xué)習(xí)方法
4.1 標(biāo)記分布問題
4.2 模型提出
4.3 模型優(yōu)化和算法步驟
4.3.1 聯(lián)合L2范數(shù)的自我表述
4.3.2 聯(lián)合L2,1-范數(shù)的自我表述
4.4 實(shí)驗(yàn)與結(jié)果分析
4.4.1 評(píng)價(jià)指標(biāo)
4.4.2 實(shí)驗(yàn)設(shè)置
4.4.3 實(shí)驗(yàn)結(jié)果分析
4.4.4 參數(shù)分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間取得的科研成果
【參考文獻(xiàn)】:
期刊論文
[1]聯(lián)合依賴最大化與稀疏表示的無監(jiān)督特征選擇方法[J]. 李嬋,楊文元,趙紅. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2017(04)
[2]應(yīng)用k-means算法實(shí)現(xiàn)標(biāo)記分布學(xué)習(xí)[J]. 邵東恒,楊文元,趙紅. 智能系統(tǒng)學(xué)報(bào). 2017(03)
[3]面向標(biāo)記分布學(xué)習(xí)的標(biāo)記增強(qiáng)[J]. 耿新,徐寧,邵瑞楓. 計(jì)算機(jī)研究與發(fā)展. 2017(06)
[4]Control 5.0: From Newton to Merton in Popper’s Cyber-Social-Physical Spaces[J]. Fei-Yue Wang. IEEE/CAA Journal of Automatica Sinica. 2016(03)
[5]標(biāo)記分布學(xué)習(xí)中目標(biāo)函數(shù)的選擇[J]. 趙權(quán),耿新. 計(jì)算機(jī)科學(xué)與探索. 2017(05)
[6]基于隨機(jī)投影的正交判別流形學(xué)習(xí)算法[J]. 馬麗,董唯光,梁金平,張曉東. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2016(01)
[7]L1-L2范數(shù)聯(lián)合約束的魯棒目標(biāo)跟蹤[J]. 孔繁鏘,王丹丹,沈秋. 儀器儀表學(xué)報(bào). 2016(03)
[8]基于低秩評(píng)分的非監(jiān)督特征選擇算法[J]. 謝乃俊,楊國亮,羅璐,梁禮明. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(06)
[9]基于局部保持投影和稀疏表示的無監(jiān)督特征選擇方法[J]. 簡彩仁,陳曉云. 模式識(shí)別與人工智能. 2015(03)
[10]一種基于特征聚類的特征選擇方法[J]. 王連喜,蔣盛益. 計(jì)算機(jī)應(yīng)用研究. 2015(05)
博士論文
[1]大數(shù)據(jù)處理技術(shù)與系統(tǒng)研究[D]. 顧榮.南京大學(xué) 2016
碩士論文
[1]標(biāo)記分布學(xué)習(xí)若干問題研究[D]. 趙權(quán).東南大學(xué) 2016
[2]機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[D]. 李運(yùn).北京郵電大學(xué) 2015
[3]最大相關(guān)最小冗余的無監(jiān)督特征選擇算法的研究及其應(yīng)用[D]. 劉榮燁.中國海洋大學(xué) 2010
[4]多元線性模型與嶺回歸分析[D]. 何秀麗.華中科技大學(xué) 2005
本文編號(hào):3184493
【文章來源】:閩南師范大學(xué)福建省
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇的研究現(xiàn)狀
1.2.2 標(biāo)記分布學(xué)習(xí)的研究現(xiàn)狀
1.3 本文主要內(nèi)容和組織結(jié)構(gòu)
1.3.1 本文主要工作
1.3.2 本文組織結(jié)構(gòu)
第2章 背景知識(shí)
2.1 特征選擇
2.1.1 有監(jiān)督特征選擇
2.1.2 無監(jiān)督特征選擇
2.1.3 無監(jiān)督特征選擇算法
2.2 標(biāo)記分布學(xué)習(xí)
2.2.1 多標(biāo)記與標(biāo)記分布
2.2.2 標(biāo)記分布學(xué)習(xí)形式化
2.2.3 標(biāo)記分布學(xué)習(xí)算法
2.3 本章小結(jié)
第3章 基于自我表述依賴度量的無監(jiān)督特征選擇方法
3.1 依賴度量
3.1.1 依賴度量理論
3.1.2 基于自我表述的依賴度量
3.2 自我表述依賴最大化特征選擇方法
3.3 實(shí)驗(yàn)與結(jié)果分析
3.3.1 評(píng)價(jià)指標(biāo)
3.3.2 實(shí)驗(yàn)設(shè)置
3.3.3 實(shí)驗(yàn)結(jié)果分析
3.4 本章小結(jié)
第4章 基于樣本自我表述的標(biāo)記分布學(xué)習(xí)方法
4.1 標(biāo)記分布問題
4.2 模型提出
4.3 模型優(yōu)化和算法步驟
4.3.1 聯(lián)合L2范數(shù)的自我表述
4.3.2 聯(lián)合L2,1-范數(shù)的自我表述
4.4 實(shí)驗(yàn)與結(jié)果分析
4.4.1 評(píng)價(jià)指標(biāo)
4.4.2 實(shí)驗(yàn)設(shè)置
4.4.3 實(shí)驗(yàn)結(jié)果分析
4.4.4 參數(shù)分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間取得的科研成果
【參考文獻(xiàn)】:
期刊論文
[1]聯(lián)合依賴最大化與稀疏表示的無監(jiān)督特征選擇方法[J]. 李嬋,楊文元,趙紅. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2017(04)
[2]應(yīng)用k-means算法實(shí)現(xiàn)標(biāo)記分布學(xué)習(xí)[J]. 邵東恒,楊文元,趙紅. 智能系統(tǒng)學(xué)報(bào). 2017(03)
[3]面向標(biāo)記分布學(xué)習(xí)的標(biāo)記增強(qiáng)[J]. 耿新,徐寧,邵瑞楓. 計(jì)算機(jī)研究與發(fā)展. 2017(06)
[4]Control 5.0: From Newton to Merton in Popper’s Cyber-Social-Physical Spaces[J]. Fei-Yue Wang. IEEE/CAA Journal of Automatica Sinica. 2016(03)
[5]標(biāo)記分布學(xué)習(xí)中目標(biāo)函數(shù)的選擇[J]. 趙權(quán),耿新. 計(jì)算機(jī)科學(xué)與探索. 2017(05)
[6]基于隨機(jī)投影的正交判別流形學(xué)習(xí)算法[J]. 馬麗,董唯光,梁金平,張曉東. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2016(01)
[7]L1-L2范數(shù)聯(lián)合約束的魯棒目標(biāo)跟蹤[J]. 孔繁鏘,王丹丹,沈秋. 儀器儀表學(xué)報(bào). 2016(03)
[8]基于低秩評(píng)分的非監(jiān)督特征選擇算法[J]. 謝乃俊,楊國亮,羅璐,梁禮明. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(06)
[9]基于局部保持投影和稀疏表示的無監(jiān)督特征選擇方法[J]. 簡彩仁,陳曉云. 模式識(shí)別與人工智能. 2015(03)
[10]一種基于特征聚類的特征選擇方法[J]. 王連喜,蔣盛益. 計(jì)算機(jī)應(yīng)用研究. 2015(05)
博士論文
[1]大數(shù)據(jù)處理技術(shù)與系統(tǒng)研究[D]. 顧榮.南京大學(xué) 2016
碩士論文
[1]標(biāo)記分布學(xué)習(xí)若干問題研究[D]. 趙權(quán).東南大學(xué) 2016
[2]機(jī)器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[D]. 李運(yùn).北京郵電大學(xué) 2015
[3]最大相關(guān)最小冗余的無監(jiān)督特征選擇算法的研究及其應(yīng)用[D]. 劉榮燁.中國海洋大學(xué) 2010
[4]多元線性模型與嶺回歸分析[D]. 何秀麗.華中科技大學(xué) 2005
本文編號(hào):3184493
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3184493.html
最近更新
教材專著