基于專家的特征選擇及缺省多標(biāo)記學(xué)習(xí)策略
發(fā)布時(shí)間:2023-06-02 03:17
多標(biāo)記學(xué)習(xí)是機(jī)器學(xué)習(xí)中的一個(gè)研究熱點(diǎn),在個(gè)性化推薦、文本分類、生物學(xué)等領(lǐng)域引起了廣泛關(guān)注。較之傳統(tǒng)的單標(biāo)記學(xué)習(xí)中的一個(gè)實(shí)例只能局限于單個(gè)標(biāo)記,對(duì)于多標(biāo)記學(xué)習(xí),每個(gè)實(shí)例可以同時(shí)具有多個(gè)標(biāo)記。多標(biāo)記學(xué)習(xí)的目的是得到一個(gè)高性能的分類模型,它可以對(duì)于任何新實(shí)例預(yù)測(cè)出其可能的標(biāo)記集。在多標(biāo)記學(xué)習(xí)問題中,對(duì)于特征空間,由于海量數(shù)據(jù)中維度過高等問題,經(jīng)常發(fā)生維數(shù)災(zāi)難,從而導(dǎo)致分類精度的降低。然而,可通過特征選擇方法實(shí)現(xiàn)特征空間的降維,進(jìn)而提升分類精度和泛化性能。對(duì)于標(biāo)記空間,由于數(shù)據(jù)獲取中其方法和成本限制等原因,部分?jǐn)?shù)據(jù)丟失等現(xiàn)象經(jīng)常出現(xiàn),從而導(dǎo)致標(biāo)記的部分缺省;诖,本文針對(duì)這兩個(gè)問題提出兩種處理算法,主要內(nèi)容如下:(1)對(duì)于特征空間的維度過高的問題,多數(shù)特征選擇算法主要利用最大相關(guān)性最小冗余性準(zhǔn)則在全部特征集中進(jìn)行特征選擇,沒有考慮專家特征,因此多標(biāo)記特征選擇算法運(yùn)行時(shí)間較長,復(fù)雜度較高。實(shí)際上,在現(xiàn)實(shí)生活中專家依據(jù)幾個(gè)或者多個(gè)關(guān)鍵特征就能夠直接決定整體的預(yù)測(cè)方向。如果提取關(guān)注這些信息,必將減少特征選擇計(jì)算時(shí)間,甚至提升分類器性能。基于此,提出一種基于專家特征的條件互信息多標(biāo)記特征選擇算法。該...
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和現(xiàn)狀
1.2 論文內(nèi)容及組織結(jié)構(gòu)
1.2.1 本文的研究內(nèi)容
1.2.2 全文的組織結(jié)構(gòu)安排
1.3 本章總結(jié)
第二章 多標(biāo)記學(xué)習(xí)框架及相關(guān)知識(shí)
2.1 多標(biāo)記學(xué)習(xí)
2.1.1 多標(biāo)記學(xué)習(xí)框架
2.1.2 多標(biāo)記學(xué)習(xí)評(píng)價(jià)指標(biāo)
2.2 特征選擇
2.3 互信息
2.4 多標(biāo)記核極限學(xué)習(xí)機(jī)
2.5 本章小結(jié)
第三章 基于專家特征的多標(biāo)記特征選擇
3.1 概述
3.2 基于專家特征的條件互信息計(jì)算模型
3.3 實(shí)驗(yàn)結(jié)果和分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)與環(huán)境描述
3.3.2 算法選擇與相關(guān)參數(shù)設(shè)置
3.3.3 實(shí)驗(yàn)結(jié)果和分析
3.4 本章小結(jié)
第四章 基于二級(jí)自編碼器的非平衡化缺省多標(biāo)記學(xué)習(xí)
4.1 概述
4.2 二級(jí)自編碼器的多標(biāo)記缺損補(bǔ)全
4.2.1 聯(lián)合分類間隔面的非平衡化標(biāo)記補(bǔ)全算法
4.2.2 二級(jí)自編碼核極限學(xué)習(xí)機(jī)多標(biāo)記算法
4.3 實(shí)驗(yàn)設(shè)置
4.3.1 實(shí)驗(yàn)數(shù)據(jù)集描述
4.3.2 算法選擇與相關(guān)參數(shù)設(shè)置
4.4 實(shí)驗(yàn)結(jié)果和分析
4.4.1 全標(biāo)記實(shí)驗(yàn)結(jié)果及分析
4.4.2 缺省標(biāo)記實(shí)驗(yàn)結(jié)果及分析
4.5 本章小結(jié)
第五章 電信套餐推薦中的應(yīng)用
5.1 概述
5.2 數(shù)據(jù)預(yù)處理和特征選擇
5.3 應(yīng)用實(shí)現(xiàn)
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 下一步工作展望
致謝
參考文獻(xiàn)
附錄:讀研期間科研情況
本文編號(hào):3827558
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和現(xiàn)狀
1.2 論文內(nèi)容及組織結(jié)構(gòu)
1.2.1 本文的研究內(nèi)容
1.2.2 全文的組織結(jié)構(gòu)安排
1.3 本章總結(jié)
第二章 多標(biāo)記學(xué)習(xí)框架及相關(guān)知識(shí)
2.1 多標(biāo)記學(xué)習(xí)
2.1.1 多標(biāo)記學(xué)習(xí)框架
2.1.2 多標(biāo)記學(xué)習(xí)評(píng)價(jià)指標(biāo)
2.2 特征選擇
2.3 互信息
2.4 多標(biāo)記核極限學(xué)習(xí)機(jī)
2.5 本章小結(jié)
第三章 基于專家特征的多標(biāo)記特征選擇
3.1 概述
3.2 基于專家特征的條件互信息計(jì)算模型
3.3 實(shí)驗(yàn)結(jié)果和分析
3.3.1 實(shí)驗(yàn)數(shù)據(jù)與環(huán)境描述
3.3.2 算法選擇與相關(guān)參數(shù)設(shè)置
3.3.3 實(shí)驗(yàn)結(jié)果和分析
3.4 本章小結(jié)
第四章 基于二級(jí)自編碼器的非平衡化缺省多標(biāo)記學(xué)習(xí)
4.1 概述
4.2 二級(jí)自編碼器的多標(biāo)記缺損補(bǔ)全
4.2.1 聯(lián)合分類間隔面的非平衡化標(biāo)記補(bǔ)全算法
4.2.2 二級(jí)自編碼核極限學(xué)習(xí)機(jī)多標(biāo)記算法
4.3 實(shí)驗(yàn)設(shè)置
4.3.1 實(shí)驗(yàn)數(shù)據(jù)集描述
4.3.2 算法選擇與相關(guān)參數(shù)設(shè)置
4.4 實(shí)驗(yàn)結(jié)果和分析
4.4.1 全標(biāo)記實(shí)驗(yàn)結(jié)果及分析
4.4.2 缺省標(biāo)記實(shí)驗(yàn)結(jié)果及分析
4.5 本章小結(jié)
第五章 電信套餐推薦中的應(yīng)用
5.1 概述
5.2 數(shù)據(jù)預(yù)處理和特征選擇
5.3 應(yīng)用實(shí)現(xiàn)
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 下一步工作展望
致謝
參考文獻(xiàn)
附錄:讀研期間科研情況
本文編號(hào):3827558
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3827558.html
最近更新
教材專著