增廣信息學(xué)習(xí)
發(fā)布時(shí)間:2021-09-22 06:12
傳統(tǒng)監(jiān)督學(xué)習(xí)通常假設(shè)訓(xùn)練數(shù)據(jù)類別標(biāo)記恒定、特征信息充分、樣本充足。但很多現(xiàn)實(shí)的機(jī)器學(xué)習(xí)任務(wù)不滿足這些假設(shè)條件,導(dǎo)致學(xué)習(xí)效果不盡人意。為此,本文考慮通過引入增廣信息(Augmented Information)進(jìn)行學(xué)習(xí)。增廣信息包括傳統(tǒng)靜態(tài)學(xué)習(xí)中未考慮的額外信息以及動態(tài)學(xué)習(xí)過程中出現(xiàn)的新信息。本文主要工作如下:1.提出了一種訓(xùn)練集標(biāo)記增廣學(xué)習(xí)方法GLOCAL。該方法利用標(biāo)記關(guān)系對多標(biāo)記訓(xùn)練數(shù)據(jù)中部分缺失的標(biāo)記進(jìn)行恢復(fù)補(bǔ)全,但無需額外的先驗(yàn)知識來指定標(biāo)記關(guān)系矩陣,而是在優(yōu)化過程中同時(shí)習(xí)得全局和局部標(biāo)記關(guān)系。實(shí)驗(yàn)驗(yàn)證了本文方法的有效性。2.提出了分別用于靜態(tài)、動態(tài)測試集標(biāo)記增廣學(xué)習(xí)的方法DMNL和MuENL。DMNL通過最小化多示例包級損失和聚類正則化項(xiàng),預(yù)測靜態(tài)測試集中的多個(gè)新標(biāo)記;MuENL通過特征和預(yù)測值訓(xùn)練新標(biāo)記檢測器并建立魯棒模型,以檢測動態(tài)新增的標(biāo)記并對其建模。實(shí)驗(yàn)驗(yàn)證了本文方法的有效性。3.提出了一種多示例特征增廣學(xué)習(xí)方法AMIV-lss。針對數(shù)據(jù)特征信息不足的學(xué)習(xí)問題,將額外獲取的帶噪信息形式化為增廣多示例視圖(AMIV)作為樣本的特征增廣。AMIV-lss通過在兩個(gè)異構(gòu)視圖...
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:116 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2.1?Image數(shù)據(jù)集中兩個(gè)局部組的示例圖以及對應(yīng)的5?x?5標(biāo)記關(guān)系矩陣
第三章測試集標(biāo)記增廣學(xué)習(xí)??人工數(shù)據(jù)實(shí)驗(yàn)結(jié)果??圖3.1(c)和(d)分別展示了?MIML-NC和DMNL在測試集上的預(yù)測結(jié)果,其??中虛線表示不同真實(shí)標(biāo)記的分界線。如圖所示,DMNL和MIML-NC和在己知??標(biāo)記上的性能是可比的。但是MIML-NC把所有的新標(biāo)記示例都預(yù)測成同樣的??標(biāo)記0,而DMNL能夠預(yù)測多個(gè)不同的新標(biāo)記0和5。??*4??j?f?|-r'*??(a)?Training?data?(b)?Test?data?(c)?MIML-NC?(d)?DMNL??圖3.1人工數(shù)據(jù)實(shí)驗(yàn)??在實(shí)際應(yīng)用時(shí),新標(biāo)記的個(gè)數(shù)是未知的,所以它的數(shù)目&需要作為參數(shù)由??用戶手動設(shè)置。圖3.2展示了?DMNL的性能隨不同A值變化的結(jié)果。??ll?n?§""P?1"'P?1"'P??(a)?^=1?(b)k=2?(c)k=4?(d)?k=S??圖3.2不同取值的影響??當(dāng)灸與真實(shí)新標(biāo)記個(gè)數(shù)相同(即&二2)時(shí),在己知標(biāo)記和新標(biāo)記預(yù)測上??DMNL都能取得最好的性能。由此可以通過交叉驗(yàn)證(根據(jù)在驗(yàn)證集己知標(biāo)記上??的性能)來挑選合適的A值。??當(dāng)/t比真實(shí)新標(biāo)記數(shù)大時(shí),一些屬于相同新標(biāo)記的示例可能會被細(xì)分到不??同的子類:見圖3.2(c)。但是算法不一定總是產(chǎn)生用戶指定的&那么多個(gè)新標(biāo)??記。因?yàn)閮?yōu)化過程中同時(shí)考慮了包上的錯分損失和所有示例的聚類結(jié)構(gòu)。那些??檢測到的只有非常少量正示例的新標(biāo)記(由正交約束產(chǎn)生)會被認(rèn)為是噪聲,而??不是新標(biāo)記。圖3.2中,當(dāng)&?=?4時(shí)只產(chǎn)生了?3個(gè)新標(biāo)記,而當(dāng)A?=?8時(shí)只產(chǎn)生??了?2個(gè)新標(biāo)記。??當(dāng)it?=?1時(shí)
第三章測試集標(biāo)記增廣學(xué)習(xí)??人工數(shù)據(jù)實(shí)驗(yàn)結(jié)果??圖3.1(c)和(d)分別展示了?MIML-NC和DMNL在測試集上的預(yù)測結(jié)果,其??中虛線表示不同真實(shí)標(biāo)記的分界線。如圖所示,DMNL和MIML-NC和在己知??標(biāo)記上的性能是可比的。但是MIML-NC把所有的新標(biāo)記示例都預(yù)測成同樣的??標(biāo)記0,而DMNL能夠預(yù)測多個(gè)不同的新標(biāo)記0和5。??*4??j?f?|-r'*??(a)?Training?data?(b)?Test?data?(c)?MIML-NC?(d)?DMNL??圖3.1人工數(shù)據(jù)實(shí)驗(yàn)??在實(shí)際應(yīng)用時(shí),新標(biāo)記的個(gè)數(shù)是未知的,所以它的數(shù)目&需要作為參數(shù)由??用戶手動設(shè)置。圖3.2展示了?DMNL的性能隨不同A值變化的結(jié)果。??ll?n?§""P?1"'P?1"'P??(a)?^=1?(b)k=2?(c)k=4?(d)?k=S??圖3.2不同取值的影響??當(dāng)灸與真實(shí)新標(biāo)記個(gè)數(shù)相同(即&二2)時(shí),在己知標(biāo)記和新標(biāo)記預(yù)測上??DMNL都能取得最好的性能。由此可以通過交叉驗(yàn)證(根據(jù)在驗(yàn)證集己知標(biāo)記上??的性能)來挑選合適的A值。??當(dāng)/t比真實(shí)新標(biāo)記數(shù)大時(shí),一些屬于相同新標(biāo)記的示例可能會被細(xì)分到不??同的子類:見圖3.2(c)。但是算法不一定總是產(chǎn)生用戶指定的&那么多個(gè)新標(biāo)??記。因?yàn)閮?yōu)化過程中同時(shí)考慮了包上的錯分損失和所有示例的聚類結(jié)構(gòu)。那些??檢測到的只有非常少量正示例的新標(biāo)記(由正交約束產(chǎn)生)會被認(rèn)為是噪聲,而??不是新標(biāo)記。圖3.2中,當(dāng)&?=?4時(shí)只產(chǎn)生了?3個(gè)新標(biāo)記,而當(dāng)A?=?8時(shí)只產(chǎn)生??了?2個(gè)新標(biāo)記。??當(dāng)it?=?1時(shí)
【參考文獻(xiàn)】:
期刊論文
[1]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
本文編號:3403279
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:116 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2.1?Image數(shù)據(jù)集中兩個(gè)局部組的示例圖以及對應(yīng)的5?x?5標(biāo)記關(guān)系矩陣
第三章測試集標(biāo)記增廣學(xué)習(xí)??人工數(shù)據(jù)實(shí)驗(yàn)結(jié)果??圖3.1(c)和(d)分別展示了?MIML-NC和DMNL在測試集上的預(yù)測結(jié)果,其??中虛線表示不同真實(shí)標(biāo)記的分界線。如圖所示,DMNL和MIML-NC和在己知??標(biāo)記上的性能是可比的。但是MIML-NC把所有的新標(biāo)記示例都預(yù)測成同樣的??標(biāo)記0,而DMNL能夠預(yù)測多個(gè)不同的新標(biāo)記0和5。??*4??j?f?|-r'*??(a)?Training?data?(b)?Test?data?(c)?MIML-NC?(d)?DMNL??圖3.1人工數(shù)據(jù)實(shí)驗(yàn)??在實(shí)際應(yīng)用時(shí),新標(biāo)記的個(gè)數(shù)是未知的,所以它的數(shù)目&需要作為參數(shù)由??用戶手動設(shè)置。圖3.2展示了?DMNL的性能隨不同A值變化的結(jié)果。??ll?n?§""P?1"'P?1"'P??(a)?^=1?(b)k=2?(c)k=4?(d)?k=S??圖3.2不同取值的影響??當(dāng)灸與真實(shí)新標(biāo)記個(gè)數(shù)相同(即&二2)時(shí),在己知標(biāo)記和新標(biāo)記預(yù)測上??DMNL都能取得最好的性能。由此可以通過交叉驗(yàn)證(根據(jù)在驗(yàn)證集己知標(biāo)記上??的性能)來挑選合適的A值。??當(dāng)/t比真實(shí)新標(biāo)記數(shù)大時(shí),一些屬于相同新標(biāo)記的示例可能會被細(xì)分到不??同的子類:見圖3.2(c)。但是算法不一定總是產(chǎn)生用戶指定的&那么多個(gè)新標(biāo)??記。因?yàn)閮?yōu)化過程中同時(shí)考慮了包上的錯分損失和所有示例的聚類結(jié)構(gòu)。那些??檢測到的只有非常少量正示例的新標(biāo)記(由正交約束產(chǎn)生)會被認(rèn)為是噪聲,而??不是新標(biāo)記。圖3.2中,當(dāng)&?=?4時(shí)只產(chǎn)生了?3個(gè)新標(biāo)記,而當(dāng)A?=?8時(shí)只產(chǎn)生??了?2個(gè)新標(biāo)記。??當(dāng)it?=?1時(shí)
第三章測試集標(biāo)記增廣學(xué)習(xí)??人工數(shù)據(jù)實(shí)驗(yàn)結(jié)果??圖3.1(c)和(d)分別展示了?MIML-NC和DMNL在測試集上的預(yù)測結(jié)果,其??中虛線表示不同真實(shí)標(biāo)記的分界線。如圖所示,DMNL和MIML-NC和在己知??標(biāo)記上的性能是可比的。但是MIML-NC把所有的新標(biāo)記示例都預(yù)測成同樣的??標(biāo)記0,而DMNL能夠預(yù)測多個(gè)不同的新標(biāo)記0和5。??*4??j?f?|-r'*??(a)?Training?data?(b)?Test?data?(c)?MIML-NC?(d)?DMNL??圖3.1人工數(shù)據(jù)實(shí)驗(yàn)??在實(shí)際應(yīng)用時(shí),新標(biāo)記的個(gè)數(shù)是未知的,所以它的數(shù)目&需要作為參數(shù)由??用戶手動設(shè)置。圖3.2展示了?DMNL的性能隨不同A值變化的結(jié)果。??ll?n?§""P?1"'P?1"'P??(a)?^=1?(b)k=2?(c)k=4?(d)?k=S??圖3.2不同取值的影響??當(dāng)灸與真實(shí)新標(biāo)記個(gè)數(shù)相同(即&二2)時(shí),在己知標(biāo)記和新標(biāo)記預(yù)測上??DMNL都能取得最好的性能。由此可以通過交叉驗(yàn)證(根據(jù)在驗(yàn)證集己知標(biāo)記上??的性能)來挑選合適的A值。??當(dāng)/t比真實(shí)新標(biāo)記數(shù)大時(shí),一些屬于相同新標(biāo)記的示例可能會被細(xì)分到不??同的子類:見圖3.2(c)。但是算法不一定總是產(chǎn)生用戶指定的&那么多個(gè)新標(biāo)??記。因?yàn)閮?yōu)化過程中同時(shí)考慮了包上的錯分損失和所有示例的聚類結(jié)構(gòu)。那些??檢測到的只有非常少量正示例的新標(biāo)記(由正交約束產(chǎn)生)會被認(rèn)為是噪聲,而??不是新標(biāo)記。圖3.2中,當(dāng)&?=?4時(shí)只產(chǎn)生了?3個(gè)新標(biāo)記,而當(dāng)A?=?8時(shí)只產(chǎn)生??了?2個(gè)新標(biāo)記。??當(dāng)it?=?1時(shí)
【參考文獻(xiàn)】:
期刊論文
[1]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
本文編號:3403279
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3403279.html
最近更新
教材專著