多標(biāo)簽及多實(shí)例數(shù)據(jù)的分類模型算法研究
發(fā)布時(shí)間:2021-01-11 11:52
隨著手機(jī)、數(shù)據(jù)中心服務(wù)器以及龐大的互聯(lián)網(wǎng)服務(wù)技術(shù)的發(fā)展,人工存儲(chǔ)和處理數(shù)據(jù)的能力不斷攀升,導(dǎo)致存儲(chǔ)在各地的信息量的巨大增長,利用自動(dòng)化系統(tǒng)高效地進(jìn)行分類和標(biāo)記這些信息變得越來越迫切,使得機(jī)器學(xué)習(xí)越來越重要。傳統(tǒng)的機(jī)器學(xué)習(xí)中使用的是單實(shí)例單標(biāo)簽的數(shù)據(jù)假設(shè),隨著數(shù)據(jù)結(jié)構(gòu)的復(fù)雜化,該假設(shè)已經(jīng)不再適用于現(xiàn)實(shí)生活中。多標(biāo)簽學(xué)習(xí)中一個(gè)實(shí)例可以對應(yīng)著多個(gè)標(biāo)簽的前提條件和多實(shí)例學(xué)習(xí)中多個(gè)實(shí)例對應(yīng)一個(gè)標(biāo)簽的前提條件的出現(xiàn)更好的適應(yīng)了現(xiàn)實(shí)生活中的場景。加強(qiáng)多標(biāo)簽學(xué)習(xí)和多實(shí)例學(xué)習(xí)的研究,對進(jìn)一步促進(jìn)機(jī)器學(xué)習(xí)發(fā)展,增強(qiáng)算法的實(shí)用性和提高模型效率等方面具有重要的意義。本文在已有的多標(biāo)簽分類和多實(shí)例分類的基礎(chǔ)上,針對學(xué)習(xí)領(lǐng)域中發(fā)現(xiàn)的問題展開研究,主要工作如下:一、考慮到目前多標(biāo)簽數(shù)據(jù)集中數(shù)據(jù)不平衡問題。為了解決這個(gè)問題,我們提出了一個(gè)利用標(biāo)簽相關(guān)性的算法模型MLCI(multi-label learning model based on label correlation and imbalance)緩解多標(biāo)簽數(shù)據(jù)分布不平衡問題。模型通過耦合其他標(biāo)簽,將多標(biāo)簽數(shù)據(jù)集重構(gòu)成多類別數(shù)據(jù)集,有效地避免單獨(dú)處理海量的潛在...
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:135 頁
【學(xué)位級別】:博士
【部分圖文】:
說明單實(shí)例單標(biāo)簽學(xué)習(xí),多標(biāo)簽學(xué)習(xí)和多實(shí)例學(xué)習(xí)的簡化圖
習(xí)(Multi-label Learning)[9–11]應(yīng)運(yùn)而生。例如,在圖片場景分類中,如圖1-2所示,包括有海灘和山峰的景觀的圖片可以同時(shí)與海灘和山地類別相關(guān)聯(lián)。多標(biāo)簽學(xué)習(xí)是學(xué)習(xí)使用來自可能非常大標(biāo)簽詞匯表的標(biāo)簽子集來注釋每個(gè)實(shí)例的問題[12]。解決多標(biāo)簽數(shù)據(jù)的問題涉及到多重挑戰(zhàn),主要是要考慮的標(biāo)簽組合會(huì)隨著標(biāo)簽的數(shù)目呈指數(shù)增長,同時(shí)構(gòu)建和查詢模型的計(jì)算成本也會(huì)急劇增加。此外,多標(biāo)簽數(shù)據(jù)通常具有高緯度[13,14],不平衡數(shù)據(jù)[15,16]和標(biāo)簽之間依賴性[17]等特征,使得多標(biāo)簽學(xué)習(xí)過程不斷遇到挑戰(zhàn)。3
1.2.2 多實(shí)例學(xué)習(xí)由于現(xiàn)實(shí)生活中,數(shù)據(jù)結(jié)構(gòu)可能會(huì)更加復(fù)雜,多實(shí)例學(xué)習(xí)(Multi-instance Learning)變得非常流行。例如,如圖1-3,多實(shí)例分類器應(yīng)該能夠通過在盤子上不同對象,推導(dǎo)出這是一張“廣式早茶”的圖像。這類一個(gè)對象中包含多個(gè)實(shí)例,但只對應(yīng)一個(gè)標(biāo)簽的問題,一般使用多實(shí)例學(xué)習(xí)解決。多實(shí)例學(xué)習(xí)最早在文獻(xiàn) [8] 中提出,該文獻(xiàn)中主要處理藥物活性預(yù)測問題[8]。學(xué)習(xí)的任務(wù)是預(yù)測給定分子是否是良好的藥物分子,主要通過該分子結(jié)合給定靶標(biāo)的能力來測量。每個(gè)分子可以表示為包,其實(shí)例對應(yīng)于該特定化合物的不同構(gòu)象(分子結(jié)構(gòu))。在多實(shí)例學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)集不再是由實(shí)例組成,而是由一組實(shí)例構(gòu)成的包組成
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)子空間的多標(biāo)簽類屬特征提取算法[J]. 張晶,李裕,李培培. 計(jì)算機(jī)應(yīng)用研究. 2019(02)
[2]基于多實(shí)例運(yùn)動(dòng)學(xué)特征學(xué)習(xí)的動(dòng)態(tài)手勢識(shí)別研究[J]. 周彩秋,楊余旺,龐海波. 通信學(xué)報(bào). 2017(11)
[3]遮擋環(huán)境下多示例學(xué)習(xí)分塊目標(biāo)跟蹤[J]. 才華,陳廣秋,劉廣文,程帥,于化東. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)
[4]特征約束的多實(shí)例圖像超分辨率方法[J]. 張新,張帆,李雪梅,湯煜春,張彩明. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2016(04)
[5]在線特征選取的多示例學(xué)習(xí)目標(biāo)跟蹤[J]. 周志宇,彭小龍,吳迪沖,朱澤飛. 中國圖象圖形學(xué)報(bào). 2015(10)
[6]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報(bào). 2015(01)
[7]多標(biāo)記學(xué)習(xí)研究綜述[J]. 李志欣,卓亞琦,張燦龍,周生明. 計(jì)算機(jī)應(yīng)用研究. 2014(06)
[8]一種面向多源領(lǐng)域的實(shí)例遷移學(xué)習(xí)[J]. 張倩,李明,王雪松,程玉虎,朱美強(qiáng). 自動(dòng)化學(xué)報(bào). 2014(06)
[9]多標(biāo)簽決策樹分類在數(shù)字醫(yī)學(xué)圖像分類中的應(yīng)用[J]. 晉愛蓮,耿麗娜,薄芳芳. 中國數(shù)字醫(yī)學(xué). 2013 (03)
[10]一種基于正則化的半監(jiān)督多標(biāo)記學(xué)習(xí)方法[J]. 李宇峰,黃圣君,周志華. 計(jì)算機(jī)研究與發(fā)展. 2012(06)
本文編號(hào):2970716
【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:135 頁
【學(xué)位級別】:博士
【部分圖文】:
說明單實(shí)例單標(biāo)簽學(xué)習(xí),多標(biāo)簽學(xué)習(xí)和多實(shí)例學(xué)習(xí)的簡化圖
習(xí)(Multi-label Learning)[9–11]應(yīng)運(yùn)而生。例如,在圖片場景分類中,如圖1-2所示,包括有海灘和山峰的景觀的圖片可以同時(shí)與海灘和山地類別相關(guān)聯(lián)。多標(biāo)簽學(xué)習(xí)是學(xué)習(xí)使用來自可能非常大標(biāo)簽詞匯表的標(biāo)簽子集來注釋每個(gè)實(shí)例的問題[12]。解決多標(biāo)簽數(shù)據(jù)的問題涉及到多重挑戰(zhàn),主要是要考慮的標(biāo)簽組合會(huì)隨著標(biāo)簽的數(shù)目呈指數(shù)增長,同時(shí)構(gòu)建和查詢模型的計(jì)算成本也會(huì)急劇增加。此外,多標(biāo)簽數(shù)據(jù)通常具有高緯度[13,14],不平衡數(shù)據(jù)[15,16]和標(biāo)簽之間依賴性[17]等特征,使得多標(biāo)簽學(xué)習(xí)過程不斷遇到挑戰(zhàn)。3
1.2.2 多實(shí)例學(xué)習(xí)由于現(xiàn)實(shí)生活中,數(shù)據(jù)結(jié)構(gòu)可能會(huì)更加復(fù)雜,多實(shí)例學(xué)習(xí)(Multi-instance Learning)變得非常流行。例如,如圖1-3,多實(shí)例分類器應(yīng)該能夠通過在盤子上不同對象,推導(dǎo)出這是一張“廣式早茶”的圖像。這類一個(gè)對象中包含多個(gè)實(shí)例,但只對應(yīng)一個(gè)標(biāo)簽的問題,一般使用多實(shí)例學(xué)習(xí)解決。多實(shí)例學(xué)習(xí)最早在文獻(xiàn) [8] 中提出,該文獻(xiàn)中主要處理藥物活性預(yù)測問題[8]。學(xué)習(xí)的任務(wù)是預(yù)測給定分子是否是良好的藥物分子,主要通過該分子結(jié)合給定靶標(biāo)的能力來測量。每個(gè)分子可以表示為包,其實(shí)例對應(yīng)于該特定化合物的不同構(gòu)象(分子結(jié)構(gòu))。在多實(shí)例學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)集不再是由實(shí)例組成,而是由一組實(shí)例構(gòu)成的包組成
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)子空間的多標(biāo)簽類屬特征提取算法[J]. 張晶,李裕,李培培. 計(jì)算機(jī)應(yīng)用研究. 2019(02)
[2]基于多實(shí)例運(yùn)動(dòng)學(xué)特征學(xué)習(xí)的動(dòng)態(tài)手勢識(shí)別研究[J]. 周彩秋,楊余旺,龐海波. 通信學(xué)報(bào). 2017(11)
[3]遮擋環(huán)境下多示例學(xué)習(xí)分塊目標(biāo)跟蹤[J]. 才華,陳廣秋,劉廣文,程帥,于化東. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2017(01)
[4]特征約束的多實(shí)例圖像超分辨率方法[J]. 張新,張帆,李雪梅,湯煜春,張彩明. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2016(04)
[5]在線特征選取的多示例學(xué)習(xí)目標(biāo)跟蹤[J]. 周志宇,彭小龍,吳迪沖,朱澤飛. 中國圖象圖形學(xué)報(bào). 2015(10)
[6]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報(bào). 2015(01)
[7]多標(biāo)記學(xué)習(xí)研究綜述[J]. 李志欣,卓亞琦,張燦龍,周生明. 計(jì)算機(jī)應(yīng)用研究. 2014(06)
[8]一種面向多源領(lǐng)域的實(shí)例遷移學(xué)習(xí)[J]. 張倩,李明,王雪松,程玉虎,朱美強(qiáng). 自動(dòng)化學(xué)報(bào). 2014(06)
[9]多標(biāo)簽決策樹分類在數(shù)字醫(yī)學(xué)圖像分類中的應(yīng)用[J]. 晉愛蓮,耿麗娜,薄芳芳. 中國數(shù)字醫(yī)學(xué). 2013 (03)
[10]一種基于正則化的半監(jiān)督多標(biāo)記學(xué)習(xí)方法[J]. 李宇峰,黃圣君,周志華. 計(jì)算機(jī)研究與發(fā)展. 2012(06)
本文編號(hào):2970716
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2970716.html
最近更新
教材專著