半監(jiān)督多標(biāo)記特征選擇算法研究
發(fā)布時(shí)間:2021-04-14 23:23
在機(jī)器學(xué)習(xí)領(lǐng)域中,傳統(tǒng)監(jiān)督學(xué)習(xí)假設(shè)一個(gè)學(xué)習(xí)對(duì)象只對(duì)應(yīng)一個(gè)概念標(biāo)記。而在現(xiàn)實(shí)生活中,一個(gè)學(xué)習(xí)對(duì)象可能同時(shí)隸屬于多個(gè)概念標(biāo)記。比如,一部電影可以同時(shí)被標(biāo)記為科幻、動(dòng)作和美國(guó)等;一張圖片也可能被同時(shí)標(biāo)記為木屋、樹(shù)木、草坪、小路等。多標(biāo)記學(xué)習(xí)是研究此類問(wèn)題的一種學(xué)習(xí)框架,受到許多研究者的青睞。然而,現(xiàn)有多標(biāo)記學(xué)習(xí)算法存在兩個(gè)問(wèn)題:一方面,標(biāo)記個(gè)數(shù)多且語(yǔ)義信息復(fù)雜,標(biāo)注多標(biāo)記數(shù)據(jù)需耗費(fèi)大量人力和時(shí)間,難以獲得大量已標(biāo)記數(shù)據(jù);另一方面,多標(biāo)記數(shù)據(jù)集的特征呈現(xiàn)維數(shù)高的問(wèn)題,無(wú)關(guān)、冗余特征將會(huì)損壞分類模型的泛化能力,因此,需要對(duì)高維多標(biāo)記數(shù)據(jù)進(jìn)行降維。本文針對(duì)上述兩個(gè)問(wèn)題提出了一種半監(jiān)督多標(biāo)記特征選擇算法(semi-supervised multi-label feature selection,SSMLFS),其基本思想是在半監(jiān)督學(xué)習(xí)框架下根據(jù)原始特征描述和與之相關(guān)的標(biāo)記之間的依賴性和局部結(jié)構(gòu)保持能力來(lái)評(píng)價(jià)特征,主要內(nèi)容如下:首先,基于HSIC(Hilbert-Schmidt Independent Criterion),計(jì)算RKHS(Reproducing Kernel Hilbert Space...
【文章來(lái)源】:湖南師范大學(xué)湖南省 211工程院校
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
單標(biāo)記圖像與多標(biāo)記圖像對(duì)比
Human數(shù)據(jù)集性能對(duì)比圖(Mean)
Medical數(shù)據(jù)集性能對(duì)比圖(Mean)
本文編號(hào):3138205
【文章來(lái)源】:湖南師范大學(xué)湖南省 211工程院校
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
單標(biāo)記圖像與多標(biāo)記圖像對(duì)比
Human數(shù)據(jù)集性能對(duì)比圖(Mean)
Medical數(shù)據(jù)集性能對(duì)比圖(Mean)
本文編號(hào):3138205
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3138205.html
最近更新
教材專著