標簽有限或缺失情形下的多標簽學習方法研究
發(fā)布時間:2024-04-09 19:18
傳統(tǒng)的單標簽數(shù)據(jù)挖掘,假定每個樣本點僅屬于一個類別,但是隨著標注結(jié)構(gòu)復雜程度的增加,每個樣本可能同時屬于多個類別,即多標簽數(shù)據(jù)。在實際應用中,多標簽數(shù)據(jù)標簽的獲取比較困難,因而得到的標簽數(shù)據(jù)有限或者標簽缺失。如圖像標注中,必須遍歷所有候選的單詞,需要消耗過多的資源來確定每一個圖像的標簽。一般的,獲得的標簽數(shù)據(jù)有限或者標簽是不完整的。針對多標簽數(shù)據(jù)有限或者標簽缺失的情形,本文分別在兩種情形下提出相關(guān)的學習方法。在標簽數(shù)據(jù)有限情形下,同時考慮數(shù)據(jù)的高維影響,本文提出了多標簽半監(jiān)督降維方法;在標簽缺失的情形下,本文提出了標簽缺失情形下低秩分類的方法。本文的主要工作為以下三個方面:(1)分析研究了標簽有限和缺失情形下的多標簽學習方法,結(jié)合標簽有限和缺失情形下的數(shù)據(jù)特點以及實際應用中的需求,通過相關(guān)的研究,分別提出了標簽數(shù)據(jù)有限情形下的多標簽降維方法和標簽缺失情形下的多標簽分類方法。(2)在標簽數(shù)據(jù)有限的情形下,結(jié)合數(shù)據(jù)高維的特性,提出了多標簽半監(jiān)督降維的方法LEDA(Semi-Supervised Multi-Label Feature Learning via Label Enlarged ...
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3949529
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【部分圖文】:
圖1.4多標簽分類第頁
包括許多資源的自動標注[37],比如文本、圖像、音樂和視頻。下圖1.4描述了經(jīng)典的多標簽應用——圖片分類。這個圖片分類有四個標簽,根據(jù)所包含的內(nèi)容,每一張圖片都可以被標注兩個或多個標簽。在圖片分類中有多個重疊的邊界,每個標簽與其它標簽之間都有關(guān)聯(lián)。多標簽數(shù)據(jù)的分類方法大致可以分成....
圖1.5標簽缺失的圖形描述
樣本點有6個,下圖1.5給出了在標簽缺失情況下的描述,實線代表屬于的類別,虛線表示不屬于的類別,數(shù)據(jù)與標簽之間沒有線相連,代表標簽的缺失,特別的,未標簽數(shù)據(jù)也可以看做標簽缺失的一種情形。標簽缺失在多標簽研究中是一個熱門的研究方向。目前,有許多專門處理標簽缺失的算法。Cabral....
本文編號:3949529
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3949529.html
最近更新
教材專著