天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于標記權(quán)重與加權(quán)核極限學習機的多標記學習研究

發(fā)布時間:2024-04-12 05:33
  多標記學習是機器學習和數(shù)據(jù)挖掘中的研究重點之一,其目的是通過分析已有多標記數(shù)據(jù)對未知樣本進行較準確的預測。在大多數(shù)多標記數(shù)據(jù)集中,描述樣本的特征數(shù)存在大量冗余特征。冗余特征不僅影響分類精度,還增加了計算的復雜性。特征選擇能有效解決上述問題。然而,在實際分類問題中,類不平衡的問題也是機器學習的研究難點之一。本文充分調(diào)研了相關(guān)參考文獻,總結(jié)了研究現(xiàn)狀,分析了現(xiàn)有方法的優(yōu)缺點。在此基礎上,挖掘標記對樣本可區(qū)分度對標記賦權(quán)值。并針對類不平衡問題提出了一種解決方法,本文的主要研究工作如下:(1)挖掘出標記對樣本可區(qū)分度,并依據(jù)此對標記賦權(quán)值,提出了基于核函數(shù)和標記權(quán)重的多標記特征選擇算法(Multi-label feature selection based on kernel function and label weighting,KF-LW)。首先分別統(tǒng)計貼有不同標記的樣本數(shù)量。若對某個標記,貼有該標記的樣本數(shù)量明顯高于含有其他標記的樣本數(shù)量,則表明該標記的權(quán)重越大,根據(jù)標記空間的信息對標記進行權(quán)重賦值;然后,利用核函數(shù)將原始特征空間映射到高維空間,使得特征具有可分性,最后根據(jù)信息熵度量特...

【文章頁數(shù)】:49 頁

【學位級別】:碩士

【部分圖文】:

圖1.1多標記示例

圖1.1多標記示例

2(a)醫(yī)療、經(jīng)濟、生物(b)森林、經(jīng)濟、澳大利亞圖1.1多標記示例在多標記學習中,為了盡可能準確地描述樣本,用若干個特征描述該樣本,同時,該樣本同時屬于多個類別標記。根據(jù)已知的多標記數(shù)據(jù),學習樣本特征到標記之間的映射關(guān)系,并通過該映射關(guān)系盡可能準確的預測出未知樣本的標記。然而,....


圖1.2特征選擇的基本過程模型圖

圖1.2特征選擇的基本過程模型圖

5圖1.2特征選擇的基本過程模型圖處理多標記問題時,按照處理思路,主要是分為兩類:問題轉(zhuǎn)化法和算法轉(zhuǎn)化法。問題轉(zhuǎn)化法是將多標記問題轉(zhuǎn)化為多個單標記問題,然后可以利用已有的單標記算法解決多標記分類問題。目前,問題轉(zhuǎn)化方法主要分為BR(BinaryRelevance)和LP(Labe....


圖1.3經(jīng)過BR方法轉(zhuǎn)化的結(jié)果

圖1.3經(jīng)過BR方法轉(zhuǎn)化的結(jié)果

6表1.1多標記數(shù)據(jù)集樣本屬性標記11x1l,3l22x2l33x1l,2l44x3l(a)標記1l(b)標記2l(c)標記3l圖1.3經(jīng)過BR方法轉(zhuǎn)化的結(jié)果算法轉(zhuǎn)化方法則是改編現(xiàn)已提出的單標記學習算法以解決多標記分類問題。其優(yōu)點是能夠避免問題轉(zhuǎn)化過程中造成的信息損失。在現(xiàn)已提出....


圖1.1多標記示例

圖1.1多標記示例

然而,在現(xiàn)實世界中,樣本通常由多個特征對其進行描述,同時,樣本也屬于多個類別標記[9]。例如,一篇關(guān)于新型冠狀肺炎的報道中,其可能同時屬于醫(yī)療、經(jīng)濟、生物等多個主題。一段關(guān)于澳大利亞大火的視頻,其同時屬于森林、經(jīng)濟、澳大利亞等多個類別標記。而單標記學習假定樣本只屬于一類標記,則其....



本文編號:3951739

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3951739.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8c790***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com