基于標簽依賴關(guān)系的多標簽分類方法
發(fā)布時間:2021-03-18 04:19
多標簽學習廣泛應(yīng)用于文本分類、圖像標注、視頻語義注釋、基因功能分析等問題。近年來,多標簽學習日益受到學術(shù)界和工業(yè)界的關(guān)注,成為機器學習領(lǐng)域中的研究熱點,并且取得了顯著的進步。然而,多標簽學習經(jīng)常受到標簽數(shù)量、標簽之間依賴關(guān)系、標簽缺失等影響,多標簽學習仍然是一項極具挑戰(zhàn)的研究。標簽之間依賴關(guān)系是復(fù)雜且重要的因素,它的有效學習會豐富數(shù)據(jù)表示的內(nèi)涵,對提升多標簽分類性能產(chǎn)生重要作用。因此,多標簽分類主要面臨以下挑戰(zhàn):不同標簽之間存在關(guān)聯(lián)性,并且關(guān)聯(lián)性存在較大差異;隨著標簽數(shù)量的增長,標簽之間依賴關(guān)系變得復(fù)雜,并且面臨時間和空間復(fù)雜度的挑戰(zhàn);以及標簽依賴關(guān)系在標簽缺失問題中的應(yīng)用。本文針對上述問題提出了兩種多標簽分類模型,主要工作和貢獻如下:提出了基于神經(jīng)網(wǎng)絡(luò)探究標簽依賴全局關(guān)系的模型NNADOmega。考慮到不同標簽之間存在不同的相關(guān)性,本文構(gòu)建了標簽依賴全局關(guān)系矩陣來刻畫標簽之間的依賴關(guān)系。該矩陣關(guān)于主對角線對稱,主對角線表示每個標簽與自身的依賴關(guān)系,并且該依賴關(guān)系最強。NNADOmega模型的優(yōu)勢在...
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
一多標簽學習框架
多標簽分類及相關(guān)理論基礎(chǔ)??間中找到一個分離超平面,能將樣本分到不同的類別。但存在無窮個分離超平面??可將兩類數(shù)據(jù)正確分開,如圖2-3所示。直覺上,應(yīng)該選擇位于兩類訓練樣本“正??中間”的超平面,即圖2-3中最粗的那個,因為該超平面所產(chǎn)生的分類結(jié)果是魯棒??的,對未知樣本的泛化性能最強。??0?I??圖2-3存在多個超平面將兩類訓練樣本分開??Figure?2-3?Separation?of?two?types?of?training?samples?by?multiple?hyperplanes??在樣本的特征空間中,分離超平面可描述為??wTx?+?b?=?0?(2-3)??其中,》^=(\^1;|^2;...;\^)為法向量,決定了超平面的方向;6為位移項,決定了超平??面與原點之間的距離,記超平面為(w,6),樣本空間中任意點;c到超平面的距??離為??H>JX?+?b??(2_4)??假設(shè)超平面能將訓練樣本正確分類,即??[w1?xi?+?6>+1?yt?=?+1??+?6<-1?兄=—1?( ̄?5)??如圖2-4所示,距離超平面最近的這幾個訓練樣本點使式(2-5)的等號成立,它??們被稱為“支持向量”
多標簽分類及相關(guān)理論基礎(chǔ)??間中找到一個分離超平面,能將樣本分到不同的類別。但存在無窮個分離超平面??可將兩類數(shù)據(jù)正確分開,如圖2-3所示。直覺上,應(yīng)該選擇位于兩類訓練樣本“正??中間”的超平面,即圖2-3中最粗的那個,因為該超平面所產(chǎn)生的分類結(jié)果是魯棒??的,對未知樣本的泛化性能最強。??0?I??圖2-3存在多個超平面將兩類訓練樣本分開??Figure?2-3?Separation?of?two?types?of?training?samples?by?multiple?hyperplanes??在樣本的特征空間中,分離超平面可描述為??wTx?+?b?=?0?(2-3)??其中,》^=(\^1;|^2;...;\^)為法向量,決定了超平面的方向;6為位移項,決定了超平??面與原點之間的距離,記超平面為(w,6),樣本空間中任意點;c到超平面的距??離為??H>JX?+?b??(2_4)??假設(shè)超平面能將訓練樣本正確分類,即??[w1?xi?+?6>+1?yt?=?+1??+?6<-1?兄=—1?( ̄?5)??如圖2-4所示,距離超平面最近的這幾個訓練樣本點使式(2-5)的等號成立,它??們被稱為“支持向量”
【參考文獻】:
期刊論文
[1]基于標簽相關(guān)性的多標簽分類AdaBoost算法[J]. 王莉莉,付忠良. 四川大學學報(工程科學版). 2016(05)
本文編號:3087979
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
一多標簽學習框架
多標簽分類及相關(guān)理論基礎(chǔ)??間中找到一個分離超平面,能將樣本分到不同的類別。但存在無窮個分離超平面??可將兩類數(shù)據(jù)正確分開,如圖2-3所示。直覺上,應(yīng)該選擇位于兩類訓練樣本“正??中間”的超平面,即圖2-3中最粗的那個,因為該超平面所產(chǎn)生的分類結(jié)果是魯棒??的,對未知樣本的泛化性能最強。??0?I??圖2-3存在多個超平面將兩類訓練樣本分開??Figure?2-3?Separation?of?two?types?of?training?samples?by?multiple?hyperplanes??在樣本的特征空間中,分離超平面可描述為??wTx?+?b?=?0?(2-3)??其中,》^=(\^1;|^2;...;\^)為法向量,決定了超平面的方向;6為位移項,決定了超平??面與原點之間的距離,記超平面為(w,6),樣本空間中任意點;c到超平面的距??離為??H>JX?+?b??(2_4)??假設(shè)超平面能將訓練樣本正確分類,即??[w1?xi?+?6>+1?yt?=?+1??+?6<-1?兄=—1?( ̄?5)??如圖2-4所示,距離超平面最近的這幾個訓練樣本點使式(2-5)的等號成立,它??們被稱為“支持向量”
多標簽分類及相關(guān)理論基礎(chǔ)??間中找到一個分離超平面,能將樣本分到不同的類別。但存在無窮個分離超平面??可將兩類數(shù)據(jù)正確分開,如圖2-3所示。直覺上,應(yīng)該選擇位于兩類訓練樣本“正??中間”的超平面,即圖2-3中最粗的那個,因為該超平面所產(chǎn)生的分類結(jié)果是魯棒??的,對未知樣本的泛化性能最強。??0?I??圖2-3存在多個超平面將兩類訓練樣本分開??Figure?2-3?Separation?of?two?types?of?training?samples?by?multiple?hyperplanes??在樣本的特征空間中,分離超平面可描述為??wTx?+?b?=?0?(2-3)??其中,》^=(\^1;|^2;...;\^)為法向量,決定了超平面的方向;6為位移項,決定了超平??面與原點之間的距離,記超平面為(w,6),樣本空間中任意點;c到超平面的距??離為??H>JX?+?b??(2_4)??假設(shè)超平面能將訓練樣本正確分類,即??[w1?xi?+?6>+1?yt?=?+1??+?6<-1?兄=—1?( ̄?5)??如圖2-4所示,距離超平面最近的這幾個訓練樣本點使式(2-5)的等號成立,它??們被稱為“支持向量”
【參考文獻】:
期刊論文
[1]基于標簽相關(guān)性的多標簽分類AdaBoost算法[J]. 王莉莉,付忠良. 四川大學學報(工程科學版). 2016(05)
本文編號:3087979
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3087979.html
最近更新
教材專著