網(wǎng)絡(luò)空間圖像標(biāo)注中半監(jiān)督稀疏特征選擇算法研究
發(fā)布時(shí)間:2020-11-01 19:33
近年,隨著計(jì)算機(jī)技術(shù)、存儲(chǔ)技術(shù)、互聯(lián)網(wǎng)技術(shù)以及多媒體信息技術(shù)的快速發(fā)展,以及數(shù)碼產(chǎn)品的廣泛使用,網(wǎng)絡(luò)空間圖像數(shù)據(jù)呈爆炸性增長(zhǎng)。面對(duì)這些不斷增加的網(wǎng)絡(luò)空間圖像數(shù)據(jù),如何有效地對(duì)其進(jìn)行瀏覽、檢索和管理,成為當(dāng)前多媒體內(nèi)容理解和計(jì)算機(jī)視覺領(lǐng)域面臨的一項(xiàng)亟待解決的研究問(wèn)題。 自動(dòng)圖像標(biāo)注(Automatice Image Annotation)技術(shù),將關(guān)鍵詞或者相關(guān)文檔描述與圖像聯(lián)系起來(lái),成為對(duì)大規(guī)模網(wǎng)絡(luò)空間圖像進(jìn)行有效索引、檢索、組織和管理的一個(gè)重要途徑。然而,面對(duì)呈幾何級(jí)數(shù)增長(zhǎng)的網(wǎng)絡(luò)空間圖像數(shù)據(jù),現(xiàn)有的自動(dòng)圖像標(biāo)注技術(shù)面臨著兩個(gè)關(guān)鍵問(wèn)題:一個(gè)是面對(duì)大規(guī)模網(wǎng)絡(luò)空間圖像,如何有效提高標(biāo)注效率,另一個(gè)是如何利用大量的無(wú)標(biāo)簽圖像來(lái)提升網(wǎng)絡(luò)空間圖像標(biāo)注的準(zhǔn)確度。 作為一種重要的手段,特征選擇在網(wǎng)絡(luò)空間圖像標(biāo)注中發(fā)揮著重要作用。近年,半監(jiān)督稀疏特征選擇成為特征選擇技術(shù)中一個(gè)研究熱點(diǎn),它能夠更好的提高網(wǎng)絡(luò)空間圖像標(biāo)注的性能。本論文對(duì)現(xiàn)有半監(jiān)督稀疏特征選擇方法進(jìn)行了深入研究,從稀疏表示理論、半監(jiān)督學(xué)習(xí)方法以及多視圖學(xué)習(xí)三個(gè)方面出發(fā),提出了幾種新的半監(jiān)督稀疏特征選擇算法,主要的研究成果及貢獻(xiàn)包括: (1)提出了一種基于l2,1/2矩陣范數(shù)半監(jiān)督稀疏特征選擇算法 對(duì)新近提出的稀疏性懲罰l2,p(0p≤1)矩陣范數(shù)進(jìn)行了深入研究,基于具有最好性能的稀疏性懲罰l2,1/2矩陣范數(shù)提出了一種新的半監(jiān)督稀疏特征選擇算法FSLG。l2,1/2矩陣范數(shù)不僅考慮了不同特征之間的關(guān)聯(lián),同時(shí)具有更好的稀疏性,使提取的特征更具判別性、更加稀疏,從而可以降低計(jì)算的復(fù)雜度,提高效率。本文給出了基于l2,1/2矩陣范數(shù)的半監(jiān)督稀疏特征選擇算法框架FSLG以及詳細(xì)的求解方法。將所提半監(jiān)督稀疏特征選擇算法FSLG應(yīng)用到了網(wǎng)絡(luò)空間圖像標(biāo)注任務(wù)中,提高了網(wǎng)絡(luò)空間圖像標(biāo)注的性能和效率。 (2)提出了一種基于Hessian正則化半監(jiān)督稀疏特征選擇算法 現(xiàn)有的半監(jiān)督學(xué)習(xí)方法中最具代表性的工作是基于圖拉普拉斯半監(jiān)督學(xué)習(xí)方法,然而拉普拉斯正則化不具有很好的推斷能力,無(wú)標(biāo)簽數(shù)據(jù)的幾何結(jié)構(gòu)信息沒(méi)能被很好的利用。相對(duì)于拉普拉斯正則化,Hessian正則化可以使函數(shù)值隨著測(cè)地距離線性變化,更好的保持局部流形結(jié)構(gòu),具有很好的推斷能力,因此,基于Hessian正則化的半監(jiān)督學(xué)習(xí)具有更好的學(xué)習(xí)性能。本文將Hessian正則化引入到半監(jiān)督稀疏特征選擇算法中,提出了基于Hessian正則化半監(jiān)督稀疏特征選擇算法HFSL,給出了算法的迭代求解方法,并將其應(yīng)用到了網(wǎng)絡(luò)空間圖像標(biāo)注任務(wù),結(jié)果表明所提HFSL算法能夠很好的提高網(wǎng)絡(luò)空間圖像標(biāo)注的性能。 (3)提出了兩種基于多視圖學(xué)習(xí)的半監(jiān)督稀疏特征選擇算法 目前大多數(shù)特征選擇方法都是針對(duì)單一視圖(Single-view)數(shù)據(jù)的,當(dāng)其面對(duì)多視圖(Multi-view)數(shù)據(jù)時(shí),一般是將多視圖數(shù)據(jù)簡(jiǎn)單地串接為一個(gè)長(zhǎng)的特征向量進(jìn)行處理。然而,這種直接串接的方法不能充分利用多視圖之間的互補(bǔ)和一致性信息,同時(shí)忽略了不同視圖的物理解釋。近年,多視圖學(xué)習(xí)(Multi-view Learning)得到了廣泛關(guān)注及研究,多視圖學(xué)習(xí)可以很好的利用不同視圖之間的互補(bǔ)屬性和一致性。基于不同視圖之間的互補(bǔ)屬性,論文提出了多視圖Hessian半監(jiān)督稀疏特征選擇算法MHSFS,基于一致性提出了基于l2,1/2矩陣范數(shù)和共享子空間的半監(jiān)督稀疏特征選擇算法SFSLS,并分別給出了兩種算法的詳細(xì)求解過(guò)程。將所提基于多視圖學(xué)習(xí)的半監(jiān)督稀疏特征選擇算法應(yīng)用到了網(wǎng)絡(luò)空間圖像標(biāo)注任務(wù),結(jié)果表明所提算法優(yōu)于現(xiàn)有的半監(jiān)督稀疏特征選擇算法,能夠提高網(wǎng)絡(luò)空間圖像標(biāo)注的性能。
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2015
【中圖分類】:TP391.41
【部分圖文】:
協(xié)同訓(xùn)練Co-training [115]算法就是采用后期結(jié)合方式進(jìn)行多視圖學(xué)習(xí)的。協(xié)同訓(xùn)練框架如圖2-2所示,通常是在每一個(gè)視圖上訓(xùn)練相互獨(dú)立又彼此關(guān)聯(lián)的兩個(gè)學(xué)習(xí)器。在一致性準(zhǔn)則下,盡量在每一次迭代過(guò)程中使兩個(gè)學(xué)習(xí)器的一致性達(dá)到最大。當(dāng)然,兩個(gè)學(xué)習(xí)器的預(yù)測(cè)值之間也可能存在非一致性,然而,這個(gè)非一致性可以被傳播回訓(xùn)練集,從而幫助獲得更加準(zhǔn)確的學(xué)習(xí)器,因此,在下一個(gè)迭代過(guò)程中使非一致性達(dá)到最小。r 、train predict \ ■viewll ?? ???,Hypothesis 1 畫^ | ? ?? ?I ? I ^■,. .■> I ? # ? II labeled data exchange [validation data .I 丄 + t ( ) I Iview2 丨丨 IZa4 Hypothesis 2 ■■嶺 | 十( I train predict、 I圖2-2協(xié)同訓(xùn)練框架Figure 2-2 Co-training framework.(2)中期方式中期結(jié)合方式是指在訓(xùn)練分類器期間將不同的視圖結(jié)合起來(lái)。多核學(xué)習(xí)算法就是釆用中期結(jié)合方式進(jìn)行多視圖學(xué)習(xí)的,它是在每一個(gè)視圖上分別計(jì)算獨(dú)立的核
上分別計(jì)算獨(dú)立的核,然后通過(guò)一個(gè)基于核的方法將多個(gè)核結(jié)合起來(lái)。多核學(xué)習(xí)框圖如圖2-3所示,該方式中不是采用單一一個(gè)核函數(shù),而是通過(guò)一個(gè)算法來(lái)選用一組合適的核以及核結(jié)合方式進(jìn)行多視圖學(xué)習(xí)。對(duì)于多個(gè)核之間的結(jié)合方式有幾種形式,每一種形式都有其獨(dú)有的結(jié)合參數(shù)特性,這些結(jié)合方式大概可以分為以下兩類:線性結(jié)合方式和非線性結(jié)合方式。線性結(jié)合方式一般采用直接相加核和加權(quán)相加核將多個(gè)核結(jié)合到一起。M直接相加核:KOCi,X) = IKiJ^X,,X) (2-22)走寘1M權(quán)重相加核:= (2-23)*=1直接相加核對(duì)所有核的依賴相同,但是這是不現(xiàn)實(shí)的,而采用權(quán)重相加核則具有更好的效果。27
View M、0 ? ? ? 1J圖2-3多核學(xué)習(xí)框圖Figure 2-3 Multiple kernel learning framework.對(duì)不同的核采用線性結(jié)合具有很大的局限性,因此可以采用其他非線性的方式將多個(gè)核結(jié)合起來(lái),例如指數(shù)冪方式或者能量方式:指數(shù)冪方式 KOc丨’ Xj) = exp(-Xd乂 AXj) (2-24)M能量方式 A,xJ (2-25)(3)前期結(jié)合方式前期結(jié)合方式是指首先將多個(gè)視圖直接結(jié)合到一起,然后再進(jìn)行分類器訓(xùn)練;谧涌臻g學(xué)習(xí)的方法就是釆用前期結(jié)合方式進(jìn)行多視圖學(xué)習(xí)的,它首先將多個(gè)視圖直接結(jié)合到一起,然后利用潛在子空間進(jìn)行學(xué)習(xí)。子空間學(xué)習(xí)框圖如圖2-4所示,該方式是尋求多個(gè)視圖共享的一個(gè)潛在子空間。典型相關(guān)分析(CCA)[116]已經(jīng)成為對(duì)多視圖數(shù)據(jù)進(jìn)行子空間學(xué)習(xí)的一個(gè)基本工具。通過(guò)最大化子空間中的兩個(gè)視圖之間的關(guān)聯(lián),CCA在每一個(gè)視圖上完成一個(gè)最優(yōu)映射。然而
【參考文獻(xiàn)】
本文編號(hào):2865989
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2015
【中圖分類】:TP391.41
【部分圖文】:
協(xié)同訓(xùn)練Co-training [115]算法就是采用后期結(jié)合方式進(jìn)行多視圖學(xué)習(xí)的。協(xié)同訓(xùn)練框架如圖2-2所示,通常是在每一個(gè)視圖上訓(xùn)練相互獨(dú)立又彼此關(guān)聯(lián)的兩個(gè)學(xué)習(xí)器。在一致性準(zhǔn)則下,盡量在每一次迭代過(guò)程中使兩個(gè)學(xué)習(xí)器的一致性達(dá)到最大。當(dāng)然,兩個(gè)學(xué)習(xí)器的預(yù)測(cè)值之間也可能存在非一致性,然而,這個(gè)非一致性可以被傳播回訓(xùn)練集,從而幫助獲得更加準(zhǔn)確的學(xué)習(xí)器,因此,在下一個(gè)迭代過(guò)程中使非一致性達(dá)到最小。r 、train predict \ ■viewll ?? ???,Hypothesis 1 畫^ | ? ?? ?I ? I ^■,. .■> I ? # ? II labeled data exchange [validation data .I 丄 + t ( ) I Iview2 丨丨 IZa4 Hypothesis 2 ■■嶺 | 十( I train predict、 I圖2-2協(xié)同訓(xùn)練框架Figure 2-2 Co-training framework.(2)中期方式中期結(jié)合方式是指在訓(xùn)練分類器期間將不同的視圖結(jié)合起來(lái)。多核學(xué)習(xí)算法就是釆用中期結(jié)合方式進(jìn)行多視圖學(xué)習(xí)的,它是在每一個(gè)視圖上分別計(jì)算獨(dú)立的核
上分別計(jì)算獨(dú)立的核,然后通過(guò)一個(gè)基于核的方法將多個(gè)核結(jié)合起來(lái)。多核學(xué)習(xí)框圖如圖2-3所示,該方式中不是采用單一一個(gè)核函數(shù),而是通過(guò)一個(gè)算法來(lái)選用一組合適的核以及核結(jié)合方式進(jìn)行多視圖學(xué)習(xí)。對(duì)于多個(gè)核之間的結(jié)合方式有幾種形式,每一種形式都有其獨(dú)有的結(jié)合參數(shù)特性,這些結(jié)合方式大概可以分為以下兩類:線性結(jié)合方式和非線性結(jié)合方式。線性結(jié)合方式一般采用直接相加核和加權(quán)相加核將多個(gè)核結(jié)合到一起。M直接相加核:KOCi,X) = IKiJ^X,,X) (2-22)走寘1M權(quán)重相加核:= (2-23)*=1直接相加核對(duì)所有核的依賴相同,但是這是不現(xiàn)實(shí)的,而采用權(quán)重相加核則具有更好的效果。27
View M、0 ? ? ? 1J圖2-3多核學(xué)習(xí)框圖Figure 2-3 Multiple kernel learning framework.對(duì)不同的核采用線性結(jié)合具有很大的局限性,因此可以采用其他非線性的方式將多個(gè)核結(jié)合起來(lái),例如指數(shù)冪方式或者能量方式:指數(shù)冪方式 KOc丨’ Xj) = exp(-Xd乂 AXj) (2-24)M能量方式 A,xJ (2-25)(3)前期結(jié)合方式前期結(jié)合方式是指首先將多個(gè)視圖直接結(jié)合到一起,然后再進(jìn)行分類器訓(xùn)練;谧涌臻g學(xué)習(xí)的方法就是釆用前期結(jié)合方式進(jìn)行多視圖學(xué)習(xí)的,它首先將多個(gè)視圖直接結(jié)合到一起,然后利用潛在子空間進(jìn)行學(xué)習(xí)。子空間學(xué)習(xí)框圖如圖2-4所示,該方式是尋求多個(gè)視圖共享的一個(gè)潛在子空間。典型相關(guān)分析(CCA)[116]已經(jīng)成為對(duì)多視圖數(shù)據(jù)進(jìn)行子空間學(xué)習(xí)的一個(gè)基本工具。通過(guò)最大化子空間中的兩個(gè)視圖之間的關(guān)聯(lián),CCA在每一個(gè)視圖上完成一個(gè)最優(yōu)映射。然而
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 ;L_(1/2) regularization[J];Science China(Information Sciences);2010年06期
2 趙謙;孟德宇;徐宗本;;L_(1/2)正則化Logistic回歸[J];模式識(shí)別與人工智能;2012年05期
3 袁瑩;邵健;吳飛;莊越挺;;結(jié)合組稀疏效應(yīng)和多核學(xué)習(xí)的圖像標(biāo)注[J];軟件學(xué)報(bào);2012年09期
相關(guān)博士學(xué)位論文 前2條
1 王嬌;多視圖的半監(jiān)督學(xué)習(xí)研究[D];北京交通大學(xué);2010年
2 錢強(qiáng);復(fù)雜場(chǎng)景下的多視圖學(xué)習(xí)方法研究[D];南京航空航天大學(xué);2013年
本文編號(hào):2865989
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2865989.html
最近更新
教材專著