基于卷積神經(jīng)網(wǎng)絡(luò)的多標(biāo)簽圖像分類
發(fā)布時(shí)間:2021-01-23 10:54
針對(duì)BING算法對(duì)物體建模的不足,提出了multi-BING算法。該算法計(jì)算訓(xùn)練樣本的CS-LBP特征,并對(duì)其進(jìn)行聚類,對(duì)聚類后的數(shù)據(jù)建立BING模型。在物體檢測(cè)過(guò)程中,融合了多個(gè)模型結(jié)果進(jìn)行候選框判別,將多標(biāo)簽圖像分類問(wèn)題轉(zhuǎn)化為多個(gè)單標(biāo)簽分類問(wèn)題。以Fast R-CNN模型為基礎(chǔ),將采用本文物體檢測(cè)方法得到的候選框作為模型輸入。同時(shí),采用LReLU函數(shù)作為Fast R-CNN模型的激活函數(shù),從而在幾乎不增加計(jì)算復(fù)雜度的情況下,提高模型的平均準(zhǔn)確率(AP)。實(shí)驗(yàn)表明,本文方法優(yōu)于BING算法和OBN算法。
【文章來(lái)源】:吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2020,50(03)北大核心
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
物體與非物體比較
(3)輸出部分。該部分有兩個(gè)分支:一個(gè)用于圖像分類;一個(gè)用于窗口回歸。分類輸出為N+1維的向量,包括1類背景和N類待分類的物體。窗口回歸輸出一個(gè)4×N維的向量,輸出修正后的預(yù)測(cè)窗口坐標(biāo)。假定在圖像中標(biāo)注了一個(gè)正樣本,其類別為u,回歸窗口目標(biāo)為v=(vx,vy,vw,vh),vx、vy分別為目標(biāo)窗口在x、y方向的起始位置,vw、vh分別為預(yù)測(cè)窗口的寬度和高度。對(duì)其預(yù)測(cè)為類別u,概率為pu,預(yù)測(cè)窗口目標(biāo)為tu=(txu,tyu,twu,thu),txu、tyu分別為預(yù)測(cè)窗口在x、y方向的起始位置,twu、thu分別為預(yù)測(cè)窗口的寬度和高度。則多任務(wù)損失函數(shù)為:
由式(6)可以看出,函數(shù)輸出具有非負(fù)特性。輸入小于0時(shí),輸出為0,會(huì)抑制對(duì)應(yīng)神經(jīng)元,使其參數(shù)不再更新,從而變成死節(jié)點(diǎn)。有研究表明,利用ReLU激活函數(shù),在最壞情況下會(huì)使近半神經(jīng)元成為死節(jié)點(diǎn)。因此,Maas等[6]提出了LReLU激活函數(shù),如圖5所示。與ReLU函數(shù)一樣,當(dāng)輸入大于0時(shí),LReLU函數(shù)原值輸出;當(dāng)輸入小于0時(shí),其輸出為輸入的α倍,而不是0,α為數(shù)值較小的一個(gè)常值系數(shù)。經(jīng)過(guò)這樣處理,較弱神經(jīng)元得以保留,不會(huì)變成死節(jié)點(diǎn),同時(shí)起到了增加神經(jīng)元數(shù)量和修正分?jǐn)?shù)分布的作用。LReLU激活函數(shù)的表達(dá)式為:式中:α=0.01。
【參考文獻(xiàn)】:
期刊論文
[1]加權(quán)自適應(yīng)CS-LBP與局部判別映射相結(jié)合的掌紋識(shí)別方法[J]. 張善文,張晴晴,張?jiān)讫?齊國(guó)紅. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[2]基于K均值聚類和區(qū)域匹配的顏色遷移技術(shù)[J]. 張子迎,周明全,稅午陽(yáng),武仲科,鄭霞. 系統(tǒng)仿真學(xué)報(bào). 2015(10)
本文編號(hào):2995089
【文章來(lái)源】:吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2020,50(03)北大核心
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
物體與非物體比較
(3)輸出部分。該部分有兩個(gè)分支:一個(gè)用于圖像分類;一個(gè)用于窗口回歸。分類輸出為N+1維的向量,包括1類背景和N類待分類的物體。窗口回歸輸出一個(gè)4×N維的向量,輸出修正后的預(yù)測(cè)窗口坐標(biāo)。假定在圖像中標(biāo)注了一個(gè)正樣本,其類別為u,回歸窗口目標(biāo)為v=(vx,vy,vw,vh),vx、vy分別為目標(biāo)窗口在x、y方向的起始位置,vw、vh分別為預(yù)測(cè)窗口的寬度和高度。對(duì)其預(yù)測(cè)為類別u,概率為pu,預(yù)測(cè)窗口目標(biāo)為tu=(txu,tyu,twu,thu),txu、tyu分別為預(yù)測(cè)窗口在x、y方向的起始位置,twu、thu分別為預(yù)測(cè)窗口的寬度和高度。則多任務(wù)損失函數(shù)為:
由式(6)可以看出,函數(shù)輸出具有非負(fù)特性。輸入小于0時(shí),輸出為0,會(huì)抑制對(duì)應(yīng)神經(jīng)元,使其參數(shù)不再更新,從而變成死節(jié)點(diǎn)。有研究表明,利用ReLU激活函數(shù),在最壞情況下會(huì)使近半神經(jīng)元成為死節(jié)點(diǎn)。因此,Maas等[6]提出了LReLU激活函數(shù),如圖5所示。與ReLU函數(shù)一樣,當(dāng)輸入大于0時(shí),LReLU函數(shù)原值輸出;當(dāng)輸入小于0時(shí),其輸出為輸入的α倍,而不是0,α為數(shù)值較小的一個(gè)常值系數(shù)。經(jīng)過(guò)這樣處理,較弱神經(jīng)元得以保留,不會(huì)變成死節(jié)點(diǎn),同時(shí)起到了增加神經(jīng)元數(shù)量和修正分?jǐn)?shù)分布的作用。LReLU激活函數(shù)的表達(dá)式為:式中:α=0.01。
【參考文獻(xiàn)】:
期刊論文
[1]加權(quán)自適應(yīng)CS-LBP與局部判別映射相結(jié)合的掌紋識(shí)別方法[J]. 張善文,張晴晴,張?jiān)讫?齊國(guó)紅. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[2]基于K均值聚類和區(qū)域匹配的顏色遷移技術(shù)[J]. 張子迎,周明全,稅午陽(yáng),武仲科,鄭霞. 系統(tǒng)仿真學(xué)報(bào). 2015(10)
本文編號(hào):2995089
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2995089.html
最近更新
教材專著