弱監(jiān)督學習下的多標簽圖像分類
發(fā)布時間:2021-08-18 01:40
自然圖像往往是包含著多種物體類型的多標簽圖像。對多標簽圖像進行準確地分類,既是計算機進行高級視覺理解的基礎之一,也在實際生活中有著廣泛的應用。由于多標簽圖像中包含了多種類型的物體,且往往具有復雜的背景信息,實現(xiàn)其準確分類具有較大的挑戰(zhàn),強監(jiān)督學習是一種較好的解決方案。然而,強監(jiān)督學習模型需要代價昂貴的目標級或者像素級標簽作為監(jiān)督信息。為了降低強監(jiān)督學習的成本,本文對弱監(jiān)督學習條件下的多標簽圖像分類算法進行了研究。一方面,本文改進了當前主流的圖像分類網(wǎng)絡框架。在當前主流的圖像分類網(wǎng)絡框架下,不同類型的物體之間存在著嚴重的特征競爭現(xiàn)象。這種特征競爭使得各類別在分類過程中所能獲得的特征信息量嚴重受到其樣本數(shù)量的影響。為此,本文提出了多路網(wǎng)絡框架,以降低這種類型間的特征競爭帶來的負面影響。本文的實驗證明該框架能夠很好地緩解特征競爭現(xiàn)象,提升多標簽圖像分類算法的性能。此外,該網(wǎng)絡框架還具有很好的靈活性,可以依據(jù)不同的任務,設計相應的網(wǎng)絡結(jié)構(gòu)。另一方面,受到人類視覺注意機制的啟發(fā),本文設計了基于注意機制的多標簽圖像分類模型。首先,本文在多標簽圖像分類網(wǎng)絡中引入空間注意機制,促使網(wǎng)絡能夠更好地學習物...
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
多路卷積神經(jīng)網(wǎng)絡框架
每一列都進行歸一化處理,以更好地進行可視化?梢暬Y(jié)果如圖 3.4 所示,紅色表示高權(quán)重,而藍色表示低權(quán)重。圖3.4 原始 ResNet-50 中的全連接層權(quán)重從圖 3.4 中我們可以看出原始 ResNet 在學習的過程中,全局平均池化輸出的特征傾向于分配給某一特定類型的輸出,而沒有很好地實現(xiàn)特征的復用。接下來,我們進一步分析 ResNet 所學習到的全連接權(quán)重與各類別的樣本數(shù)量的關(guān)系。由于經(jīng)過卷積網(wǎng)絡以及全局平均池化后獲取的特征通過全連接層直接與各類別的預測結(jié)果相連接,通過分析全連接層學習得到的權(quán)重,即可獲取各特征對最終各類別目標分類結(jié)果的影響。我們通過兩種方式衡量各個特征對某一類別的影響程度,也
本文編號:3348931
【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
多路卷積神經(jīng)網(wǎng)絡框架
每一列都進行歸一化處理,以更好地進行可視化?梢暬Y(jié)果如圖 3.4 所示,紅色表示高權(quán)重,而藍色表示低權(quán)重。圖3.4 原始 ResNet-50 中的全連接層權(quán)重從圖 3.4 中我們可以看出原始 ResNet 在學習的過程中,全局平均池化輸出的特征傾向于分配給某一特定類型的輸出,而沒有很好地實現(xiàn)特征的復用。接下來,我們進一步分析 ResNet 所學習到的全連接權(quán)重與各類別的樣本數(shù)量的關(guān)系。由于經(jīng)過卷積網(wǎng)絡以及全局平均池化后獲取的特征通過全連接層直接與各類別的預測結(jié)果相連接,通過分析全連接層學習得到的權(quán)重,即可獲取各特征對最終各類別目標分類結(jié)果的影響。我們通過兩種方式衡量各個特征對某一類別的影響程度,也
本文編號:3348931
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3348931.html
最近更新
教材專著