基于深度神經(jīng)網(wǎng)絡(luò)的細(xì)粒度圖像分類方法研究
發(fā)布時間:2021-04-01 14:19
細(xì)粒度圖像分類一直是計算機(jī)視覺領(lǐng)域中一個重要的研究方向,它在工業(yè)界和學(xué)術(shù)界都有著強(qiáng)烈的研究需求。隨著深度神經(jīng)網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展以及大規(guī)模訓(xùn)練數(shù)據(jù)集的出現(xiàn),普通的圖像識別任務(wù)已經(jīng)取得了巨大的成功,然而細(xì)粒度分類識別還有著很大的提升空間。細(xì)粒度分類的難點(diǎn)主要在于細(xì)粒度圖像具有類間差異較小、類內(nèi)差異較大以及圖像目標(biāo)物體不突出的問題,所以如何能準(zhǔn)確地提取出圖像中目標(biāo)物體位置以及目標(biāo)物體具有判別性的特征是解決細(xì)粒度分類任務(wù)的關(guān)鍵。傳統(tǒng)的深度卷積神經(jīng)網(wǎng)絡(luò)雖然能夠有效地挖掘出圖像的基本輪廓、紋理等特征信息,但是都不足以區(qū)分細(xì)粒度圖像。雙線性卷積神經(jīng)網(wǎng)絡(luò)是一種解決弱監(jiān)督細(xì)粒度分類問題的模型,但是存在參數(shù)量過多、預(yù)測精度不夠高等問題。本文主要針對上述兩個問題,提出了對應(yīng)的改進(jìn)方法。本文的主要工作如下:(1)針對雙線性卷積網(wǎng)絡(luò)參數(shù)量過多,不利于模型訓(xùn)練及部署的問題,本文結(jié)合分組卷積的思想,提出了一種基于特征分組的雙線性卷積模型。經(jīng)實驗表明,該模型能夠在犧牲少許精度的情況下,有效地將模型的參數(shù)量壓縮到原有模型的1/3。(2)通過調(diào)研注意力機(jī)制在圖像領(lǐng)域的應(yīng)用,將雙線性卷積模型結(jié)合兩種不同的注意力模塊,提出了...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)
電子科技大學(xué)碩士學(xué)位論文82.1.2感知機(jī)與多層網(wǎng)絡(luò)感知機(jī)是神經(jīng)網(wǎng)絡(luò)的一種簡單結(jié)構(gòu),它由兩層的神經(jīng)元構(gòu)成,其結(jié)構(gòu)如圖2-2所示。圖2-2感知器結(jié)構(gòu)圖中輸入層包含了兩個神經(jīng)元12x,x,主要負(fù)責(zé)接收外部的輸入信號。然后將信號傳輸?shù)捷敵鰧又械纳窠?jīng)元。值得注意的是,感知器只有輸出層神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能性的神經(jīng)元,這就造成感知器模型的學(xué)習(xí)能力非常有限,一般只能解決線性求解問題。所以如果要解決非線性的問題,需要考慮使用多層神經(jīng)元結(jié)構(gòu),如圖2-3所示。圖2-3多層網(wǎng)絡(luò)結(jié)構(gòu)每層中的神經(jīng)元都與下一層的所有神經(jīng)元相連接,而同一層神經(jīng)元之間沒有連接,也不會存在跨層連接的情況。這樣的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)稱為“多層前饋神經(jīng)網(wǎng)絡(luò)”。網(wǎng)絡(luò)中的輸入層神經(jīng)元用于接收外界的輸入信號,隱藏層神經(jīng)元則對輸入層的輸出進(jìn)行變換處理,最終由輸出層神經(jīng)元輸出結(jié)果。所以輸入層神經(jīng)元僅是接收輸入,不會對特征數(shù)據(jù)做非線性變換處理。而隱藏層與輸出層這兩層網(wǎng)絡(luò)則是由功能性神經(jīng)元組成,它們具有一定的非線性變換能力。因此,這類神經(jīng)網(wǎng)絡(luò)
電子科技大學(xué)碩士學(xué)位論文82.1.2感知機(jī)與多層網(wǎng)絡(luò)感知機(jī)是神經(jīng)網(wǎng)絡(luò)的一種簡單結(jié)構(gòu),它由兩層的神經(jīng)元構(gòu)成,其結(jié)構(gòu)如圖2-2所示。圖2-2感知器結(jié)構(gòu)圖中輸入層包含了兩個神經(jīng)元12x,x,主要負(fù)責(zé)接收外部的輸入信號。然后將信號傳輸?shù)捷敵鰧又械纳窠?jīng)元。值得注意的是,感知器只有輸出層神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能性的神經(jīng)元,這就造成感知器模型的學(xué)習(xí)能力非常有限,一般只能解決線性求解問題。所以如果要解決非線性的問題,需要考慮使用多層神經(jīng)元結(jié)構(gòu),如圖2-3所示。圖2-3多層網(wǎng)絡(luò)結(jié)構(gòu)每層中的神經(jīng)元都與下一層的所有神經(jīng)元相連接,而同一層神經(jīng)元之間沒有連接,也不會存在跨層連接的情況。這樣的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)稱為“多層前饋神經(jīng)網(wǎng)絡(luò)”。網(wǎng)絡(luò)中的輸入層神經(jīng)元用于接收外界的輸入信號,隱藏層神經(jīng)元則對輸入層的輸出進(jìn)行變換處理,最終由輸出層神經(jīng)元輸出結(jié)果。所以輸入層神經(jīng)元僅是接收輸入,不會對特征數(shù)據(jù)做非線性變換處理。而隱藏層與輸出層這兩層網(wǎng)絡(luò)則是由功能性神經(jīng)元組成,它們具有一定的非線性變換能力。因此,這類神經(jīng)網(wǎng)絡(luò)
【參考文獻(xiàn)】:
期刊論文
[1]A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J]. Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan. International Journal of Automation and Computing. 2017(02)
本文編號:3113481
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
神經(jīng)元結(jié)構(gòu)
電子科技大學(xué)碩士學(xué)位論文82.1.2感知機(jī)與多層網(wǎng)絡(luò)感知機(jī)是神經(jīng)網(wǎng)絡(luò)的一種簡單結(jié)構(gòu),它由兩層的神經(jīng)元構(gòu)成,其結(jié)構(gòu)如圖2-2所示。圖2-2感知器結(jié)構(gòu)圖中輸入層包含了兩個神經(jīng)元12x,x,主要負(fù)責(zé)接收外部的輸入信號。然后將信號傳輸?shù)捷敵鰧又械纳窠?jīng)元。值得注意的是,感知器只有輸出層神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能性的神經(jīng)元,這就造成感知器模型的學(xué)習(xí)能力非常有限,一般只能解決線性求解問題。所以如果要解決非線性的問題,需要考慮使用多層神經(jīng)元結(jié)構(gòu),如圖2-3所示。圖2-3多層網(wǎng)絡(luò)結(jié)構(gòu)每層中的神經(jīng)元都與下一層的所有神經(jīng)元相連接,而同一層神經(jīng)元之間沒有連接,也不會存在跨層連接的情況。這樣的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)稱為“多層前饋神經(jīng)網(wǎng)絡(luò)”。網(wǎng)絡(luò)中的輸入層神經(jīng)元用于接收外界的輸入信號,隱藏層神經(jīng)元則對輸入層的輸出進(jìn)行變換處理,最終由輸出層神經(jīng)元輸出結(jié)果。所以輸入層神經(jīng)元僅是接收輸入,不會對特征數(shù)據(jù)做非線性變換處理。而隱藏層與輸出層這兩層網(wǎng)絡(luò)則是由功能性神經(jīng)元組成,它們具有一定的非線性變換能力。因此,這類神經(jīng)網(wǎng)絡(luò)
電子科技大學(xué)碩士學(xué)位論文82.1.2感知機(jī)與多層網(wǎng)絡(luò)感知機(jī)是神經(jīng)網(wǎng)絡(luò)的一種簡單結(jié)構(gòu),它由兩層的神經(jīng)元構(gòu)成,其結(jié)構(gòu)如圖2-2所示。圖2-2感知器結(jié)構(gòu)圖中輸入層包含了兩個神經(jīng)元12x,x,主要負(fù)責(zé)接收外部的輸入信號。然后將信號傳輸?shù)捷敵鰧又械纳窠?jīng)元。值得注意的是,感知器只有輸出層神經(jīng)元進(jìn)行激活函數(shù)處理,即只擁有一層功能性的神經(jīng)元,這就造成感知器模型的學(xué)習(xí)能力非常有限,一般只能解決線性求解問題。所以如果要解決非線性的問題,需要考慮使用多層神經(jīng)元結(jié)構(gòu),如圖2-3所示。圖2-3多層網(wǎng)絡(luò)結(jié)構(gòu)每層中的神經(jīng)元都與下一層的所有神經(jīng)元相連接,而同一層神經(jīng)元之間沒有連接,也不會存在跨層連接的情況。這樣的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)稱為“多層前饋神經(jīng)網(wǎng)絡(luò)”。網(wǎng)絡(luò)中的輸入層神經(jīng)元用于接收外界的輸入信號,隱藏層神經(jīng)元則對輸入層的輸出進(jìn)行變換處理,最終由輸出層神經(jīng)元輸出結(jié)果。所以輸入層神經(jīng)元僅是接收輸入,不會對特征數(shù)據(jù)做非線性變換處理。而隱藏層與輸出層這兩層網(wǎng)絡(luò)則是由功能性神經(jīng)元組成,它們具有一定的非線性變換能力。因此,這類神經(jīng)網(wǎng)絡(luò)
【參考文獻(xiàn)】:
期刊論文
[1]A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J]. Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan. International Journal of Automation and Computing. 2017(02)
本文編號:3113481
本文鏈接:http://sikaile.net/guanlilunwen/pinpaiwenhualunwen/3113481.html
最近更新
教材專著