基于膠囊網(wǎng)絡(luò)的多標(biāo)簽圖像分類和語(yǔ)義分割
發(fā)布時(shí)間:2020-12-25 02:57
膠囊網(wǎng)絡(luò)這一概念一經(jīng)提出便得到了人們廣泛的關(guān)注和運(yùn)用。膠囊網(wǎng)絡(luò)的理論基礎(chǔ)是,人類大腦運(yùn)行著一種機(jī)制,這種機(jī)制將低層次的視覺(jué)信息傳遞到它認(rèn)為能最好處理這些信息的神經(jīng)元。人類使用膠囊網(wǎng)絡(luò)模仿這種機(jī)制,機(jī)器中的膠囊除存儲(chǔ)物體的特征信息之外,還可以存儲(chǔ)物體的位姿信息(位置、方向、角度),并且膠囊之間的連接方式可以進(jìn)行信息的不損失傳遞。膠囊網(wǎng)絡(luò)在單標(biāo)簽圖像分類上有較好的表現(xiàn),它在MNIST以及Cifar-10等數(shù)據(jù)集上的分類結(jié)果都優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)。但是膠囊網(wǎng)絡(luò)在更加復(fù)雜的數(shù)據(jù)集或者計(jì)算機(jī)視覺(jué)的其他領(lǐng)域能否也有優(yōu)異的表現(xiàn)這還未可知。本文針對(duì)膠囊網(wǎng)絡(luò)的這些應(yīng)用限制做出分析,結(jié)合用于多標(biāo)簽圖像分類和語(yǔ)義分割的卷積神經(jīng)網(wǎng)絡(luò)的特性,改進(jìn)膠囊網(wǎng)絡(luò)的結(jié)構(gòu),使之能夠應(yīng)用于多標(biāo)簽圖像分類任務(wù)和語(yǔ)義分割任務(wù),且性能上優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)。本文的主要研究工作和貢獻(xiàn)歸納如下:1、提出適合于多標(biāo)簽分類的膠囊動(dòng)態(tài)路由方法,通過(guò)分散低層膠囊到高層膠囊的激活量,令膠囊網(wǎng)絡(luò)可以對(duì)多個(gè)標(biāo)簽進(jìn)行響應(yīng)。同時(shí),針對(duì)多標(biāo)簽分類任務(wù)輸入較大的情況,提出將膠囊層嵌入至卷積層之后的方法,消除膠囊層容量不足的限制;并且提出使用概率參數(shù)綁定膠囊之間連接...
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
MNIST手寫(xiě)數(shù)字
蘭州大學(xué)碩士學(xué)位論文基于膠囊網(wǎng)絡(luò)的多標(biāo)簽圖像分類和語(yǔ)義分割9第二章膠囊網(wǎng)絡(luò)技術(shù)本文的全部工作都基于膠囊網(wǎng)絡(luò)結(jié)構(gòu)理論,所以本節(jié)中先介紹膠囊網(wǎng)絡(luò)的幾個(gè)關(guān)鍵要點(diǎn):膠囊封裝,向量激活,動(dòng)態(tài)路由算法。之后本節(jié)會(huì)分析膠囊網(wǎng)絡(luò)相對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)和劣勢(shì),以及將膠囊網(wǎng)絡(luò)應(yīng)用于更多領(lǐng)域的難點(diǎn)。2.1膠囊網(wǎng)絡(luò)的基本原理2.1.1卷積神經(jīng)網(wǎng)絡(luò)的缺陷Hinton等人提出膠囊網(wǎng)絡(luò)的依據(jù)是,他們分析得出卷積神經(jīng)網(wǎng)絡(luò)有兩個(gè)缺陷:特征無(wú)關(guān)性和池化信息損失。卷積神經(jīng)網(wǎng)絡(luò)的工作原理是通過(guò)多層濾波器提取輸入的特征,再通過(guò)計(jì)算特征與目標(biāo)的契合程度進(jìn)行結(jié)果預(yù)測(cè)。以圖2-1人臉為例,圖片左邊部分是一張正常的人臉,而右邊部分雖然擁有人臉的所有器官,但是從人類視覺(jué)上看,這些器官的位置組合并不能構(gòu)成一個(gè)正常的人臉。但是對(duì)卷積神經(jīng)網(wǎng)絡(luò)而言,它只能使用濾波器提取到每個(gè)器官的特征信息,再對(duì)提取的信息做線性累加,通過(guò)計(jì)算累加值的大小判斷圖片中是否包含目標(biāo),所以卷積神經(jīng)網(wǎng)絡(luò)會(huì)認(rèn)為圖片的左右兩邊都是正常的人臉。圖2-1正常人臉和五官混亂的“人臉”卷積神經(jīng)網(wǎng)絡(luò)第二個(gè)缺陷是其池化層,Hinton等人認(rèn)為卷積神經(jīng)網(wǎng)絡(luò)池化過(guò)程中只保留響應(yīng)最高的神經(jīng)元而丟棄其他所有神經(jīng)元的行為極大地?fù)p失了圖片有效信息。如圖2-2所示,最大池化會(huì)保留區(qū)域中最大的激活值,但是區(qū)域中的其他激活值會(huì)被丟棄。這一點(diǎn)在全卷積網(wǎng)絡(luò)FCN[44]中也被提及,F(xiàn)CN解決池化層丟失細(xì)節(jié)信息的措施是將池化前的特征層保留,在最后特征結(jié)算時(shí)將這些保留的特征也融合進(jìn)去,從而減少信息的損失。
本文編號(hào):2936820
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
MNIST手寫(xiě)數(shù)字
蘭州大學(xué)碩士學(xué)位論文基于膠囊網(wǎng)絡(luò)的多標(biāo)簽圖像分類和語(yǔ)義分割9第二章膠囊網(wǎng)絡(luò)技術(shù)本文的全部工作都基于膠囊網(wǎng)絡(luò)結(jié)構(gòu)理論,所以本節(jié)中先介紹膠囊網(wǎng)絡(luò)的幾個(gè)關(guān)鍵要點(diǎn):膠囊封裝,向量激活,動(dòng)態(tài)路由算法。之后本節(jié)會(huì)分析膠囊網(wǎng)絡(luò)相對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)和劣勢(shì),以及將膠囊網(wǎng)絡(luò)應(yīng)用于更多領(lǐng)域的難點(diǎn)。2.1膠囊網(wǎng)絡(luò)的基本原理2.1.1卷積神經(jīng)網(wǎng)絡(luò)的缺陷Hinton等人提出膠囊網(wǎng)絡(luò)的依據(jù)是,他們分析得出卷積神經(jīng)網(wǎng)絡(luò)有兩個(gè)缺陷:特征無(wú)關(guān)性和池化信息損失。卷積神經(jīng)網(wǎng)絡(luò)的工作原理是通過(guò)多層濾波器提取輸入的特征,再通過(guò)計(jì)算特征與目標(biāo)的契合程度進(jìn)行結(jié)果預(yù)測(cè)。以圖2-1人臉為例,圖片左邊部分是一張正常的人臉,而右邊部分雖然擁有人臉的所有器官,但是從人類視覺(jué)上看,這些器官的位置組合并不能構(gòu)成一個(gè)正常的人臉。但是對(duì)卷積神經(jīng)網(wǎng)絡(luò)而言,它只能使用濾波器提取到每個(gè)器官的特征信息,再對(duì)提取的信息做線性累加,通過(guò)計(jì)算累加值的大小判斷圖片中是否包含目標(biāo),所以卷積神經(jīng)網(wǎng)絡(luò)會(huì)認(rèn)為圖片的左右兩邊都是正常的人臉。圖2-1正常人臉和五官混亂的“人臉”卷積神經(jīng)網(wǎng)絡(luò)第二個(gè)缺陷是其池化層,Hinton等人認(rèn)為卷積神經(jīng)網(wǎng)絡(luò)池化過(guò)程中只保留響應(yīng)最高的神經(jīng)元而丟棄其他所有神經(jīng)元的行為極大地?fù)p失了圖片有效信息。如圖2-2所示,最大池化會(huì)保留區(qū)域中最大的激活值,但是區(qū)域中的其他激活值會(huì)被丟棄。這一點(diǎn)在全卷積網(wǎng)絡(luò)FCN[44]中也被提及,F(xiàn)CN解決池化層丟失細(xì)節(jié)信息的措施是將池化前的特征層保留,在最后特征結(jié)算時(shí)將這些保留的特征也融合進(jìn)去,從而減少信息的損失。
本文編號(hào):2936820
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2936820.html
最近更新
教材專著