天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于膠囊網(wǎng)絡(luò)的多標(biāo)簽圖像分類和語(yǔ)義分割

發(fā)布時(shí)間:2020-12-25 02:57
  膠囊網(wǎng)絡(luò)這一概念一經(jīng)提出便得到了人們廣泛的關(guān)注和運(yùn)用。膠囊網(wǎng)絡(luò)的理論基礎(chǔ)是,人類大腦運(yùn)行著一種機(jī)制,這種機(jī)制將低層次的視覺(jué)信息傳遞到它認(rèn)為能最好處理這些信息的神經(jīng)元。人類使用膠囊網(wǎng)絡(luò)模仿這種機(jī)制,機(jī)器中的膠囊除存儲(chǔ)物體的特征信息之外,還可以存儲(chǔ)物體的位姿信息(位置、方向、角度),并且膠囊之間的連接方式可以進(jìn)行信息的不損失傳遞。膠囊網(wǎng)絡(luò)在單標(biāo)簽圖像分類上有較好的表現(xiàn),它在MNIST以及Cifar-10等數(shù)據(jù)集上的分類結(jié)果都優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)。但是膠囊網(wǎng)絡(luò)在更加復(fù)雜的數(shù)據(jù)集或者計(jì)算機(jī)視覺(jué)的其他領(lǐng)域能否也有優(yōu)異的表現(xiàn)這還未可知。本文針對(duì)膠囊網(wǎng)絡(luò)的這些應(yīng)用限制做出分析,結(jié)合用于多標(biāo)簽圖像分類和語(yǔ)義分割的卷積神經(jīng)網(wǎng)絡(luò)的特性,改進(jìn)膠囊網(wǎng)絡(luò)的結(jié)構(gòu),使之能夠應(yīng)用于多標(biāo)簽圖像分類任務(wù)和語(yǔ)義分割任務(wù),且性能上優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)。本文的主要研究工作和貢獻(xiàn)歸納如下:1、提出適合于多標(biāo)簽分類的膠囊動(dòng)態(tài)路由方法,通過(guò)分散低層膠囊到高層膠囊的激活量,令膠囊網(wǎng)絡(luò)可以對(duì)多個(gè)標(biāo)簽進(jìn)行響應(yīng)。同時(shí),針對(duì)多標(biāo)簽分類任務(wù)輸入較大的情況,提出將膠囊層嵌入至卷積層之后的方法,消除膠囊層容量不足的限制;并且提出使用概率參數(shù)綁定膠囊之間連接... 

【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:54 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于膠囊網(wǎng)絡(luò)的多標(biāo)簽圖像分類和語(yǔ)義分割


MNIST手寫(xiě)數(shù)字

五官,正常人,膠囊,卷積


蘭州大學(xué)碩士學(xué)位論文基于膠囊網(wǎng)絡(luò)的多標(biāo)簽圖像分類和語(yǔ)義分割9第二章膠囊網(wǎng)絡(luò)技術(shù)本文的全部工作都基于膠囊網(wǎng)絡(luò)結(jié)構(gòu)理論,所以本節(jié)中先介紹膠囊網(wǎng)絡(luò)的幾個(gè)關(guān)鍵要點(diǎn):膠囊封裝,向量激活,動(dòng)態(tài)路由算法。之后本節(jié)會(huì)分析膠囊網(wǎng)絡(luò)相對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)和劣勢(shì),以及將膠囊網(wǎng)絡(luò)應(yīng)用于更多領(lǐng)域的難點(diǎn)。2.1膠囊網(wǎng)絡(luò)的基本原理2.1.1卷積神經(jīng)網(wǎng)絡(luò)的缺陷Hinton等人提出膠囊網(wǎng)絡(luò)的依據(jù)是,他們分析得出卷積神經(jīng)網(wǎng)絡(luò)有兩個(gè)缺陷:特征無(wú)關(guān)性和池化信息損失。卷積神經(jīng)網(wǎng)絡(luò)的工作原理是通過(guò)多層濾波器提取輸入的特征,再通過(guò)計(jì)算特征與目標(biāo)的契合程度進(jìn)行結(jié)果預(yù)測(cè)。以圖2-1人臉為例,圖片左邊部分是一張正常的人臉,而右邊部分雖然擁有人臉的所有器官,但是從人類視覺(jué)上看,這些器官的位置組合并不能構(gòu)成一個(gè)正常的人臉。但是對(duì)卷積神經(jīng)網(wǎng)絡(luò)而言,它只能使用濾波器提取到每個(gè)器官的特征信息,再對(duì)提取的信息做線性累加,通過(guò)計(jì)算累加值的大小判斷圖片中是否包含目標(biāo),所以卷積神經(jīng)網(wǎng)絡(luò)會(huì)認(rèn)為圖片的左右兩邊都是正常的人臉。圖2-1正常人臉和五官混亂的“人臉”卷積神經(jīng)網(wǎng)絡(luò)第二個(gè)缺陷是其池化層,Hinton等人認(rèn)為卷積神經(jīng)網(wǎng)絡(luò)池化過(guò)程中只保留響應(yīng)最高的神經(jīng)元而丟棄其他所有神經(jīng)元的行為極大地?fù)p失了圖片有效信息。如圖2-2所示,最大池化會(huì)保留區(qū)域中最大的激活值,但是區(qū)域中的其他激活值會(huì)被丟棄。這一點(diǎn)在全卷積網(wǎng)絡(luò)FCN[44]中也被提及,F(xiàn)CN解決池化層丟失細(xì)節(jié)信息的措施是將池化前的特征層保留,在最后特征結(jié)算時(shí)將這些保留的特征也融合進(jìn)去,從而減少信息的損失。


本文編號(hào):2936820

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2936820.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶94e79***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com