基于融合語義和CapsNet的圖像識別方法研究
發(fā)布時間:2024-02-19 23:29
圖像識別指利用計算機對圖像信息進行處理和分析,從而對圖像中包含的目標(biāo)類別進行劃分。圖像的識別具有非常廣泛的應(yīng)用,如指紋識別、人臉識別和交通標(biāo)志識別等。現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)圖像識別方法,由于其具有強大的特征學(xué)習(xí)能力,在識別準(zhǔn)確率上表現(xiàn)優(yōu)異。但是,該類方法是基于數(shù)據(jù)驅(qū)動,存在樣本需求量大,訓(xùn)練時間長,調(diào)參困難等缺陷。本論文主要研究并實現(xiàn)了一種融合語義和膠囊網(wǎng)絡(luò)(Capsule Network,CapsNet)的圖像識別方法。圖像語義是指視覺接收圖像信號形成的結(jié)構(gòu)化知識描述,包含一系列可理解、可解釋的信息。該方法通過融合圖像的語義和CapsNet,提高訓(xùn)練數(shù)據(jù)的利用率,可在較少樣本集訓(xùn)練的情況下,達到較好的識別效果。該方法可以有效緩解深度學(xué)習(xí)模型依賴大量訓(xùn)練樣本的問題。具體工作內(nèi)容如下:(1)本文提出一種基于語義的識別網(wǎng)絡(luò),模擬人對圖像中不同類別目標(biāo)的認知過程:依據(jù)不同類別的目標(biāo)具有其特定的知識描述――語義,對目標(biāo)進行分類識別。不同的語義之間具有一定的層級關(guān)系,圖像中語義往往由若干子語義組成,子語義可以繼續(xù)不斷劃分,直到不能拆解時稱為語義基元,本文構(gòu)建語義網(wǎng)絡(luò)來描述語義基元與語義的關(guān)系,通過對...
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3903492
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.4德國交通標(biāo)志中部分基元組合示例
視覺感知到圖像中的基本信息,它是描述待測目標(biāo)的基本組成部分,分析并確定基元的個數(shù),對圖像進行基元提取,獲得語義信息。給出交通標(biāo)志中部分基元組合形式如圖2.4所示。圖2.4德國交通標(biāo)志中部分基元組合示例形如其中機動車禁止通行標(biāo)志可以分解為紅色的圓環(huán)和小車輪廓,通過識別圖像中包含的紅....
圖3.6激活函數(shù)圖形(3)池化層
0。常見激活函數(shù)圖形如圖3.6所示。30
圖4.4膠囊網(wǎng)絡(luò)損失函數(shù)圖形
2范數(shù)歸一化,指將向量中各元素的先平方后求和,再求平方根的過程。損失函數(shù)取值如圖4.4所示。圖4.4膠囊網(wǎng)絡(luò)損失函數(shù)圖形4.3.2語語義義模模型型損損失失函函數(shù)數(shù)設(shè)設(shè)計計語義模型的訓(xùn)練過程主要是,利用損失函數(shù)公式(4-3),計算與訓(xùn)練樣本實際類別標(biāo)簽的損失值,這個損失值就是語義....
圖4.5調(diào)節(jié)系數(shù)函數(shù)
調(diào)節(jié)系數(shù)函數(shù)(4-4)圖形如圖4.5所示。計算表達式中用來控制曲線變化的快慢程度,控制曲線起始變化的位置的左右。圖4.5調(diào)節(jié)系數(shù)函數(shù)53
本文編號:3903492
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3903492.html
最近更新
教材專著