基于Octave卷積和自注意力機(jī)制的車型識(shí)別研究
發(fā)布時(shí)間:2021-12-09 10:44
隨著數(shù)據(jù)中圖像信息的增長(zhǎng),對(duì)圖像和視頻的分析、信息提取越來(lái)越重要,如何對(duì)圖像進(jìn)行精準(zhǔn)分析、分類,提高圖像識(shí)別的準(zhǔn)確率是現(xiàn)階段研究人員的主要研究方向之一。人工智能技術(shù)、機(jī)器學(xué)習(xí)的快速發(fā)展和卷積神經(jīng)網(wǎng)絡(luò)的提出讓圖像分類領(lǐng)域取得了新的進(jìn)展。為了更好的提高圖像識(shí)別的準(zhǔn)確度,本文對(duì)卷積神經(jīng)網(wǎng)絡(luò)中的卷積層進(jìn)行了改進(jìn),并添加了通道域自注意力機(jī)制。本文主要貢獻(xiàn)為:(1)為了提高卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率,提出一種基于Octave卷積層結(jié)構(gòu)的OCM(Octave Convention Multilayer Perceptron)優(yōu)化卷積層和OCM神經(jīng)網(wǎng)絡(luò)。和傳統(tǒng)卷積層相比,OCM卷積層結(jié)構(gòu)中添加了一個(gè)多層感知器,可以提高卷積層的非線性表達(dá)能力。和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,基于OCM卷積層的OCM神經(jīng)網(wǎng)絡(luò)擴(kuò)大了特征圖中低頻分量的感受野,提高卷積層捕獲上下文信息的能力。實(shí)驗(yàn)結(jié)果表明,在CIFAR-10和CIFAR-100數(shù)據(jù)集上,本文提出的OCM卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)模型相比,圖像識(shí)別準(zhǔn)確率分別提高了5.5%和9.8%。(2)針對(duì)通道域注意力機(jī)制Excitation操作的激活函數(shù)出現(xiàn)的梯度消失問(wèn)題,采用了新的激活函數(shù),函...
【文章來(lái)源】:河南大學(xué)河南省
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
AlexNet網(wǎng)絡(luò)結(jié)構(gòu)圖
VGG結(jié)構(gòu)圖
不同結(jié)構(gòu)的VGG神經(jīng)網(wǎng)絡(luò)(配置D的識(shí)別效果最好)
本文編號(hào):3530501
【文章來(lái)源】:河南大學(xué)河南省
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
AlexNet網(wǎng)絡(luò)結(jié)構(gòu)圖
VGG結(jié)構(gòu)圖
不同結(jié)構(gòu)的VGG神經(jīng)網(wǎng)絡(luò)(配置D的識(shí)別效果最好)
本文編號(hào):3530501
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3530501.html
最近更新
教材專著