卷積神經(jīng)網(wǎng)絡(luò)的改進(jìn)及其在圖像分類中應(yīng)用研究
發(fā)布時(shí)間:2020-06-03 23:41
【摘要】:圖像分類是指挖掘和獲取圖像信息中所呈現(xiàn)的不同特征,將不同類別的圖像數(shù)據(jù)區(qū)分的圖像處理技術(shù)。圖像分類的核心內(nèi)容在于圖像特征的提取,提取到高級(jí)語(yǔ)義特征可正確理解圖像的內(nèi)容或本質(zhì),從而提升圖像分類精度。隨著大數(shù)據(jù)時(shí)代的到來(lái)和互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,深度學(xué)習(xí)方法已成為圖像分類任務(wù)中的研究熱點(diǎn)。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)技術(shù)中應(yīng)用最為廣泛的方法之一,具有強(qiáng)大的特征提取能力和非線性擬合數(shù)據(jù)能力,是現(xiàn)今圖像分類任務(wù)中最為有效的算法之一。許多研究人員對(duì)卷積神經(jīng)網(wǎng)絡(luò)和圖像分類技術(shù)開(kāi)展了大量的研究并取得了優(yōu)良的進(jìn)展,但卷積神經(jīng)網(wǎng)絡(luò)方法仍存在著網(wǎng)絡(luò)模型復(fù)雜、訓(xùn)練時(shí)間過(guò)長(zhǎng)、過(guò)多占用計(jì)算資源、收斂速度慢、網(wǎng)絡(luò)過(guò)擬合以及分類精度有待提高等不足。因此,對(duì)卷積神經(jīng)網(wǎng)絡(luò)相關(guān)技術(shù)進(jìn)行改進(jìn),設(shè)計(jì)性能更優(yōu)的卷積神經(jīng)網(wǎng)絡(luò)方法用于圖像分類已成為重要的研究方向之一。(1)針對(duì)深層模型結(jié)構(gòu)復(fù)雜、參數(shù)龐大、訓(xùn)練時(shí)間過(guò)長(zhǎng)、網(wǎng)絡(luò)易過(guò)擬合、泛化能力較弱以及識(shí)別精度有待提升等問(wèn)題,提出了深層網(wǎng)絡(luò)遷移的花卉圖像分類方法。深層網(wǎng)絡(luò)采用經(jīng)典的網(wǎng)絡(luò)結(jié)構(gòu):VGG16、VGG19、InceptionV3和ResNet50。首先在ImageNet數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,使深層網(wǎng)絡(luò)參數(shù)具備自然場(chǎng)景下圖像的特征提取性能以及獲得網(wǎng)絡(luò)的優(yōu)化參數(shù)等;再將預(yù)訓(xùn)練模型輸入到目標(biāo)數(shù)據(jù)集中進(jìn)行遷移訓(xùn)練,進(jìn)一步進(jìn)行網(wǎng)絡(luò)訓(xùn)練和參數(shù)優(yōu)化,獲得花卉數(shù)據(jù)的豐富的高級(jí)語(yǔ)義信息,并與隨機(jī)初始化網(wǎng)絡(luò)進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,ResNet50遷移方法的識(shí)別性能最佳,在Oxford-102數(shù)據(jù)集的分類準(zhǔn)確度達(dá)到了96.57%,并在Oxford-17數(shù)據(jù)集上的分類精度也達(dá)到95.29%,且在廣西花卉數(shù)據(jù)集中表現(xiàn)優(yōu)良,該模型均具有良好的識(shí)別精度和魯棒性。(2)為進(jìn)一步提升Oxford標(biāo)準(zhǔn)花卉數(shù)據(jù)集的識(shí)別精度,減少網(wǎng)絡(luò)訓(xùn)練時(shí)間,有效提升模型魯棒性和泛化能力,在遷移方法的基礎(chǔ)上提出深層網(wǎng)絡(luò)二次遷移技術(shù)。通過(guò)ImageNet數(shù)據(jù)集訓(xùn)練后得到的預(yù)訓(xùn)練模型,遷移到廣西花卉數(shù)據(jù)集中進(jìn)一步訓(xùn)練網(wǎng)絡(luò)和優(yōu)化參數(shù),得到的花卉遷移訓(xùn)練模型再次遷移到Oxford標(biāo)準(zhǔn)花卉數(shù)據(jù)集中。實(shí)驗(yàn)結(jié)果表明,二次遷移方法相比于遷移學(xué)習(xí)方法,在模型的識(shí)別精度和泛化能力上均有顯著提升,ResNet50二次遷移方法在Oxford-102數(shù)據(jù)集的分類準(zhǔn)確度達(dá)到97%。(3)針對(duì)卷積神經(jīng)網(wǎng)絡(luò)中參數(shù)量過(guò)多導(dǎo)致網(wǎng)絡(luò)陷入過(guò)擬合以及層數(shù)過(guò)多、參數(shù)過(guò)大引起精度下降等網(wǎng)絡(luò)退化問(wèn)題,提出了一種改進(jìn)的淺層的稠密卷積神經(jīng)網(wǎng)絡(luò)方法(DenseNet-S)。在原始的稠密網(wǎng)絡(luò)中,引入改進(jìn)的SqueezeNet中的fire模塊,并針對(duì)壓縮參數(shù)帶來(lái)的模型特征提取能力下降問(wèn)題,提出二維卷積核分離技術(shù)來(lái)獲取目標(biāo)多樣性的多尺度特征,從而提升模型的特征提取能力。本文將提出的模型與原始稠密網(wǎng)絡(luò)進(jìn)行對(duì)比,并與經(jīng)典的深度學(xué)習(xí)進(jìn)行對(duì)比,以及在提出模型中進(jìn)行模型簡(jiǎn)化實(shí)驗(yàn)對(duì)比,多角度論證本文方法的有效性。
【圖文】:
ConovultinoConovultinoPooilgnConovultinoPooilgnPooilgnLinaer“horse”P(pán)redictionDense Block 1 Dense Block 2 Dense Block 3圖 2-3.包含三個(gè)稠密連接模塊的稠密網(wǎng)絡(luò)在稠密連接模塊中,第 l 層的特征圖xl是采用前面 l-1 個(gè)層數(shù)的特征圖x0, x1,…, xl 1計(jì)算得到:xl= Hl([x0, x1, … , xl 1]) (2-1)其中,[x0, x1, … , xl 1]是將第 0 層到第 l-1 層的特征圖進(jìn)行張量拼接,而Hl是由三種操作組成的復(fù)合函數(shù):批歸一化(Batch Normalization, BN),修正線性單元(RectifieLinear Unit,ReLU)以及二維卷積 3*3。為了避免出現(xiàn)特征的拼接問(wèn)題,需要在模塊中插入過(guò)渡層(transition layer)來(lái)改變特征圖的大小以完成張量的順利拼接,過(guò)渡層一般是由一個(gè) 1*1 卷積運(yùn)算和一個(gè) 2*2 平均池化操作組成。稠密連接模塊如圖 2-4 所示。
圖 3-1.Oxford Flowers 數(shù)據(jù)集部分示例據(jù)集是在南寧金花茶公園中拍攝的廣西花卉圖像數(shù)據(jù)集,有441 張圖像,每個(gè)類別的圖片有 300 張到 700 張不等的圖片,網(wǎng)絡(luò)訓(xùn)練之前本文對(duì)圖像進(jìn)行預(yù)處理操作,,并對(duì)其做了翻轉(zhuǎn)、數(shù)據(jù)集中有 6181 張圖片作為訓(xùn)練集,1130 張圖片作為驗(yàn)證。圖 3-2 給出了廣西花卉數(shù)據(jù)集中類別及示例圖。凹葉紅合歡 白嫦娥彩 赤丹 春節(jié) 大紅金心大花蕙蘭 扶綏中東金花茶 含笑 鶴頂蘭 紅嫦娥彩
【學(xué)位授予單位】:南寧師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP183
本文編號(hào):2695577
【圖文】:
ConovultinoConovultinoPooilgnConovultinoPooilgnPooilgnLinaer“horse”P(pán)redictionDense Block 1 Dense Block 2 Dense Block 3圖 2-3.包含三個(gè)稠密連接模塊的稠密網(wǎng)絡(luò)在稠密連接模塊中,第 l 層的特征圖xl是采用前面 l-1 個(gè)層數(shù)的特征圖x0, x1,…, xl 1計(jì)算得到:xl= Hl([x0, x1, … , xl 1]) (2-1)其中,[x0, x1, … , xl 1]是將第 0 層到第 l-1 層的特征圖進(jìn)行張量拼接,而Hl是由三種操作組成的復(fù)合函數(shù):批歸一化(Batch Normalization, BN),修正線性單元(RectifieLinear Unit,ReLU)以及二維卷積 3*3。為了避免出現(xiàn)特征的拼接問(wèn)題,需要在模塊中插入過(guò)渡層(transition layer)來(lái)改變特征圖的大小以完成張量的順利拼接,過(guò)渡層一般是由一個(gè) 1*1 卷積運(yùn)算和一個(gè) 2*2 平均池化操作組成。稠密連接模塊如圖 2-4 所示。
圖 3-1.Oxford Flowers 數(shù)據(jù)集部分示例據(jù)集是在南寧金花茶公園中拍攝的廣西花卉圖像數(shù)據(jù)集,有441 張圖像,每個(gè)類別的圖片有 300 張到 700 張不等的圖片,網(wǎng)絡(luò)訓(xùn)練之前本文對(duì)圖像進(jìn)行預(yù)處理操作,,并對(duì)其做了翻轉(zhuǎn)、數(shù)據(jù)集中有 6181 張圖片作為訓(xùn)練集,1130 張圖片作為驗(yàn)證。圖 3-2 給出了廣西花卉數(shù)據(jù)集中類別及示例圖。凹葉紅合歡 白嫦娥彩 赤丹 春節(jié) 大紅金心大花蕙蘭 扶綏中東金花茶 含笑 鶴頂蘭 紅嫦娥彩
【學(xué)位授予單位】:南寧師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP183
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 曹瑩;苗啟廣;劉家辰;高琳;;AdaBoost算法研究進(jìn)展與展望[J];自動(dòng)化學(xué)報(bào);2013年06期
2 邢杰;蕭德云;;基于PCA的概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年01期
3 劉斐;盧惠民;鄭志強(qiáng);;基于線性分類器的混合空間查找表顏色分類方法[J];中國(guó)圖象圖形學(xué)報(bào);2008年01期
4 欒麗華,吉根林;決策樹(shù)分類技術(shù)研究[J];計(jì)算機(jī)工程;2004年09期
本文編號(hào):2695577
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2695577.html
最近更新
教材專著