改進CNN的圖像分類模型研究
發(fā)布時間:2021-09-04 02:59
圖像分類任務(wù)一直是計算機視覺領(lǐng)域研究的熱點。面對浩如煙海的圖像分類數(shù)據(jù),傳統(tǒng)的特征處理方法已顯得捉襟見肘,而隨著計算機計算性能的提高,現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)解決了大部分的圖像分類問題,但仍面臨網(wǎng)絡(luò)構(gòu)建難度大、分類精度不高、計算消耗大等問題,以至于網(wǎng)絡(luò)模型無法得到進一步地推廣應(yīng)用。針對上述問題,本文從特征融合和權(quán)重共享的角度提出了改進的卷積神經(jīng)網(wǎng)絡(luò)模型,分別如下:第一,針對現(xiàn)有的卷積網(wǎng)絡(luò)僅僅依靠原圖像的學(xué)習(xí)特征預(yù)測待測圖像的類別,忽略人工設(shè)計特征對分類結(jié)果的影響,提出了一種新的融合顯著性特征和深度學(xué)習(xí)的圖像分類算法,該算法首先利用顯著性特征和原始圖像的BGR特征進行級聯(lián)融合,然后卷積網(wǎng)絡(luò)對融合后的多特征圖進行自動特征學(xué)習(xí),以提取圖像的多樣特征,最后利用Softmax分類器對圖像進行分類,數(shù)值實驗結(jié)果表明,所提模型是一種魯棒性強、分類效果好的新型圖像分類方法。第二,針對現(xiàn)有的大多數(shù)卷積網(wǎng)絡(luò)利用網(wǎng)絡(luò)深度而造成的巨大參數(shù)量和對輸入圖像的尺度特征缺乏魯棒性問題,提出了權(quán)重共享耦合卷積神經(jīng)網(wǎng)絡(luò)。首先,訓(xùn)練集上的圖像和經(jīng)縮放處理后的圖像同時輸入權(quán)重共享的耦合網(wǎng)絡(luò),以提取多尺度輸入特征;然后,在層級網(wǎng)絡(luò)內(nèi)...
【文章來源】:遼寧工程技術(shù)大學(xué)遼寧省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
人體神經(jīng)元工作示意圖
遼寧工程技術(shù)大學(xué)碩士學(xué)位論文82基礎(chǔ)理論知識2.1人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANNs)是仿造生物科學(xué)中神經(jīng)網(wǎng)絡(luò)信息傳遞方式,利用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)高度抽象大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),模擬大腦受到外界刺激后的響應(yīng)機制而建立的一個由許多非線性神經(jīng)元組成的分層系統(tǒng)模型。ANNs對輸入信息存儲,并使用一定的方式進行加工,最終學(xué)習(xí)到有效的特征,輸出有用的信息。2.1.1神經(jīng)元大腦神經(jīng)網(wǎng)絡(luò)由大量腦神經(jīng)元互相連接而成,以完成大腦的各種功能,而腦神經(jīng)元與細胞之間通過突觸傳遞信息[54],其具體工作原理可視為一個黑箱,如圖2.1所示,信息輸入黑箱,經(jīng)過一定的操作,輸出結(jié)果。圖2.1人體神經(jīng)元工作示意圖Figure2.1Schematicdiagramofhumanneuronwork根據(jù)人體腦神經(jīng)結(jié)構(gòu)可知,ANNs也有基本的人工神經(jīng)元,一個人工神經(jīng)元可以與多個其他人工神經(jīng)元通過權(quán)重進行相連,將總輸入與閾值進行比較,然后利用激活函數(shù)進行輸出處理[55],該過程可抽象為如圖2.2所示的拓?fù)浣Y(jié)構(gòu)。圖2.2多輸入神經(jīng)元模型Figure2.2Neuronmodelofmultipleinput該模型主要由兩部分構(gòu)成,第一部分進行信號累加,即
遼寧工程技術(shù)大學(xué)碩士學(xué)位論文10,0()0,=其他(2-6)顯然,其為分段函數(shù),它在閾值0以下的輸出都被截斷為0且導(dǎo)數(shù)恒為0,在閾值0以上的輸出則線性不變且導(dǎo)數(shù)恒為1,故不存在易飽和性缺點,但當(dāng)0時,其導(dǎo)數(shù)為0,則使得神經(jīng)元輸出滿足此條件便不再更新[57]。Krizhevsky等人早已證明ReLU的收斂速度比tanh快6倍[3]。2.1.3多層感知機多層感知機(Multi-LayerPerceptron,MLP)是一種簡單的神經(jīng)網(wǎng)絡(luò)。如圖2.3所示,一般可劃分為輸入層、隱藏層和輸出層等三部分,輸入層是將圖像數(shù)據(jù)信息進行變換后輸入網(wǎng)絡(luò)中;隱藏層則提取輸入圖像的特征,實現(xiàn)高維非線性映射;輸出層利用分類器對提取的特征進行分類處理[57]。研究證明:當(dāng)隱藏層神經(jīng)元足夠多時,全連接神經(jīng)網(wǎng)絡(luò)能夠以任意精度擬合某一連續(xù)函數(shù)[58]。但是,當(dāng)網(wǎng)絡(luò)深度加深時,網(wǎng)絡(luò)也面臨著參數(shù)量巨大、計算量大和訓(xùn)練困難等問題。圖2.3多層感知機示意圖Figure2.3SchematicdiagramofMulti-LayerPerceptron2.2卷積神經(jīng)網(wǎng)絡(luò)2.2.1卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)通常,卷積神經(jīng)網(wǎng)絡(luò)由若干個卷積層、非線性操作層、歸一化層、池化層和分類器組成的單一尺度結(jié)構(gòu)。如圖2.4所示,將卷積層、非線性操作層、歸一化層和池化層統(tǒng)稱為特征提取塊,一般情況,卷積神經(jīng)網(wǎng)絡(luò)由1~3個特征提取塊堆疊而成。
【參考文獻】:
期刊論文
[1]基于特征融合的室外天氣圖像分類[J]. 郭志強,胡永武,劉鵬,楊杰. 計算機應(yīng)用. 2020(04)
[2]基于遷移學(xué)習(xí)及特征融合的輪胎花紋圖像分類[J]. 劉穎,張帥,范九倫. 計算機工程與設(shè)計. 2019(05)
[3]自底向上的顯著性目標(biāo)檢測研究綜述[J]. 吳加瑩,楊賽,堵俊,林宏達. 計算機科學(xué). 2019(03)
[4]基于遷移學(xué)習(xí)和特征融合的航空器圖像分類算法[J]. 陳兵,查宇飛,張勝杰,李運強,張園強. 火力與指揮控制. 2018(07)
[5]多特征融合的花卉圖像深度學(xué)習(xí)分類算法[J]. 林思思,葉東毅,陳昭炯. 小型微型計算機系統(tǒng). 2018(07)
[6]CNN與人工特征提取快速識別斑馬線的方法[J]. 熊平,胡彩霞,周欣星. 電子設(shè)計工程. 2018(03)
[7]基于深度特征融合的中低分辨率車型識別[J]. 薛麗霞,鐘欣,汪榮貴,楊娟,胡敏. 計算機工程. 2019(01)
[8]模式分類中的特征融合方法[J]. 劉渭濱,鄒智元,邢薇薇. 北京郵電大學(xué)學(xué)報. 2017(04)
[9]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計算機應(yīng)用. 2016(09)
[10]融合低層和高層特征圖表示的圖像顯著性檢測算法[J]. 高思晗,張雷,李成龍,湯進. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2016(03)
博士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類研究[D]. 呂恩輝.中國礦業(yè)大學(xué) 2019
碩士論文
[1]深度對抗式數(shù)據(jù)增強技術(shù)在小規(guī)模數(shù)據(jù)集上的應(yīng)用研究[D]. 張曉峰.中國科學(xué)技術(shù)大學(xué) 2019
[2]基于集成卷積神經(jīng)網(wǎng)絡(luò)的圖像分類研究[D]. 寶阿春.中國礦業(yè)大學(xué) 2019
[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類[D]. 許佳.長沙理工大學(xué) 2017
[4]自適應(yīng)深度學(xué)習(xí)算法在目標(biāo)分類問題中的應(yīng)用[D]. 米龍.東北大學(xué) 2014
本文編號:3382420
【文章來源】:遼寧工程技術(shù)大學(xué)遼寧省
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
人體神經(jīng)元工作示意圖
遼寧工程技術(shù)大學(xué)碩士學(xué)位論文82基礎(chǔ)理論知識2.1人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANNs)是仿造生物科學(xué)中神經(jīng)網(wǎng)絡(luò)信息傳遞方式,利用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)高度抽象大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),模擬大腦受到外界刺激后的響應(yīng)機制而建立的一個由許多非線性神經(jīng)元組成的分層系統(tǒng)模型。ANNs對輸入信息存儲,并使用一定的方式進行加工,最終學(xué)習(xí)到有效的特征,輸出有用的信息。2.1.1神經(jīng)元大腦神經(jīng)網(wǎng)絡(luò)由大量腦神經(jīng)元互相連接而成,以完成大腦的各種功能,而腦神經(jīng)元與細胞之間通過突觸傳遞信息[54],其具體工作原理可視為一個黑箱,如圖2.1所示,信息輸入黑箱,經(jīng)過一定的操作,輸出結(jié)果。圖2.1人體神經(jīng)元工作示意圖Figure2.1Schematicdiagramofhumanneuronwork根據(jù)人體腦神經(jīng)結(jié)構(gòu)可知,ANNs也有基本的人工神經(jīng)元,一個人工神經(jīng)元可以與多個其他人工神經(jīng)元通過權(quán)重進行相連,將總輸入與閾值進行比較,然后利用激活函數(shù)進行輸出處理[55],該過程可抽象為如圖2.2所示的拓?fù)浣Y(jié)構(gòu)。圖2.2多輸入神經(jīng)元模型Figure2.2Neuronmodelofmultipleinput該模型主要由兩部分構(gòu)成,第一部分進行信號累加,即
遼寧工程技術(shù)大學(xué)碩士學(xué)位論文10,0()0,=其他(2-6)顯然,其為分段函數(shù),它在閾值0以下的輸出都被截斷為0且導(dǎo)數(shù)恒為0,在閾值0以上的輸出則線性不變且導(dǎo)數(shù)恒為1,故不存在易飽和性缺點,但當(dāng)0時,其導(dǎo)數(shù)為0,則使得神經(jīng)元輸出滿足此條件便不再更新[57]。Krizhevsky等人早已證明ReLU的收斂速度比tanh快6倍[3]。2.1.3多層感知機多層感知機(Multi-LayerPerceptron,MLP)是一種簡單的神經(jīng)網(wǎng)絡(luò)。如圖2.3所示,一般可劃分為輸入層、隱藏層和輸出層等三部分,輸入層是將圖像數(shù)據(jù)信息進行變換后輸入網(wǎng)絡(luò)中;隱藏層則提取輸入圖像的特征,實現(xiàn)高維非線性映射;輸出層利用分類器對提取的特征進行分類處理[57]。研究證明:當(dāng)隱藏層神經(jīng)元足夠多時,全連接神經(jīng)網(wǎng)絡(luò)能夠以任意精度擬合某一連續(xù)函數(shù)[58]。但是,當(dāng)網(wǎng)絡(luò)深度加深時,網(wǎng)絡(luò)也面臨著參數(shù)量巨大、計算量大和訓(xùn)練困難等問題。圖2.3多層感知機示意圖Figure2.3SchematicdiagramofMulti-LayerPerceptron2.2卷積神經(jīng)網(wǎng)絡(luò)2.2.1卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)通常,卷積神經(jīng)網(wǎng)絡(luò)由若干個卷積層、非線性操作層、歸一化層、池化層和分類器組成的單一尺度結(jié)構(gòu)。如圖2.4所示,將卷積層、非線性操作層、歸一化層和池化層統(tǒng)稱為特征提取塊,一般情況,卷積神經(jīng)網(wǎng)絡(luò)由1~3個特征提取塊堆疊而成。
【參考文獻】:
期刊論文
[1]基于特征融合的室外天氣圖像分類[J]. 郭志強,胡永武,劉鵬,楊杰. 計算機應(yīng)用. 2020(04)
[2]基于遷移學(xué)習(xí)及特征融合的輪胎花紋圖像分類[J]. 劉穎,張帥,范九倫. 計算機工程與設(shè)計. 2019(05)
[3]自底向上的顯著性目標(biāo)檢測研究綜述[J]. 吳加瑩,楊賽,堵俊,林宏達. 計算機科學(xué). 2019(03)
[4]基于遷移學(xué)習(xí)和特征融合的航空器圖像分類算法[J]. 陳兵,查宇飛,張勝杰,李運強,張園強. 火力與指揮控制. 2018(07)
[5]多特征融合的花卉圖像深度學(xué)習(xí)分類算法[J]. 林思思,葉東毅,陳昭炯. 小型微型計算機系統(tǒng). 2018(07)
[6]CNN與人工特征提取快速識別斑馬線的方法[J]. 熊平,胡彩霞,周欣星. 電子設(shè)計工程. 2018(03)
[7]基于深度特征融合的中低分辨率車型識別[J]. 薛麗霞,鐘欣,汪榮貴,楊娟,胡敏. 計算機工程. 2019(01)
[8]模式分類中的特征融合方法[J]. 劉渭濱,鄒智元,邢薇薇. 北京郵電大學(xué)學(xué)報. 2017(04)
[9]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計算機應(yīng)用. 2016(09)
[10]融合低層和高層特征圖表示的圖像顯著性檢測算法[J]. 高思晗,張雷,李成龍,湯進. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2016(03)
博士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類研究[D]. 呂恩輝.中國礦業(yè)大學(xué) 2019
碩士論文
[1]深度對抗式數(shù)據(jù)增強技術(shù)在小規(guī)模數(shù)據(jù)集上的應(yīng)用研究[D]. 張曉峰.中國科學(xué)技術(shù)大學(xué) 2019
[2]基于集成卷積神經(jīng)網(wǎng)絡(luò)的圖像分類研究[D]. 寶阿春.中國礦業(yè)大學(xué) 2019
[3]基于深度卷積神經(jīng)網(wǎng)絡(luò)的圖像分類[D]. 許佳.長沙理工大學(xué) 2017
[4]自適應(yīng)深度學(xué)習(xí)算法在目標(biāo)分類問題中的應(yīng)用[D]. 米龍.東北大學(xué) 2014
本文編號:3382420
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3382420.html
最近更新
教材專著