深度學(xué)習(xí)的輕量化及其在圖像識別中的應(yīng)用研究
發(fā)布時間:2021-09-02 20:30
圖像作為當(dāng)今社會一種常用的信息載體,其重要性與日俱增。隨著圖片使用量的日益增加,圖像識別算法也隨之成為人工智能領(lǐng)域一個非常熱門的研究方向。近年來,有賴于卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域的優(yōu)異表現(xiàn),越來越多的卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化方法和網(wǎng)絡(luò)模型架構(gòu)被研究者提出。但是,在網(wǎng)絡(luò)性能提升的同時,隨之而來的是急劇增加的網(wǎng)絡(luò)復(fù)雜度,大多數(shù)先進網(wǎng)絡(luò)擁有數(shù)百兆的參數(shù)量和數(shù)十億的計算量。然而,隨著卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用的增加,越來越多的網(wǎng)絡(luò)模型需要在只擁有有限內(nèi)存和計算能力的設(shè)備上高效運行。故而卷積神經(jīng)網(wǎng)絡(luò)的輕量化也逐漸吸引著眾多的研究者。本文針對輕量級卷積神經(jīng)網(wǎng)絡(luò)進行研究,設(shè)計全新的網(wǎng)絡(luò)構(gòu)建模塊并從頭開始訓(xùn)練一個新型輕量級卷積神經(jīng)網(wǎng)絡(luò)。主要工作如下:首先,本文對輕量級卷積神經(jīng)網(wǎng)絡(luò)的研究背景和研究意義給出了自己的總結(jié),表明輕量級卷積神經(jīng)網(wǎng)絡(luò)是一個熱門且快速發(fā)展的方向。對國內(nèi)外研究現(xiàn)狀進行了詳細(xì)的梳理,進而挖掘出其中值得研究和需要改進的部分。其次,截至當(dāng)前時間點,本文對卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)理論和輕量化方法做了歸納和總結(jié)。在這之后介紹了近年來被提出的經(jīng)典輕量級卷積神經(jīng)網(wǎng)絡(luò)模型,并對現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)輕量化方法的優(yōu)缺點進行了總結(jié)...
【文章來源】:浙江師范大學(xué)浙江省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖 2.1 全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖2.1.2 卷積層卷積層(Convolutional Layer)中的“卷積”一詞表示該層中使用的數(shù)學(xué)運算為卷積(Convolution)。在數(shù)學(xué)中,卷積是一種特殊的線性運算。在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層的主要作用是進行特征提取,通過輸入特征圖(Input Feature Map)與卷積核(Kernel)(或稱濾波器(Filter))進行卷積操作來得到下一層的輸入特征圖。卷積層實質(zhì)上就是一組可學(xué)習(xí)參數(shù)的濾波器[80],不同深度的層中的卷積核提取輸入的不同特征,通常低層卷積核提取的是邊緣和色彩信息,高層的卷積核提取的是由低層卷積核組成的更加復(fù)雜的特征,如動物的耳朵,車輛的輪子等。
結(jié)果重新組成一張新的特征圖,因為每一個卷積核產(chǎn)生一張新的特征圖,所以卷的個數(shù)也就決定了輸出特征圖的通道數(shù)(Channel)。從圖中可以看出,經(jīng)過卷作后輸出特征圖的尺寸會小于輸入特征圖的尺寸,為了在卷積神經(jīng)網(wǎng)絡(luò)中保持每積層輸出的特征圖尺寸不變,一般在輸入特征圖的周圍添加像素值為“0”的像素填充(Padding)。卷積層作為卷積神經(jīng)網(wǎng)絡(luò)中最重要的組成部分,相比于全連接層它具有兩個明顯勢。第一個優(yōu)勢是局部感知,F(xiàn)代生物學(xué)普遍認(rèn)為人的大腦對視覺的感知是從局全局的[81]。在圖像領(lǐng)域中,一般認(rèn)為空間距離較近的像素?fù)碛懈泳o密的聯(lián)系間距離較遠(yuǎn)的像素則相關(guān)性較弱。卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,人們一直使用的都是神經(jīng)網(wǎng)絡(luò),也就是由全連接層構(gòu)建的網(wǎng)絡(luò),該網(wǎng)絡(luò)每個神經(jīng)元都與前層所有的神相連,如圖 2.3(a)。而卷積神經(jīng)網(wǎng)絡(luò)低層的神經(jīng)元只感知圖像的部分區(qū)域,高層經(jīng)元對低層的神經(jīng)元獲得的局部特征進行整合,從而得到更加抽象的全局特征 2.3(b)。卷積神經(jīng)網(wǎng)絡(luò)的局部感知域的大小即卷積核大小。
【參考文獻】:
期刊論文
[1]基于緊致全姿態(tài)二值SIFT的人臉識別[J]. 毋立芳,侯亞希,許曉,高源,漆薇,周鵬. 儀器儀表學(xué)報. 2015(04)
博士論文
[1]基于深度學(xué)習(xí)的圖像分類方法研究[D]. 孟丹.華東師范大學(xué) 2017
碩士論文
[1]深度神經(jīng)網(wǎng)絡(luò)的壓縮實現(xiàn)方法研究[D]. 馬琰.西安理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的移動端圖像識別算法[D]. 黃萱昆.北京郵電大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別方法研究[D]. 宋月.東北石油大學(xué) 2017
[4]深度神經(jīng)網(wǎng)絡(luò)壓縮與優(yōu)化研究[D]. 王征韜.電子科技大學(xué) 2017
[5]面向圖像內(nèi)容檢索的卷積神經(jīng)網(wǎng)絡(luò)[D]. 顧亞風(fēng).杭州電子科技大學(xué) 2017
[6]卷積神經(jīng)網(wǎng)絡(luò)的研究及其在車牌識別系統(tǒng)中的應(yīng)用[D]. 陸璐.合肥工業(yè)大學(xué) 2006
本文編號:3379684
【文章來源】:浙江師范大學(xué)浙江省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖 2.1 全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖2.1.2 卷積層卷積層(Convolutional Layer)中的“卷積”一詞表示該層中使用的數(shù)學(xué)運算為卷積(Convolution)。在數(shù)學(xué)中,卷積是一種特殊的線性運算。在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層的主要作用是進行特征提取,通過輸入特征圖(Input Feature Map)與卷積核(Kernel)(或稱濾波器(Filter))進行卷積操作來得到下一層的輸入特征圖。卷積層實質(zhì)上就是一組可學(xué)習(xí)參數(shù)的濾波器[80],不同深度的層中的卷積核提取輸入的不同特征,通常低層卷積核提取的是邊緣和色彩信息,高層的卷積核提取的是由低層卷積核組成的更加復(fù)雜的特征,如動物的耳朵,車輛的輪子等。
結(jié)果重新組成一張新的特征圖,因為每一個卷積核產(chǎn)生一張新的特征圖,所以卷的個數(shù)也就決定了輸出特征圖的通道數(shù)(Channel)。從圖中可以看出,經(jīng)過卷作后輸出特征圖的尺寸會小于輸入特征圖的尺寸,為了在卷積神經(jīng)網(wǎng)絡(luò)中保持每積層輸出的特征圖尺寸不變,一般在輸入特征圖的周圍添加像素值為“0”的像素填充(Padding)。卷積層作為卷積神經(jīng)網(wǎng)絡(luò)中最重要的組成部分,相比于全連接層它具有兩個明顯勢。第一個優(yōu)勢是局部感知,F(xiàn)代生物學(xué)普遍認(rèn)為人的大腦對視覺的感知是從局全局的[81]。在圖像領(lǐng)域中,一般認(rèn)為空間距離較近的像素?fù)碛懈泳o密的聯(lián)系間距離較遠(yuǎn)的像素則相關(guān)性較弱。卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,人們一直使用的都是神經(jīng)網(wǎng)絡(luò),也就是由全連接層構(gòu)建的網(wǎng)絡(luò),該網(wǎng)絡(luò)每個神經(jīng)元都與前層所有的神相連,如圖 2.3(a)。而卷積神經(jīng)網(wǎng)絡(luò)低層的神經(jīng)元只感知圖像的部分區(qū)域,高層經(jīng)元對低層的神經(jīng)元獲得的局部特征進行整合,從而得到更加抽象的全局特征 2.3(b)。卷積神經(jīng)網(wǎng)絡(luò)的局部感知域的大小即卷積核大小。
【參考文獻】:
期刊論文
[1]基于緊致全姿態(tài)二值SIFT的人臉識別[J]. 毋立芳,侯亞希,許曉,高源,漆薇,周鵬. 儀器儀表學(xué)報. 2015(04)
博士論文
[1]基于深度學(xué)習(xí)的圖像分類方法研究[D]. 孟丹.華東師范大學(xué) 2017
碩士論文
[1]深度神經(jīng)網(wǎng)絡(luò)的壓縮實現(xiàn)方法研究[D]. 馬琰.西安理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的移動端圖像識別算法[D]. 黃萱昆.北京郵電大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別方法研究[D]. 宋月.東北石油大學(xué) 2017
[4]深度神經(jīng)網(wǎng)絡(luò)壓縮與優(yōu)化研究[D]. 王征韜.電子科技大學(xué) 2017
[5]面向圖像內(nèi)容檢索的卷積神經(jīng)網(wǎng)絡(luò)[D]. 顧亞風(fēng).杭州電子科技大學(xué) 2017
[6]卷積神經(jīng)網(wǎng)絡(luò)的研究及其在車牌識別系統(tǒng)中的應(yīng)用[D]. 陸璐.合肥工業(yè)大學(xué) 2006
本文編號:3379684
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3379684.html
最近更新
教材專著