深度學(xué)習(xí)的輕量化及其在圖像識(shí)別中的應(yīng)用研究
發(fā)布時(shí)間:2021-09-02 20:30
圖像作為當(dāng)今社會(huì)一種常用的信息載體,其重要性與日俱增。隨著圖片使用量的日益增加,圖像識(shí)別算法也隨之成為人工智能領(lǐng)域一個(gè)非常熱門的研究方向。近年來(lái),有賴于卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別領(lǐng)域的優(yōu)異表現(xiàn),越來(lái)越多的卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化方法和網(wǎng)絡(luò)模型架構(gòu)被研究者提出。但是,在網(wǎng)絡(luò)性能提升的同時(shí),隨之而來(lái)的是急劇增加的網(wǎng)絡(luò)復(fù)雜度,大多數(shù)先進(jìn)網(wǎng)絡(luò)擁有數(shù)百兆的參數(shù)量和數(shù)十億的計(jì)算量。然而,隨著卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用的增加,越來(lái)越多的網(wǎng)絡(luò)模型需要在只擁有有限內(nèi)存和計(jì)算能力的設(shè)備上高效運(yùn)行。故而卷積神經(jīng)網(wǎng)絡(luò)的輕量化也逐漸吸引著眾多的研究者。本文針對(duì)輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行研究,設(shè)計(jì)全新的網(wǎng)絡(luò)構(gòu)建模塊并從頭開(kāi)始訓(xùn)練一個(gè)新型輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)。主要工作如下:首先,本文對(duì)輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)的研究背景和研究意義給出了自己的總結(jié),表明輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)熱門且快速發(fā)展的方向。對(duì)國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行了詳細(xì)的梳理,進(jìn)而挖掘出其中值得研究和需要改進(jìn)的部分。其次,截至當(dāng)前時(shí)間點(diǎn),本文對(duì)卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)理論和輕量化方法做了歸納和總結(jié)。在這之后介紹了近年來(lái)被提出的經(jīng)典輕量級(jí)卷積神經(jīng)網(wǎng)絡(luò)模型,并對(duì)現(xiàn)有的卷積神經(jīng)網(wǎng)絡(luò)輕量化方法的優(yōu)缺點(diǎn)進(jìn)行了總結(jié)...
【文章來(lái)源】:浙江師范大學(xué)浙江省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖 2.1 全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖2.1.2 卷積層卷積層(Convolutional Layer)中的“卷積”一詞表示該層中使用的數(shù)學(xué)運(yùn)算為卷積(Convolution)。在數(shù)學(xué)中,卷積是一種特殊的線性運(yùn)算。在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層的主要作用是進(jìn)行特征提取,通過(guò)輸入特征圖(Input Feature Map)與卷積核(Kernel)(或稱濾波器(Filter))進(jìn)行卷積操作來(lái)得到下一層的輸入特征圖。卷積層實(shí)質(zhì)上就是一組可學(xué)習(xí)參數(shù)的濾波器[80],不同深度的層中的卷積核提取輸入的不同特征,通常低層卷積核提取的是邊緣和色彩信息,高層的卷積核提取的是由低層卷積核組成的更加復(fù)雜的特征,如動(dòng)物的耳朵,車輛的輪子等。
結(jié)果重新組成一張新的特征圖,因?yàn)槊恳粋(gè)卷積核產(chǎn)生一張新的特征圖,所以卷的個(gè)數(shù)也就決定了輸出特征圖的通道數(shù)(Channel)。從圖中可以看出,經(jīng)過(guò)卷作后輸出特征圖的尺寸會(huì)小于輸入特征圖的尺寸,為了在卷積神經(jīng)網(wǎng)絡(luò)中保持每積層輸出的特征圖尺寸不變,一般在輸入特征圖的周圍添加像素值為“0”的像素填充(Padding)。卷積層作為卷積神經(jīng)網(wǎng)絡(luò)中最重要的組成部分,相比于全連接層它具有兩個(gè)明顯勢(shì)。第一個(gè)優(yōu)勢(shì)是局部感知,F(xiàn)代生物學(xué)普遍認(rèn)為人的大腦對(duì)視覺(jué)的感知是從局全局的[81]。在圖像領(lǐng)域中,一般認(rèn)為空間距離較近的像素?fù)碛懈泳o密的聯(lián)系間距離較遠(yuǎn)的像素則相關(guān)性較弱。卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,人們一直使用的都是神經(jīng)網(wǎng)絡(luò),也就是由全連接層構(gòu)建的網(wǎng)絡(luò),該網(wǎng)絡(luò)每個(gè)神經(jīng)元都與前層所有的神相連,如圖 2.3(a)。而卷積神經(jīng)網(wǎng)絡(luò)低層的神經(jīng)元只感知圖像的部分區(qū)域,高層經(jīng)元對(duì)低層的神經(jīng)元獲得的局部特征進(jìn)行整合,從而得到更加抽象的全局特征 2.3(b)。卷積神經(jīng)網(wǎng)絡(luò)的局部感知域的大小即卷積核大小。
【參考文獻(xiàn)】:
期刊論文
[1]基于緊致全姿態(tài)二值SIFT的人臉識(shí)別[J]. 毋立芳,侯亞希,許曉,高源,漆薇,周鵬. 儀器儀表學(xué)報(bào). 2015(04)
博士論文
[1]基于深度學(xué)習(xí)的圖像分類方法研究[D]. 孟丹.華東師范大學(xué) 2017
碩士論文
[1]深度神經(jīng)網(wǎng)絡(luò)的壓縮實(shí)現(xiàn)方法研究[D]. 馬琰.西安理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的移動(dòng)端圖像識(shí)別算法[D]. 黃萱昆.北京郵電大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別方法研究[D]. 宋月.東北石油大學(xué) 2017
[4]深度神經(jīng)網(wǎng)絡(luò)壓縮與優(yōu)化研究[D]. 王征韜.電子科技大學(xué) 2017
[5]面向圖像內(nèi)容檢索的卷積神經(jīng)網(wǎng)絡(luò)[D]. 顧亞風(fēng).杭州電子科技大學(xué) 2017
[6]卷積神經(jīng)網(wǎng)絡(luò)的研究及其在車牌識(shí)別系統(tǒng)中的應(yīng)用[D]. 陸璐.合肥工業(yè)大學(xué) 2006
本文編號(hào):3379684
【文章來(lái)源】:浙江師范大學(xué)浙江省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖 2.1 全連接層網(wǎng)絡(luò)結(jié)構(gòu)示意圖2.1.2 卷積層卷積層(Convolutional Layer)中的“卷積”一詞表示該層中使用的數(shù)學(xué)運(yùn)算為卷積(Convolution)。在數(shù)學(xué)中,卷積是一種特殊的線性運(yùn)算。在卷積神經(jīng)網(wǎng)絡(luò)中,卷積層的主要作用是進(jìn)行特征提取,通過(guò)輸入特征圖(Input Feature Map)與卷積核(Kernel)(或稱濾波器(Filter))進(jìn)行卷積操作來(lái)得到下一層的輸入特征圖。卷積層實(shí)質(zhì)上就是一組可學(xué)習(xí)參數(shù)的濾波器[80],不同深度的層中的卷積核提取輸入的不同特征,通常低層卷積核提取的是邊緣和色彩信息,高層的卷積核提取的是由低層卷積核組成的更加復(fù)雜的特征,如動(dòng)物的耳朵,車輛的輪子等。
結(jié)果重新組成一張新的特征圖,因?yàn)槊恳粋(gè)卷積核產(chǎn)生一張新的特征圖,所以卷的個(gè)數(shù)也就決定了輸出特征圖的通道數(shù)(Channel)。從圖中可以看出,經(jīng)過(guò)卷作后輸出特征圖的尺寸會(huì)小于輸入特征圖的尺寸,為了在卷積神經(jīng)網(wǎng)絡(luò)中保持每積層輸出的特征圖尺寸不變,一般在輸入特征圖的周圍添加像素值為“0”的像素填充(Padding)。卷積層作為卷積神經(jīng)網(wǎng)絡(luò)中最重要的組成部分,相比于全連接層它具有兩個(gè)明顯勢(shì)。第一個(gè)優(yōu)勢(shì)是局部感知,F(xiàn)代生物學(xué)普遍認(rèn)為人的大腦對(duì)視覺(jué)的感知是從局全局的[81]。在圖像領(lǐng)域中,一般認(rèn)為空間距離較近的像素?fù)碛懈泳o密的聯(lián)系間距離較遠(yuǎn)的像素則相關(guān)性較弱。卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)之前,人們一直使用的都是神經(jīng)網(wǎng)絡(luò),也就是由全連接層構(gòu)建的網(wǎng)絡(luò),該網(wǎng)絡(luò)每個(gè)神經(jīng)元都與前層所有的神相連,如圖 2.3(a)。而卷積神經(jīng)網(wǎng)絡(luò)低層的神經(jīng)元只感知圖像的部分區(qū)域,高層經(jīng)元對(duì)低層的神經(jīng)元獲得的局部特征進(jìn)行整合,從而得到更加抽象的全局特征 2.3(b)。卷積神經(jīng)網(wǎng)絡(luò)的局部感知域的大小即卷積核大小。
【參考文獻(xiàn)】:
期刊論文
[1]基于緊致全姿態(tài)二值SIFT的人臉識(shí)別[J]. 毋立芳,侯亞希,許曉,高源,漆薇,周鵬. 儀器儀表學(xué)報(bào). 2015(04)
博士論文
[1]基于深度學(xué)習(xí)的圖像分類方法研究[D]. 孟丹.華東師范大學(xué) 2017
碩士論文
[1]深度神經(jīng)網(wǎng)絡(luò)的壓縮實(shí)現(xiàn)方法研究[D]. 馬琰.西安理工大學(xué) 2018
[2]基于深度學(xué)習(xí)的移動(dòng)端圖像識(shí)別算法[D]. 黃萱昆.北京郵電大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別方法研究[D]. 宋月.東北石油大學(xué) 2017
[4]深度神經(jīng)網(wǎng)絡(luò)壓縮與優(yōu)化研究[D]. 王征韜.電子科技大學(xué) 2017
[5]面向圖像內(nèi)容檢索的卷積神經(jīng)網(wǎng)絡(luò)[D]. 顧亞風(fēng).杭州電子科技大學(xué) 2017
[6]卷積神經(jīng)網(wǎng)絡(luò)的研究及其在車牌識(shí)別系統(tǒng)中的應(yīng)用[D]. 陸璐.合肥工業(yè)大學(xué) 2006
本文編號(hào):3379684
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3379684.html
最近更新
教材專著