基于MSR-CNN的果蔬檢測(cè)與識(shí)別算法研究
發(fā)布時(shí)間:2022-01-22 09:29
我國(guó)是果蔬進(jìn)出口大國(guó),由于世界各國(guó)的地理位置和氣候的不同,各國(guó)之間的果蔬種類差異化非常明顯,果蔬差異會(huì)影響我國(guó)的果蔬進(jìn)出口交易;此外,超市中果蔬的零售過程仍然采取人工稱重的方式,浪費(fèi)人力并且效率低下,嚴(yán)重影響顧客的購(gòu)物體驗(yàn)。針對(duì)這些情況,本文提出了一種基于Mask Scoring R-CNN的果蔬檢測(cè)與識(shí)別算法,能夠?qū)崿F(xiàn)果蔬檢測(cè)、識(shí)別與分割等任務(wù),該算法未來(lái)不僅可以用于移動(dòng)端進(jìn)行果蔬檢測(cè)與科普,還可以實(shí)現(xiàn)果蔬的智能稱量。本文的研究?jī)?nèi)容和貢獻(xiàn)如下:(1)本文構(gòu)建了一個(gè)包含多種日常水果蔬菜的果蔬圖像數(shù)據(jù)集,并且命名為Veg F,適用于果蔬檢測(cè)、識(shí)別與分割等任務(wù)。Veg F總共包含了36000張果蔬圖像,總共36種果蔬類別,其中水果24類,蔬菜12類,不僅包含了每種類別的單個(gè)目標(biāo)圖像,還有同類別的多目標(biāo)圖像以及多類別的混合圖像,充分考慮了目標(biāo)檢測(cè)與識(shí)別中可能會(huì)出現(xiàn)的情況。目前國(guó)內(nèi)外并沒有適用于果蔬檢測(cè)與識(shí)別的果蔬圖像數(shù)據(jù)集,Veg F數(shù)據(jù)集的出現(xiàn),有助于日后果蔬檢測(cè)與識(shí)別算法的研究。(2)針對(duì)特征金字塔網(wǎng)絡(luò)存在的問題,本文采用Aug FPN結(jié)構(gòu),縮小特征之間的語(yǔ)義差異,使其更適合后續(xù)的特征融...
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【圖文】:
LeNet-5結(jié)構(gòu)圖[51]
第二章相關(guān)技術(shù)研究與介紹95×5的特征圖,接著進(jìn)入C5,C5的結(jié)構(gòu)中有120個(gè)卷積核,與S4的輸出構(gòu)成了全連接操作,再進(jìn)入采用Sigmoid激活函數(shù)的全連接層F6,F(xiàn)6的結(jié)構(gòu)包含了84個(gè)隱層節(jié)點(diǎn),最后到達(dá)由歐式徑向的基函數(shù)單元組成的網(wǎng)絡(luò)結(jié)構(gòu)底層,通過大量計(jì)算才能輸出最后的識(shí)別結(jié)果。圖2-1LeNet-5結(jié)構(gòu)圖[51]卷積層,即特征提取層,是整個(gè)網(wǎng)絡(luò)的核心所在,每一個(gè)卷積神經(jīng)網(wǎng)絡(luò)中都會(huì)有很多個(gè)卷積層,每個(gè)卷積層具有大小不一的卷積核,可以用來(lái)獲取各種各樣的特征,從而達(dá)到多特征提取的目的。相鄰的卷積層是連接在一起的,通過局部連接的方式,因此不同層次之間的權(quán)值能夠被共享。接下來(lái)主要介紹卷積神經(jīng)網(wǎng)絡(luò)卷積層的特性。圖2-2卷積層卷積操作(1)卷積操作圖2-2顯示了卷積層的關(guān)鍵操作,即卷積操作。該圖顯示了用于卷積運(yùn)算的5×5輸入和3×3卷積內(nèi)核的卷積過程。計(jì)算公式為:
華南理工大學(xué)碩士學(xué)位論文10=+∈(21)其中,表示網(wǎng)絡(luò)第層第個(gè)特征圖,卷積核用表示,()代表激勵(lì)函數(shù),表示輸入特征圖的集合,表示卷積運(yùn)算,代表偏置項(xiàng)。(2)局部連接特性空間中的圖像不是相互獨(dú)立的,而是具有一定結(jié)構(gòu)而相互依存的,相鄰的像素點(diǎn)具有一定的聯(lián)系,這跟本文前面提到的感受野是類似的。在一個(gè)很小的區(qū)域中,像素相互連接,因此每個(gè)神經(jīng)元只需要將相鄰的特定范圍內(nèi)的像素作為輸入即可,其他的像素點(diǎn)都與它無(wú)關(guān),在獲取原圖像信息的時(shí)候,需要將所有神經(jīng)元的輸出作為考量依據(jù),然后整合這些輸出。卷積神經(jīng)網(wǎng)絡(luò)各層之間的連接基于此原理,將以前的全連接模式替換成局部連接,也稱為稀疏連接,能夠大大降低參數(shù)的數(shù)量級(jí)。如圖2-3所示,表示的是在同一層神經(jīng)元中,使用不同的連接方式會(huì)使輸入對(duì)輸出有什么影響,通過圖片描述我們可以更清晰直觀地了解局部連接的概念。本文只討論輸入對(duì)輸出y的影響。圖a)是全連接模式,輸入的大小,會(huì)影響所有的是輸出,而圖b)采用的是局部連接的方式,只有,,這三個(gè)輸出單元受到輸入的影響。圖2-4表示的是在同一層神經(jīng)元中,使用不同的連接方式會(huì)使輸出受到輸入的影響。同樣地,本文只討論輸出受輸入的影響。圖a)全連接方式下,輸出受到全部輸入單元的影響,而圖b)因?yàn)椴捎镁植窟B接,輸出只受到,,三個(gè)輸入的影響。圖2-3不同連接方式輸入對(duì)輸出的影響
【參考文獻(xiàn)】:
期刊論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)的水果識(shí)別研究[J]. 于悅洋,王冰,王靜,湯喬. 智能計(jì)算機(jī)與應(yīng)用. 2019(04)
[2]基于HALCON的水果識(shí)別算法研究[J]. 戴仲豪,王澤進(jìn),陳厚儒,吳意,劉穎君. 機(jī)械工程師. 2018(12)
[3]一種用于機(jī)器人水果采摘的快速識(shí)別方法[J]. 鄒謎,伍世虔,王欣. 農(nóng)機(jī)化研究. 2019(01)
[4]形狀相似水果自動(dòng)化識(shí)別研究[J]. 程榮花,馬飛,梁亞紅. 山東農(nóng)業(yè)科學(xué). 2015(08)
[5]農(nóng)業(yè)智能機(jī)器人水果采摘優(yōu)化控制模型仿真[J]. 鐘廈. 計(jì)算機(jī)仿真. 2015(04)
[6]用高光譜成像和PCA檢測(cè)蘋果的損傷和早期腐爛[J]. 張保華,黃文倩,李江波,趙春江,劉成良,黃丹楓. 紅外與激光工程. 2013(S2)
[7]人工智能的突破與科學(xué)方法的創(chuàng)新[J]. 鐘義信. 模式識(shí)別與人工智能. 2012(03)
[8]基于多示例學(xué)習(xí)的超市農(nóng)產(chǎn)品圖像識(shí)別[J]. 羅承成,李書琴,唐晶磊. 計(jì)算機(jī)應(yīng)用. 2012(06)
[9]基于紋理信息的水果圖像識(shí)別方法仿真研究[J]. 孟大偉. 計(jì)算機(jī)仿真. 2011(12)
[10]水果自動(dòng)識(shí)別的BP神經(jīng)網(wǎng)絡(luò)方法[J]. 陳源,張長(zhǎng)江. 微型機(jī)與應(yīng)用. 2010(22)
碩士論文
[1]基于計(jì)算機(jī)視覺的果蔬識(shí)別方法研究[D]. 陽(yáng)江平.大連理工大學(xué) 2011
本文編號(hào):3601949
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【圖文】:
LeNet-5結(jié)構(gòu)圖[51]
第二章相關(guān)技術(shù)研究與介紹95×5的特征圖,接著進(jìn)入C5,C5的結(jié)構(gòu)中有120個(gè)卷積核,與S4的輸出構(gòu)成了全連接操作,再進(jìn)入采用Sigmoid激活函數(shù)的全連接層F6,F(xiàn)6的結(jié)構(gòu)包含了84個(gè)隱層節(jié)點(diǎn),最后到達(dá)由歐式徑向的基函數(shù)單元組成的網(wǎng)絡(luò)結(jié)構(gòu)底層,通過大量計(jì)算才能輸出最后的識(shí)別結(jié)果。圖2-1LeNet-5結(jié)構(gòu)圖[51]卷積層,即特征提取層,是整個(gè)網(wǎng)絡(luò)的核心所在,每一個(gè)卷積神經(jīng)網(wǎng)絡(luò)中都會(huì)有很多個(gè)卷積層,每個(gè)卷積層具有大小不一的卷積核,可以用來(lái)獲取各種各樣的特征,從而達(dá)到多特征提取的目的。相鄰的卷積層是連接在一起的,通過局部連接的方式,因此不同層次之間的權(quán)值能夠被共享。接下來(lái)主要介紹卷積神經(jīng)網(wǎng)絡(luò)卷積層的特性。圖2-2卷積層卷積操作(1)卷積操作圖2-2顯示了卷積層的關(guān)鍵操作,即卷積操作。該圖顯示了用于卷積運(yùn)算的5×5輸入和3×3卷積內(nèi)核的卷積過程。計(jì)算公式為:
華南理工大學(xué)碩士學(xué)位論文10=+∈(21)其中,表示網(wǎng)絡(luò)第層第個(gè)特征圖,卷積核用表示,()代表激勵(lì)函數(shù),表示輸入特征圖的集合,表示卷積運(yùn)算,代表偏置項(xiàng)。(2)局部連接特性空間中的圖像不是相互獨(dú)立的,而是具有一定結(jié)構(gòu)而相互依存的,相鄰的像素點(diǎn)具有一定的聯(lián)系,這跟本文前面提到的感受野是類似的。在一個(gè)很小的區(qū)域中,像素相互連接,因此每個(gè)神經(jīng)元只需要將相鄰的特定范圍內(nèi)的像素作為輸入即可,其他的像素點(diǎn)都與它無(wú)關(guān),在獲取原圖像信息的時(shí)候,需要將所有神經(jīng)元的輸出作為考量依據(jù),然后整合這些輸出。卷積神經(jīng)網(wǎng)絡(luò)各層之間的連接基于此原理,將以前的全連接模式替換成局部連接,也稱為稀疏連接,能夠大大降低參數(shù)的數(shù)量級(jí)。如圖2-3所示,表示的是在同一層神經(jīng)元中,使用不同的連接方式會(huì)使輸入對(duì)輸出有什么影響,通過圖片描述我們可以更清晰直觀地了解局部連接的概念。本文只討論輸入對(duì)輸出y的影響。圖a)是全連接模式,輸入的大小,會(huì)影響所有的是輸出,而圖b)采用的是局部連接的方式,只有,,這三個(gè)輸出單元受到輸入的影響。圖2-4表示的是在同一層神經(jīng)元中,使用不同的連接方式會(huì)使輸出受到輸入的影響。同樣地,本文只討論輸出受輸入的影響。圖a)全連接方式下,輸出受到全部輸入單元的影響,而圖b)因?yàn)椴捎镁植窟B接,輸出只受到,,三個(gè)輸入的影響。圖2-3不同連接方式輸入對(duì)輸出的影響
【參考文獻(xiàn)】:
期刊論文
[1]基于BP神經(jīng)網(wǎng)絡(luò)的水果識(shí)別研究[J]. 于悅洋,王冰,王靜,湯喬. 智能計(jì)算機(jī)與應(yīng)用. 2019(04)
[2]基于HALCON的水果識(shí)別算法研究[J]. 戴仲豪,王澤進(jìn),陳厚儒,吳意,劉穎君. 機(jī)械工程師. 2018(12)
[3]一種用于機(jī)器人水果采摘的快速識(shí)別方法[J]. 鄒謎,伍世虔,王欣. 農(nóng)機(jī)化研究. 2019(01)
[4]形狀相似水果自動(dòng)化識(shí)別研究[J]. 程榮花,馬飛,梁亞紅. 山東農(nóng)業(yè)科學(xué). 2015(08)
[5]農(nóng)業(yè)智能機(jī)器人水果采摘優(yōu)化控制模型仿真[J]. 鐘廈. 計(jì)算機(jī)仿真. 2015(04)
[6]用高光譜成像和PCA檢測(cè)蘋果的損傷和早期腐爛[J]. 張保華,黃文倩,李江波,趙春江,劉成良,黃丹楓. 紅外與激光工程. 2013(S2)
[7]人工智能的突破與科學(xué)方法的創(chuàng)新[J]. 鐘義信. 模式識(shí)別與人工智能. 2012(03)
[8]基于多示例學(xué)習(xí)的超市農(nóng)產(chǎn)品圖像識(shí)別[J]. 羅承成,李書琴,唐晶磊. 計(jì)算機(jī)應(yīng)用. 2012(06)
[9]基于紋理信息的水果圖像識(shí)別方法仿真研究[J]. 孟大偉. 計(jì)算機(jī)仿真. 2011(12)
[10]水果自動(dòng)識(shí)別的BP神經(jīng)網(wǎng)絡(luò)方法[J]. 陳源,張長(zhǎng)江. 微型機(jī)與應(yīng)用. 2010(22)
碩士論文
[1]基于計(jì)算機(jī)視覺的果蔬識(shí)別方法研究[D]. 陽(yáng)江平.大連理工大學(xué) 2011
本文編號(hào):3601949
本文鏈接:http://sikaile.net/kejilunwen/nykj/3601949.html
最近更新
教材專著