基于深度學習算法的水果圖像目標分類與檢測研究
發(fā)布時間:2020-07-16 04:37
【摘要】:改革開放以來,我國水果種植面積不斷擴大,水果產量不斷提升,然而,過去大部分的水果采摘作業(yè)基本依靠人工,而從事農業(yè)生產的人員又在不斷縮減,為應對農業(yè)生產中人力不足的必然發(fā)展趨勢,開發(fā)具有識別與定位功能的采摘機器人符合社會發(fā)展需要,將給社會發(fā)展帶來巨大的經濟效益和廣闊的市場前景。近年來,隨著深度學習的迅速發(fā)展和崛起,尤其其在視覺方向取得了巨大的成就,相比傳統(tǒng)的識別算法,深度學習在對目標識別的特征描述上能力更強。因此,開發(fā)基于深度學習算法視覺識別功能的采摘機器人具有重大意義。首先,本文基于當前先進的深度學習算法進行實驗探究,提出了基于卷積神經網絡的水果圖像分類識別算法,主要參照經典的卷積神經網絡模型LeNet-5結構,提出新的卷積神經網絡結構并對蘋果、梨、橙子、橘子、桃子五種水果進行分類識別,該模型構建了一個輸入層、兩個卷積層、兩個池化層、兩個全連接層和一個輸出層。實驗結果表明,所提出的卷積神經網絡結構不僅在數據集上取得了96.88%的識別準確率,相比原始的LeNet-5模型獲得的準確率更高,收斂速度更快。其次,本文對水果圖像識別又進行了更為深入的研究,基于深度學習目標檢測算法,為論證算法的可行性,選取蘋果圖像作為具體的研究對象,而當前主流的深度學習目標檢測算法有Faster-RCNN、YOLO、SSD,本文的檢測算法采用基于區(qū)域建議的Faster-RCNN,通過該算法來對圖像中的蘋果進行識別與定位研究。為應對自然場景下蘋果目標可能出現(xiàn)的遮擋、重疊、逆光、表面光照不均等情況,在采集圖像時,拍攝了包含不同尺寸大小、數量以及不同光照角度的蘋果圖像,通過選取本文提出的改進的LeNet-5和經典的卷積神經網絡VGG16以及ResNet101為基礎提取網絡并進行建模對比,探討不同框架模型下的檢測效果,通過多次設定不同的超參數組合并進行模型的精度對比,以此來得到了合適的超參數組合,最終在基于ResNet101的Faster-RCNN蘋果檢測模型上得到了90.91%的平均檢測精度,而在以本文提出的改進LeNet-5模型上獲得的檢測精度太低,又相比以VGG16為基礎提取網絡的模型,基于ResNet101的模型在平均檢測精度上得到了明顯的提升,雖然在檢測速度上遜色于VGG16,檢測一幅圖像的時間為0.39秒,但已經達到了實時性的要求,并且得到了98.96%的查全率和85.74%的召回率,通過最后的實驗測試表明,該模型可用于對樹上蘋果的檢測,驗證了算法的可行性,也為研究檢測其他種類的水果提供了經驗。
【學位授予單位】:南華大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:S225.93;TP391.41;TP18
【圖文】:
南華大學碩士學位論文向上更邁進了一步。圖 1.1 所示是加州大學研究人員和西門子公司研究小組研發(fā)的新型機器人 Dex Net2.0[10],該新型機器人先是深入的了解并研究了虛據庫中不同特征的三維物品,共計 10000 個,通過自帶的深度學習系統(tǒng)就能速的對物品進行預判,從而選取相應的方法來抓取各種不規(guī)則形狀的物品憑借其出色的功能,這款機器人能夠在醫(yī)療方面進行廣泛的使用,也可用于服務機器人以及農業(yè)采摘機器人。
第 1 章 緒論學習中的“學習”也是核心問題之一,簡單來講,即為自動的將更加復雜的特征,并利用這些組合特征解決問題。以卷積神經網可以從圖像的像素特征逐漸組合線、邊、角、簡單形狀、復雜復雜特征。出學習的過程即為權重更新過程,通過正向傳播和以損失函數的漸小為目標,不斷沿著梯度的反方向更新權重的適。學習過程中,采用激活函數去除模型線性化,引入正則化以及采用梯度下降算法、學習率衰減算法等方法對學習過程進
圖 1.3 LeNet-5 網絡結構圖Figure 1.3 LeNet-5 network structure diagram往后的十多年里,越來越多的新型卷積神經網絡模型被提出,其中比較型有:AlexNet、ZFNet、VGGNet、GoogleNet、ResNet。AlexNet[24]是由 Alex Krizhevsky 提出的一個深度學習模型,并贏得了視覺領域競賽C2012[25]的冠軍,并且大幅度超過傳統(tǒng)的方法,在百萬量級的 ImageNe上,識別率從傳統(tǒng)的 70%多提升到了 80%多,top5 預測的錯誤率為 16.4一名,將深度學習正式推上了舞臺。AlexNet 為 8 層結構,其中前 5 層,后面 3 層為全連接層,在兩個 GPU 上運行,其中學習參數有大約 6神經元有 650000 個左右,由于當時是對 1000 個類別進行分類,所以在后輸出是 1000 個類別的概率值,其中 AlexNet 的網絡結構圖如下圖 1
【學位授予單位】:南華大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:S225.93;TP391.41;TP18
【圖文】:
南華大學碩士學位論文向上更邁進了一步。圖 1.1 所示是加州大學研究人員和西門子公司研究小組研發(fā)的新型機器人 Dex Net2.0[10],該新型機器人先是深入的了解并研究了虛據庫中不同特征的三維物品,共計 10000 個,通過自帶的深度學習系統(tǒng)就能速的對物品進行預判,從而選取相應的方法來抓取各種不規(guī)則形狀的物品憑借其出色的功能,這款機器人能夠在醫(yī)療方面進行廣泛的使用,也可用于服務機器人以及農業(yè)采摘機器人。
第 1 章 緒論學習中的“學習”也是核心問題之一,簡單來講,即為自動的將更加復雜的特征,并利用這些組合特征解決問題。以卷積神經網可以從圖像的像素特征逐漸組合線、邊、角、簡單形狀、復雜復雜特征。出學習的過程即為權重更新過程,通過正向傳播和以損失函數的漸小為目標,不斷沿著梯度的反方向更新權重的適。學習過程中,采用激活函數去除模型線性化,引入正則化以及采用梯度下降算法、學習率衰減算法等方法對學習過程進
圖 1.3 LeNet-5 網絡結構圖Figure 1.3 LeNet-5 network structure diagram往后的十多年里,越來越多的新型卷積神經網絡模型被提出,其中比較型有:AlexNet、ZFNet、VGGNet、GoogleNet、ResNet。AlexNet[24]是由 Alex Krizhevsky 提出的一個深度學習模型,并贏得了視覺領域競賽C2012[25]的冠軍,并且大幅度超過傳統(tǒng)的方法,在百萬量級的 ImageNe上,識別率從傳統(tǒng)的 70%多提升到了 80%多,top5 預測的錯誤率為 16.4一名,將深度學習正式推上了舞臺。AlexNet 為 8 層結構,其中前 5 層,后面 3 層為全連接層,在兩個 GPU 上運行,其中學習參數有大約 6神經元有 650000 個左右,由于當時是對 1000 個類別進行分類,所以在后輸出是 1000 個類別的概率值,其中 AlexNet 的網絡結構圖如下圖 1
【相似文獻】
相關期刊論文 前10條
1 胡悅;;金融市場中的神經網絡拐點預測法[J];金融經濟;2017年18期
2 劉高宇;;深度神經網絡在煤質數據分析與預測中的應用[J];電腦知識與技術;2019年28期
3 馮偉業(yè);廖可非;歐陽繕;牛耀;;基于膠囊神經網絡的合成孔徑雷達圖像分類方法[J];科學技術與工程;2019年28期
4 溫贊揚;;基于群智優(yōu)化神經網絡的音樂風格分類模型研究[J];現(xiàn)代電子技術;2019年21期
5 鄭麗;;建筑設計中神經網絡技術與遺傳算法探究[J];湖北農機化;2019年21期
6 易煒;何嘉;鄒茂揚;;基于循環(huán)神經網絡的對話系統(tǒng)記憶機制[J];計算機工程與設計;2019年11期
7 黃為;李永剛;胡上成;汪毅;;基于循環(huán)神經網絡的船搖數據實時預測[J];科學技術與工程;2019年31期
8 賴策;魏小琴;;卷積神經網絡的訓練方式研究[J];信息與電腦(理論版);2019年22期
9 周濟民;;基于神經網絡改進的元胞自動機分析——美國阿片類藥物濫用情況[J];信息系統(tǒng)工程;2019年11期
10 馬猛;王明紅;;基于進化神經網絡的304不銹鋼車削加工表面粗糙度預測[J];輕工機械;2019年06期
相關會議論文 前10條
1 孫軍田;張U
本文編號:2757528
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2757528.html
最近更新
教材專著