基于深度學習的蘋果目標識別與定位算法研究
發(fā)布時間:2021-03-07 09:38
蘋果是我國種植面積最大、產(chǎn)量最高、經(jīng)濟地位最重要的水果。到目前為止,蘋果采摘仍然以人工采摘為主,蘋果在成熟期內采摘量大、人工采摘勞動強度大,每天采摘量有限,且人工勞動成本高,如果不能盡快采摘將會導致蘋果掉落在地,影響蘋果質量。蘋果快速自動化采摘可以極大地提高蘋果采摘效率,降低人工勞動成本,蘋果目標識別與定位是蘋果快速自動化采摘的關鍵技術之一,對實現(xiàn)蘋果快速自動化采摘具有非常重要的意義。針對自然環(huán)境下蘋果采摘機器人的應用需求,結合圖像處理技術,提出一種基于深度學習的蘋果目標識別與定位算法。主要研究內容如下:(1)基于蘋果目標識別的圖像處理方法研究。為了提高蘋果目標的識別率,采集了11080幅自然環(huán)境中的蘋果圖像。并對RGB、HSI和Lab的差別進行了分析與對比,并選取了最為適合的RGB顏色空間。另外對圖像進行濾波處理,并對去噪效果進行對比分析。最終利用LabelImg軟件對處理后的圖像進行位置標定,建立了訓練集與測試集。(2)基于MobileNetV1網(wǎng)絡的蘋果目標特征提取研究。通過對卷積神經(jīng)網(wǎng)絡的流程介紹和對VGG網(wǎng)絡、ResNet殘差網(wǎng)絡、MobileNetV1網(wǎng)絡的優(yōu)缺點分析,最終...
【文章來源】:浙江工業(yè)大學浙江省
【文章頁數(shù)】:98 頁
【學位級別】:碩士
【部分圖文】:
蘋果采摘視覺系統(tǒng)技術路線圖
基于深度學習的蘋果目標識別與定位算法研究152.3.4顏色空間分析結果首先由于相機所拍攝的圖像為RGB圖像,如果將其轉換為HSI顏色空間或者Lab顏色空間都需要消耗一定的時間來完成,但是自動蘋果采摘機器人需要考慮實時性。因此時間的消耗是一定要考慮的重要因素之一。由于獲得的圖像在經(jīng)過一定處理后需要進行卷積操作,卷積會對圖像的每一個通道都進行特征提取,因此原始圖像的每一個通道若都擁有明顯的特征信息,會對后續(xù)的圖像訓練與目標識別準確率的提高有明顯的幫助。通過對上文中三種顏色通道的對比分析,可以發(fā)現(xiàn)RGB每一個通道的圖像蘋果與背景的差異都比較明顯,并且保留了豐富的紋理特征。HSI圖像只有I通道的圖像能夠較好的將蘋果與背景分割出來,并且保留較好的紋理特征。而Lab圖像只有L通道的圖像能夠較好的將蘋果與背景分割出來,同時保留較好的紋理信息。因此本文將采用RGB圖像來完成蘋果的目標檢測與識別。2.4圖像預處理對于自然環(huán)境中拍攝獲得的圖像將存在大量的噪聲,噪聲會淹沒一些特征信息,使得蘋果與背景對比度下降,造成深度學習模型提取特征困難。因此要在正式圖像訓練前進行一定的預處理,減少噪聲對于深度學習模型的影響,從而加快模型的收斂速度,使得模型有更好的效果。圖像濾波操作[54]可以抑制圖像中的噪聲,而在本文中還減少了背景對于模型訓練的影響。常見的濾波器有線性濾波與非線性濾波。2.4.1線性濾波器(1)均值濾波:均值濾波是最簡單的一種濾波操作,主要方法是領域平均法。也就是用一片圖像區(qū)域內的像素的平均值去代替原先圖像中各個像素值,均值濾波的數(shù)學表達式如下所示。()()fx,ygx,yM(2-2)式中,g——新的像素值;f——原圖像的像素值;M——領域的像素個數(shù)。但是均值濾波也存
18圖2-7LabelImg標注圖像Figure2-7.LabelImgannotationimage使用該軟件對圖像進行標注之后,會形成一個xml文件。里面存儲了圖片的路徑,圖片的大小和通道數(shù),以及每一個目標物體的類別名稱和包圍目標物體的矩形的左上角與右下角像素點坐標。圖2-8LabelImg標注代碼Figure2-8.LabelImgannotationcode
本文編號:3068837
【文章來源】:浙江工業(yè)大學浙江省
【文章頁數(shù)】:98 頁
【學位級別】:碩士
【部分圖文】:
蘋果采摘視覺系統(tǒng)技術路線圖
基于深度學習的蘋果目標識別與定位算法研究152.3.4顏色空間分析結果首先由于相機所拍攝的圖像為RGB圖像,如果將其轉換為HSI顏色空間或者Lab顏色空間都需要消耗一定的時間來完成,但是自動蘋果采摘機器人需要考慮實時性。因此時間的消耗是一定要考慮的重要因素之一。由于獲得的圖像在經(jīng)過一定處理后需要進行卷積操作,卷積會對圖像的每一個通道都進行特征提取,因此原始圖像的每一個通道若都擁有明顯的特征信息,會對后續(xù)的圖像訓練與目標識別準確率的提高有明顯的幫助。通過對上文中三種顏色通道的對比分析,可以發(fā)現(xiàn)RGB每一個通道的圖像蘋果與背景的差異都比較明顯,并且保留了豐富的紋理特征。HSI圖像只有I通道的圖像能夠較好的將蘋果與背景分割出來,并且保留較好的紋理特征。而Lab圖像只有L通道的圖像能夠較好的將蘋果與背景分割出來,同時保留較好的紋理信息。因此本文將采用RGB圖像來完成蘋果的目標檢測與識別。2.4圖像預處理對于自然環(huán)境中拍攝獲得的圖像將存在大量的噪聲,噪聲會淹沒一些特征信息,使得蘋果與背景對比度下降,造成深度學習模型提取特征困難。因此要在正式圖像訓練前進行一定的預處理,減少噪聲對于深度學習模型的影響,從而加快模型的收斂速度,使得模型有更好的效果。圖像濾波操作[54]可以抑制圖像中的噪聲,而在本文中還減少了背景對于模型訓練的影響。常見的濾波器有線性濾波與非線性濾波。2.4.1線性濾波器(1)均值濾波:均值濾波是最簡單的一種濾波操作,主要方法是領域平均法。也就是用一片圖像區(qū)域內的像素的平均值去代替原先圖像中各個像素值,均值濾波的數(shù)學表達式如下所示。()()fx,ygx,yM(2-2)式中,g——新的像素值;f——原圖像的像素值;M——領域的像素個數(shù)。但是均值濾波也存
18圖2-7LabelImg標注圖像Figure2-7.LabelImgannotationimage使用該軟件對圖像進行標注之后,會形成一個xml文件。里面存儲了圖片的路徑,圖片的大小和通道數(shù),以及每一個目標物體的類別名稱和包圍目標物體的矩形的左上角與右下角像素點坐標。圖2-8LabelImg標注代碼Figure2-8.LabelImgannotationcode
本文編號:3068837
本文鏈接:http://sikaile.net/shoufeilunwen/zaizhiyanjiusheng/3068837.html
最近更新
教材專著