基于深度學(xué)習(xí)的視覺揀選系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2023-04-22 16:24
隨著人力成本的大幅度上升,機(jī)器人代替人工已經(jīng)逐漸成為一種趨勢。加上提高生產(chǎn)力的迫切需求,工業(yè)領(lǐng)域的自動(dòng)化程度越來越高。在電商物流行業(yè),機(jī)器人視覺分揀十分普及。如今,網(wǎng)購已經(jīng)成為人們的一種生活習(xí)慣,退換貨給電商帶來大量的工作。那些不影響二次銷售的退換商品,需要再次分類上架。面對(duì)這樣的應(yīng)用場景,如果讓機(jī)器人分揀系統(tǒng)來完成,就需要視覺傳感器能逐個(gè)識(shí)別商品。電商商品種類繁多,傳統(tǒng)的循環(huán)匹配搜索的方式,已經(jīng)不能適應(yīng)。本文設(shè)計(jì)了一套基于深度學(xué)習(xí)的視覺揀選系統(tǒng),解決該類視覺混揀分類問題。本文的主要工作:1、本文在深入分析三維模型重建算法和目標(biāo)識(shí)別算法的基礎(chǔ)上,將二者融合,提出一種基于三維模型重建的多視圖獲取方法。利用重建獲取的多視圖,通過不同視角下的渲染,生成用于深度學(xué)習(xí)的訓(xùn)練數(shù)據(jù)集和姿態(tài)估計(jì)模板數(shù)據(jù)集。2、利用生成的數(shù)據(jù)集訓(xùn)練了一個(gè)基于YOLOv3的目標(biāo)檢測與識(shí)別模型。本文制作了目標(biāo)物體的VOC數(shù)據(jù)集,在完成標(biāo)注和配置后,利用darknet53的預(yù)訓(xùn)練模型進(jìn)行網(wǎng)絡(luò)訓(xùn)練。為了盡量接近真實(shí)場景,從增加目標(biāo)物體的背景、采用多尺度變換和多目標(biāo)物體參與訓(xùn)練,三個(gè)方面改進(jìn)訓(xùn)練數(shù)據(jù)集。訓(xùn)練后的檢測模型對(duì)不同光線...
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
縮略詞表
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 視覺揀選系統(tǒng)的發(fā)展?fàn)顩r
1.2.2 目標(biāo)檢測算法研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 基于三維重建和模型渲染的數(shù)據(jù)集生成
2.1 三維重建平臺(tái)的設(shè)計(jì)
2.2 OpenGL模型渲染環(huán)境
2.2.1 OpenGL中的幾種變換
2.2.2 DAE三維模型
2.3 物體數(shù)據(jù)集生成
2.3.1 深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)集
2.3.2 位姿估計(jì)模板數(shù)據(jù)集
2.4 本章小結(jié)
第三章 基于深度學(xué)習(xí)的目標(biāo)檢測與識(shí)別
3.1 卷積神經(jīng)網(wǎng)絡(luò)
3.2 YOLOV3算法分析
3.2.1 基本思想
3.2.2 類別信息預(yù)測
3.2.3 多尺度特征融合
3.2.4 殘差結(jié)構(gòu)
3.2.5 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)
3.3 目標(biāo)識(shí)別實(shí)驗(yàn)
3.3.1 制作數(shù)據(jù)集
3.3.2配置YOLOv3
3.3.3 訓(xùn)練識(shí)別模型
3.3.4 測試分析
3.3.5 改進(jìn)數(shù)據(jù)集后測試
3.4 本章小結(jié)
第四章 基于改進(jìn)的LINEMOD算法的物體位姿估計(jì)
4.1 位姿求解基礎(chǔ)
4.1.1 位置表示
4.1.2 姿態(tài)表示
4.1.3 位姿表示
4.1.4 矢量的一般變換
4.2 Linemod算法分析
4.2.1 特征提取方法
4.2.2 相似性評(píng)價(jià)
4.2.3 梯度擴(kuò)散
4.2.4 預(yù)處理響應(yīng)圖
4.2.5 線性存儲(chǔ)
4.3 位姿估計(jì)
4.3.1 姿態(tài)粗配
4.3.2 姿態(tài)精配
4.3.3 時(shí)間復(fù)雜度分析
4.4 本章小結(jié)
第五章 視覺揀選系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)總體設(shè)計(jì)
5.2.1 平面布局
5.2.2 軟件框架
5.3 測試平臺(tái)搭建
5.4 視覺系統(tǒng)標(biāo)定
5.4.1 雙目相機(jī)標(biāo)定
5.4.2 手眼標(biāo)定
5.4.3 平臺(tái)校準(zhǔn)
5.5 視覺揀選系統(tǒng)工作流程
5.6 系統(tǒng)測試
5.6.1 揀選測試
5.6.2 模型微調(diào)測試
5.7 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
本文編號(hào):3797995
【文章頁數(shù)】:65 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
縮略詞表
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 視覺揀選系統(tǒng)的發(fā)展?fàn)顩r
1.2.2 目標(biāo)檢測算法研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 基于三維重建和模型渲染的數(shù)據(jù)集生成
2.1 三維重建平臺(tái)的設(shè)計(jì)
2.2 OpenGL模型渲染環(huán)境
2.2.1 OpenGL中的幾種變換
2.2.2 DAE三維模型
2.3 物體數(shù)據(jù)集生成
2.3.1 深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)集
2.3.2 位姿估計(jì)模板數(shù)據(jù)集
2.4 本章小結(jié)
第三章 基于深度學(xué)習(xí)的目標(biāo)檢測與識(shí)別
3.1 卷積神經(jīng)網(wǎng)絡(luò)
3.2 YOLOV3算法分析
3.2.1 基本思想
3.2.2 類別信息預(yù)測
3.2.3 多尺度特征融合
3.2.4 殘差結(jié)構(gòu)
3.2.5 YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)
3.3 目標(biāo)識(shí)別實(shí)驗(yàn)
3.3.1 制作數(shù)據(jù)集
3.3.2配置YOLOv3
3.3.3 訓(xùn)練識(shí)別模型
3.3.4 測試分析
3.3.5 改進(jìn)數(shù)據(jù)集后測試
3.4 本章小結(jié)
第四章 基于改進(jìn)的LINEMOD算法的物體位姿估計(jì)
4.1 位姿求解基礎(chǔ)
4.1.1 位置表示
4.1.2 姿態(tài)表示
4.1.3 位姿表示
4.1.4 矢量的一般變換
4.2 Linemod算法分析
4.2.1 特征提取方法
4.2.2 相似性評(píng)價(jià)
4.2.3 梯度擴(kuò)散
4.2.4 預(yù)處理響應(yīng)圖
4.2.5 線性存儲(chǔ)
4.3 位姿估計(jì)
4.3.1 姿態(tài)粗配
4.3.2 姿態(tài)精配
4.3.3 時(shí)間復(fù)雜度分析
4.4 本章小結(jié)
第五章 視覺揀選系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)總體設(shè)計(jì)
5.2.1 平面布局
5.2.2 軟件框架
5.3 測試平臺(tái)搭建
5.4 視覺系統(tǒng)標(biāo)定
5.4.1 雙目相機(jī)標(biāo)定
5.4.2 手眼標(biāo)定
5.4.3 平臺(tái)校準(zhǔn)
5.5 視覺揀選系統(tǒng)工作流程
5.6 系統(tǒng)測試
5.6.1 揀選測試
5.6.2 模型微調(diào)測試
5.7 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
本文編號(hào):3797995
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3797995.html
最近更新
教材專著