面向目標(biāo)檢測的神經(jīng)網(wǎng)絡(luò)推理加速方法研究
發(fā)布時間:2021-05-17 18:08
目標(biāo)檢測是計算機(jī)視覺領(lǐng)域的一個熱門研究方向,被廣泛應(yīng)用于智能安防、智慧城市、電力巡檢、無人駕駛等眾多領(lǐng)域。與傳統(tǒng)的基于手工設(shè)計特征的算法相比,使用深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法無論是檢測精度還是檢測速度都獲得了巨大的提升。深度神經(jīng)網(wǎng)絡(luò)是一種存儲密集型和計算密集型的算法,該算法可以在高性能GPU上實時的運行,但是在存儲資源和計算資源有限的嵌入式平臺上卻難以實現(xiàn)。因此,研究如何在保證檢測精度的前提下將目標(biāo)檢測算法部署到嵌入式平臺上具有極其重要的現(xiàn)實意義。本文在YOLOv3目標(biāo)檢測算法的基礎(chǔ)上,結(jié)合輕量級神經(jīng)網(wǎng)絡(luò)、模型壓縮和計算加速技術(shù)在嵌入式ARM平臺上實現(xiàn)了 一個實時的目標(biāo)檢測系統(tǒng)。具體工作內(nèi)容如下:(1)針對YOLOv3算法,本文通過對比幾個主流的輕量級神經(jīng)網(wǎng)絡(luò),最終選取模型參數(shù)少且特征提取能力強(qiáng)的MobiNetV2代替Darknet53作為YOLOv3算法的主干網(wǎng)絡(luò)。(2)卷積神經(jīng)網(wǎng)絡(luò)的模型壓縮方面,本文使用一種基于通道剪枝的模型壓縮方法主要針對批量歸一化層前面的卷積層進(jìn)行通道剪枝,卷積輸出特征圖的每個通道都有批量歸一化層的縮放因子與之對應(yīng),通過對縮放因子施加L1正則化懲罰可以得到稀疏化...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.2.1 目標(biāo)檢測算法研究現(xiàn)狀
1.2.2 輕量化神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)
2.1 YOLOv3算法
2.1.1 網(wǎng)絡(luò)結(jié)構(gòu)
2.1.2 維度聚類
2.1.3 RPN網(wǎng)絡(luò)
2.1.4 Bounding box回歸
2.2 MobileNetV2網(wǎng)絡(luò)結(jié)構(gòu)
2.2.1 深度可分離卷積
2.2.2 線性瓶頸結(jié)構(gòu)
2.2.3 反向殘差結(jié)構(gòu)
2.3 計算加速
2.3.1 NEON指令簡介
2.3.2 AVX2指令簡介
2.3.3 OpenMP簡介
2.4 本章小結(jié)
第三章 基于通道剪枝的模型壓縮方法
3.1 通道剪枝的基本原理
3.2 通道選擇標(biāo)準(zhǔn)
3.3 通道剪枝的實現(xiàn)
3.4 本章小節(jié)
第四章 目標(biāo)檢測模型前向推理過程的優(yōu)化與實現(xiàn)
4.1 神經(jīng)網(wǎng)絡(luò)的設(shè)計與實現(xiàn)
4.1.1 基本組件設(shè)計
4.1.2 卷積層的實現(xiàn)
4.2 網(wǎng)絡(luò)層合并
4.3 NEON加速卷積神經(jīng)網(wǎng)絡(luò)計算
4.3.1 內(nèi)存對齊
4.3.2 NEON指令優(yōu)化計算
4.4 AVX2加速卷積神經(jīng)網(wǎng)絡(luò)計算
4.5 本章小節(jié)
第五章 實驗與分析
5.1 輕量級神經(jīng)網(wǎng)絡(luò)性能對比實驗
5.2 模型壓縮實驗
5.3 推理加速實驗
5.4 結(jié)論
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
學(xué)位論文評閱及答辯情況表
【參考文獻(xiàn)】:
期刊論文
[1]基于AVX2指令集的深度學(xué)習(xí)混合運算策略[J]. 蔣文斌,王宏斌,劉湃,陳雨浩. 清華大學(xué)學(xué)報(自然科學(xué)版). 2020(05)
[2]基于多元統(tǒng)計分析和機(jī)器學(xué)習(xí)的驗證碼識別[J]. 虞水磊,田新宇,王金燕. 山東理工大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
本文編號:3192205
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.2.1 目標(biāo)檢測算法研究現(xiàn)狀
1.2.2 輕量化神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 章節(jié)安排
第二章 相關(guān)理論基礎(chǔ)
2.1 YOLOv3算法
2.1.1 網(wǎng)絡(luò)結(jié)構(gòu)
2.1.2 維度聚類
2.1.3 RPN網(wǎng)絡(luò)
2.1.4 Bounding box回歸
2.2 MobileNetV2網(wǎng)絡(luò)結(jié)構(gòu)
2.2.1 深度可分離卷積
2.2.2 線性瓶頸結(jié)構(gòu)
2.2.3 反向殘差結(jié)構(gòu)
2.3 計算加速
2.3.1 NEON指令簡介
2.3.2 AVX2指令簡介
2.3.3 OpenMP簡介
2.4 本章小結(jié)
第三章 基于通道剪枝的模型壓縮方法
3.1 通道剪枝的基本原理
3.2 通道選擇標(biāo)準(zhǔn)
3.3 通道剪枝的實現(xiàn)
3.4 本章小節(jié)
第四章 目標(biāo)檢測模型前向推理過程的優(yōu)化與實現(xiàn)
4.1 神經(jīng)網(wǎng)絡(luò)的設(shè)計與實現(xiàn)
4.1.1 基本組件設(shè)計
4.1.2 卷積層的實現(xiàn)
4.2 網(wǎng)絡(luò)層合并
4.3 NEON加速卷積神經(jīng)網(wǎng)絡(luò)計算
4.3.1 內(nèi)存對齊
4.3.2 NEON指令優(yōu)化計算
4.4 AVX2加速卷積神經(jīng)網(wǎng)絡(luò)計算
4.5 本章小節(jié)
第五章 實驗與分析
5.1 輕量級神經(jīng)網(wǎng)絡(luò)性能對比實驗
5.2 模型壓縮實驗
5.3 推理加速實驗
5.4 結(jié)論
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
學(xué)位論文評閱及答辯情況表
【參考文獻(xiàn)】:
期刊論文
[1]基于AVX2指令集的深度學(xué)習(xí)混合運算策略[J]. 蔣文斌,王宏斌,劉湃,陳雨浩. 清華大學(xué)學(xué)報(自然科學(xué)版). 2020(05)
[2]基于多元統(tǒng)計分析和機(jī)器學(xué)習(xí)的驗證碼識別[J]. 虞水磊,田新宇,王金燕. 山東理工大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
本文編號:3192205
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3192205.html
最近更新
教材專著