卷積檢測模型的GPU加速研究
發(fā)布時間:2017-03-19 08:07
本文關鍵詞:卷積檢測模型的GPU加速研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,形變部件模型和卷積神經網絡等卷積檢測模型在目標檢測領域取得了極大的成功。這類模型能夠進行大規(guī)模的機器學習訓練,實現較高的魯棒性和識別性能。然而訓練和檢測過程中卷積運算巨大的計算開銷,卻限制了其在諸多實際場景中進一步地應用。幸運的是,GPU通用并行計算技術日益成熟,為加速卷積檢測模型提供了可行的解決方案。在深入研究卷積檢測模型,分析其性能瓶頸后,本文在不損失檢測精度的前提下,利用數學理論和并行技術對卷積檢測模型實現了算法和硬件的雙重加速。在算法層面,本文通過應用卷積定理,將空間域中的卷積運算轉換為頻率域中的點乘運算來降低模型計算復雜度,同時利用啟發(fā)式裝箱算法有效地平衡了存儲開銷和計算開銷之間的矛盾。在PASCAL VOC數據集上的實驗表明,此頻域加速算法能夠在保證檢測精度的情況下有效地加速卷積檢測模型。在硬件層面,本文在詳細地分析頻域加速算法并行性的基礎上,使用Open CL對其進行了GPU加速實現,并采用內存訪問優(yōu)化、數據傳輸優(yōu)化、控制流優(yōu)化等OpenCL優(yōu)化方法提高GPU實現的性能。實驗結果表明,相對于傳統(tǒng)CPU實現,本文GPU實現能夠加速效果明顯,而相對于完善優(yōu)化的CPU實現亦能有一定的性能提升。此外,本文還研究了HOG特征的GPU加速實現和優(yōu)化問題。實驗結果表明,本文GPU實現相比于CPU能夠取得一定的加速效果。
【關鍵詞】:目標檢測 形變部件模型 卷積神經網絡 GPU通用并行計算 Open CL HOG
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41;TP183
【目錄】:
- 摘要3-4
- ABSTRACT4-10
- 第一章 緒論10-16
- 1.1 研究背景與意義10-11
- 1.2 研究現狀11-14
- 1.3 研究內容與主要工作14-15
- 1.4 章節(jié)安排15-16
- 第二章 主流卷積檢測模型16-31
- 2.1 形變部件模型16-24
- 2.1.1 HOG特征16-18
- 2.1.2 混合形變部件模型18-20
- 2.1.3 模板匹配20-23
- 2.1.4 Latent SVM23-24
- 2.2 卷積神經網絡24-30
- 2.2.1 網絡結構24-28
- 2.2.2 卷積層28-29
- 2.2.3 采樣層29-30
- 2.3 本章小結30-31
- 第三章 卷積檢測模型的頻域加速31-48
- 3.1 頻域加速算法32-39
- 3.1.1 計算復雜度分析32-34
- 3.1.2 快速傅里葉變換34-36
- 3.1.3 拼接策略36-39
- 3.2 算法基本流程39-41
- 3.3 實驗結果與分析41-47
- 3.4 本章小結47-48
- 第四章 卷積檢測模型的GPU加速48-65
- 4.1 OpenCL簡介48-53
- 4.1.1 平臺模型48-49
- 4.1.2 執(zhí)行模型49-51
- 4.1.3 內存模型51-52
- 4.1.4 編程模型52-53
- 4.2 算法并行性分析53-56
- 4.2.1 數據并行性53-54
- 4.2.2 任務并行性54-56
- 4.3 GPU并行實現與優(yōu)化56-62
- 4.3.1 OpenCL實現56-58
- 4.3.2 OpenCL優(yōu)化58-62
- 4.4 實驗結果與分析62-64
- 4.5 本章小結64-65
- 第五章 HOG特征的GPU加速65-72
- 5.1 HOG特征概述65-67
- 5.2 GPU并行實現與優(yōu)化67-70
- 5.2.1 計算圖像梯度68
- 5.2.2 統(tǒng)計梯度直方圖68-69
- 5.2.3 計算梯度能量69-70
- 5.2.4 構建特征70
- 5.3 實驗結果與分析70-71
- 5.4 本章小結71-72
- 第六章 總結與展望72-74
- 6.1 本文工作總結72-73
- 6.2 后續(xù)研究展望73-74
- 參考文獻74-79
- 致謝79-80
- 攻讀碩士學位期間已發(fā)表或錄用的論文80-82
【參考文獻】
中國期刊全文數據庫 前2條
1 黃凱奇;任偉強;譚鐵牛;;圖像物體分類與檢測算法綜述[J];計算機學報;2014年06期
2 李焱;張云泉;劉益群;龍國平;賈海鵬;;MPFFT:An Auto-Tuning FFT Library for OpenCL GPUs[J];Journal of Computer Science & Technology;2013年01期
本文關鍵詞:卷積檢測模型的GPU加速研究,由筆耕文化傳播整理發(fā)布。
本文編號:255763
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/255763.html