天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

卷積檢測模型的GPU加速研究

發(fā)布時間:2017-03-19 08:07

  本文關鍵詞:卷積檢測模型的GPU加速研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:近年來,形變部件模型和卷積神經網絡等卷積檢測模型在目標檢測領域取得了極大的成功。這類模型能夠進行大規(guī)模的機器學習訓練,實現較高的魯棒性和識別性能。然而訓練和檢測過程中卷積運算巨大的計算開銷,卻限制了其在諸多實際場景中進一步地應用。幸運的是,GPU通用并行計算技術日益成熟,為加速卷積檢測模型提供了可行的解決方案。在深入研究卷積檢測模型,分析其性能瓶頸后,本文在不損失檢測精度的前提下,利用數學理論和并行技術對卷積檢測模型實現了算法和硬件的雙重加速。在算法層面,本文通過應用卷積定理,將空間域中的卷積運算轉換為頻率域中的點乘運算來降低模型計算復雜度,同時利用啟發(fā)式裝箱算法有效地平衡了存儲開銷和計算開銷之間的矛盾。在PASCAL VOC數據集上的實驗表明,此頻域加速算法能夠在保證檢測精度的情況下有效地加速卷積檢測模型。在硬件層面,本文在詳細地分析頻域加速算法并行性的基礎上,使用Open CL對其進行了GPU加速實現,并采用內存訪問優(yōu)化、數據傳輸優(yōu)化、控制流優(yōu)化等OpenCL優(yōu)化方法提高GPU實現的性能。實驗結果表明,相對于傳統(tǒng)CPU實現,本文GPU實現能夠加速效果明顯,而相對于完善優(yōu)化的CPU實現亦能有一定的性能提升。此外,本文還研究了HOG特征的GPU加速實現和優(yōu)化問題。實驗結果表明,本文GPU實現相比于CPU能夠取得一定的加速效果。
【關鍵詞】:目標檢測 形變部件模型 卷積神經網絡 GPU通用并行計算 Open CL HOG
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41;TP183
【目錄】:
  • 摘要3-4
  • ABSTRACT4-10
  • 第一章 緒論10-16
  • 1.1 研究背景與意義10-11
  • 1.2 研究現狀11-14
  • 1.3 研究內容與主要工作14-15
  • 1.4 章節(jié)安排15-16
  • 第二章 主流卷積檢測模型16-31
  • 2.1 形變部件模型16-24
  • 2.1.1 HOG特征16-18
  • 2.1.2 混合形變部件模型18-20
  • 2.1.3 模板匹配20-23
  • 2.1.4 Latent SVM23-24
  • 2.2 卷積神經網絡24-30
  • 2.2.1 網絡結構24-28
  • 2.2.2 卷積層28-29
  • 2.2.3 采樣層29-30
  • 2.3 本章小結30-31
  • 第三章 卷積檢測模型的頻域加速31-48
  • 3.1 頻域加速算法32-39
  • 3.1.1 計算復雜度分析32-34
  • 3.1.2 快速傅里葉變換34-36
  • 3.1.3 拼接策略36-39
  • 3.2 算法基本流程39-41
  • 3.3 實驗結果與分析41-47
  • 3.4 本章小結47-48
  • 第四章 卷積檢測模型的GPU加速48-65
  • 4.1 OpenCL簡介48-53
  • 4.1.1 平臺模型48-49
  • 4.1.2 執(zhí)行模型49-51
  • 4.1.3 內存模型51-52
  • 4.1.4 編程模型52-53
  • 4.2 算法并行性分析53-56
  • 4.2.1 數據并行性53-54
  • 4.2.2 任務并行性54-56
  • 4.3 GPU并行實現與優(yōu)化56-62
  • 4.3.1 OpenCL實現56-58
  • 4.3.2 OpenCL優(yōu)化58-62
  • 4.4 實驗結果與分析62-64
  • 4.5 本章小結64-65
  • 第五章 HOG特征的GPU加速65-72
  • 5.1 HOG特征概述65-67
  • 5.2 GPU并行實現與優(yōu)化67-70
  • 5.2.1 計算圖像梯度68
  • 5.2.2 統(tǒng)計梯度直方圖68-69
  • 5.2.3 計算梯度能量69-70
  • 5.2.4 構建特征70
  • 5.3 實驗結果與分析70-71
  • 5.4 本章小結71-72
  • 第六章 總結與展望72-74
  • 6.1 本文工作總結72-73
  • 6.2 后續(xù)研究展望73-74
  • 參考文獻74-79
  • 致謝79-80
  • 攻讀碩士學位期間已發(fā)表或錄用的論文80-82

【參考文獻】

中國期刊全文數據庫 前2條

1 黃凱奇;任偉強;譚鐵牛;;圖像物體分類與檢測算法綜述[J];計算機學報;2014年06期

2 李焱;張云泉;劉益群;龍國平;賈海鵬;;MPFFT:An Auto-Tuning FFT Library for OpenCL GPUs[J];Journal of Computer Science & Technology;2013年01期


  本文關鍵詞:卷積檢測模型的GPU加速研究,由筆耕文化傳播整理發(fā)布。



本文編號:255763

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/255763.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶f4ebb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
99久久精品国产日本| 日本加勒比中文在线观看| 欧美精品二区中文乱码字幕高清| 亚洲最新的黄色录像在线| 欧美成人精品一区二区久久| 国产成人高清精品尤物| 1024你懂的在线视频| 久久精品福利在线观看| 国产亚洲欧美另类久久久| 五月天综合网五月天综合网| 中文字幕精品人妻一区| 草草视频精品在线观看| 日韩中文字幕人妻精品| 少妇特黄av一区二区三区| 欧美乱码精品一区二区三| 日韩欧美国产精品中文字幕| 神马午夜福利免费视频| 久久热中文字幕在线视频| 亚洲国产天堂av成人在线播放| 一区二区不卡免费观看免费| 99精品人妻少妇一区二区人人妻| 国内真实露脸偷拍视频| 香港国产三级久久精品三级| 中文字幕在线区中文色| 免费精品一区二区三区| 国产av一二三区在线观看| 国产一级特黄在线观看| 麻豆最新出品国产精品| 成人精品一级特黄大片| 国内精品伊人久久久av高清| 日本理论片午夜在线观看| 欧美高潮喷吹一区二区| 精品久久少妇激情视频| 国产精品成人一区二区在线| 五月综合激情婷婷丁香| 日韩美成人免费在线视频| 国产精品美女午夜福利| 欧美一区二区三区性视频| 东京热一二三区在线免| 国产精品夜色一区二区三区不卡| 最新日韩精品一推荐日韩精品|