天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

卷積檢測模型的GPU加速研究

發(fā)布時(shí)間:2017-03-19 08:07

  本文關(guān)鍵詞:卷積檢測模型的GPU加速研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:近年來,形變部件模型和卷積神經(jīng)網(wǎng)絡(luò)等卷積檢測模型在目標(biāo)檢測領(lǐng)域取得了極大的成功。這類模型能夠進(jìn)行大規(guī)模的機(jī)器學(xué)習(xí)訓(xùn)練,實(shí)現(xiàn)較高的魯棒性和識別性能。然而訓(xùn)練和檢測過程中卷積運(yùn)算巨大的計(jì)算開銷,卻限制了其在諸多實(shí)際場景中進(jìn)一步地應(yīng)用。幸運(yùn)的是,GPU通用并行計(jì)算技術(shù)日益成熟,為加速卷積檢測模型提供了可行的解決方案。在深入研究卷積檢測模型,分析其性能瓶頸后,本文在不損失檢測精度的前提下,利用數(shù)學(xué)理論和并行技術(shù)對卷積檢測模型實(shí)現(xiàn)了算法和硬件的雙重加速。在算法層面,本文通過應(yīng)用卷積定理,將空間域中的卷積運(yùn)算轉(zhuǎn)換為頻率域中的點(diǎn)乘運(yùn)算來降低模型計(jì)算復(fù)雜度,同時(shí)利用啟發(fā)式裝箱算法有效地平衡了存儲開銷和計(jì)算開銷之間的矛盾。在PASCAL VOC數(shù)據(jù)集上的實(shí)驗(yàn)表明,此頻域加速算法能夠在保證檢測精度的情況下有效地加速卷積檢測模型。在硬件層面,本文在詳細(xì)地分析頻域加速算法并行性的基礎(chǔ)上,使用Open CL對其進(jìn)行了GPU加速實(shí)現(xiàn),并采用內(nèi)存訪問優(yōu)化、數(shù)據(jù)傳輸優(yōu)化、控制流優(yōu)化等OpenCL優(yōu)化方法提高GPU實(shí)現(xiàn)的性能。實(shí)驗(yàn)結(jié)果表明,相對于傳統(tǒng)CPU實(shí)現(xiàn),本文GPU實(shí)現(xiàn)能夠加速效果明顯,而相對于完善優(yōu)化的CPU實(shí)現(xiàn)亦能有一定的性能提升。此外,本文還研究了HOG特征的GPU加速實(shí)現(xiàn)和優(yōu)化問題。實(shí)驗(yàn)結(jié)果表明,本文GPU實(shí)現(xiàn)相比于CPU能夠取得一定的加速效果。
【關(guān)鍵詞】:目標(biāo)檢測 形變部件模型 卷積神經(jīng)網(wǎng)絡(luò) GPU通用并行計(jì)算 Open CL HOG
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.41;TP183
【目錄】:
  • 摘要3-4
  • ABSTRACT4-10
  • 第一章 緒論10-16
  • 1.1 研究背景與意義10-11
  • 1.2 研究現(xiàn)狀11-14
  • 1.3 研究內(nèi)容與主要工作14-15
  • 1.4 章節(jié)安排15-16
  • 第二章 主流卷積檢測模型16-31
  • 2.1 形變部件模型16-24
  • 2.1.1 HOG特征16-18
  • 2.1.2 混合形變部件模型18-20
  • 2.1.3 模板匹配20-23
  • 2.1.4 Latent SVM23-24
  • 2.2 卷積神經(jīng)網(wǎng)絡(luò)24-30
  • 2.2.1 網(wǎng)絡(luò)結(jié)構(gòu)24-28
  • 2.2.2 卷積層28-29
  • 2.2.3 采樣層29-30
  • 2.3 本章小結(jié)30-31
  • 第三章 卷積檢測模型的頻域加速31-48
  • 3.1 頻域加速算法32-39
  • 3.1.1 計(jì)算復(fù)雜度分析32-34
  • 3.1.2 快速傅里葉變換34-36
  • 3.1.3 拼接策略36-39
  • 3.2 算法基本流程39-41
  • 3.3 實(shí)驗(yàn)結(jié)果與分析41-47
  • 3.4 本章小結(jié)47-48
  • 第四章 卷積檢測模型的GPU加速48-65
  • 4.1 OpenCL簡介48-53
  • 4.1.1 平臺模型48-49
  • 4.1.2 執(zhí)行模型49-51
  • 4.1.3 內(nèi)存模型51-52
  • 4.1.4 編程模型52-53
  • 4.2 算法并行性分析53-56
  • 4.2.1 數(shù)據(jù)并行性53-54
  • 4.2.2 任務(wù)并行性54-56
  • 4.3 GPU并行實(shí)現(xiàn)與優(yōu)化56-62
  • 4.3.1 OpenCL實(shí)現(xiàn)56-58
  • 4.3.2 OpenCL優(yōu)化58-62
  • 4.4 實(shí)驗(yàn)結(jié)果與分析62-64
  • 4.5 本章小結(jié)64-65
  • 第五章 HOG特征的GPU加速65-72
  • 5.1 HOG特征概述65-67
  • 5.2 GPU并行實(shí)現(xiàn)與優(yōu)化67-70
  • 5.2.1 計(jì)算圖像梯度68
  • 5.2.2 統(tǒng)計(jì)梯度直方圖68-69
  • 5.2.3 計(jì)算梯度能量69-70
  • 5.2.4 構(gòu)建特征70
  • 5.3 實(shí)驗(yàn)結(jié)果與分析70-71
  • 5.4 本章小結(jié)71-72
  • 第六章 總結(jié)與展望72-74
  • 6.1 本文工作總結(jié)72-73
  • 6.2 后續(xù)研究展望73-74
  • 參考文獻(xiàn)74-79
  • 致謝79-80
  • 攻讀碩士學(xué)位期間已發(fā)表或錄用的論文80-82

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前2條

1 黃凱奇;任偉強(qiáng);譚鐵牛;;圖像物體分類與檢測算法綜述[J];計(jì)算機(jī)學(xué)報(bào);2014年06期

2 李焱;張?jiān)迫?劉益群;龍國平;賈海鵬;;MPFFT:An Auto-Tuning FFT Library for OpenCL GPUs[J];Journal of Computer Science & Technology;2013年01期


  本文關(guān)鍵詞:卷積檢測模型的GPU加速研究,由筆耕文化傳播整理發(fā)布。



本文編號:255763

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/255763.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f4ebb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com