CPU-GPU異構(gòu)計(jì)算環(huán)境下的Cube CNN模型設(shè)計(jì)與應(yīng)用研究
發(fā)布時(shí)間:2020-06-30 02:48
【摘要】:高光譜圖像分類是遙感領(lǐng)域的研究熱點(diǎn)之一。隨著光譜信息的不斷豐富和光譜波段數(shù)的迅速增加,傳統(tǒng)分類器如支持向量機(jī)、隨機(jī)森林等,在處理高光譜分類應(yīng)用時(shí),往往由于輸入數(shù)據(jù)的維度高而遭遇性能瓶頸。近年來,深度學(xué)習(xí)方法發(fā)展迅速,深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)能夠有效地從原始圖像中提取具有代表性的特征,因此在圖像分類領(lǐng)域應(yīng)用廣泛。由于高光譜圖像分類是像素級(jí)別分類,因此,設(shè)計(jì)專用于高光譜圖像分類應(yīng)用的深度CNN網(wǎng)絡(luò),一直是高光譜圖像分類領(lǐng)域研究的關(guān)鍵。圖形處理器(Graphic Processing Unit,GPU)作為最通用的加速芯片之一,被廣泛應(yīng)用于高性能計(jì)算領(lǐng)域。由于深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練耗時(shí)嚴(yán)重,越來越多的研究人員致力于將GPU應(yīng)用于深度學(xué)習(xí)領(lǐng)域,以加速模型的訓(xùn)練過程。本文將高光譜圖像近鄰像素策略與CNN相結(jié)合,提出一種面向高光譜圖像分類應(yīng)用的Cube CNN模型。針對(duì)該模型的訓(xùn)練特點(diǎn),提出基于GPU平臺(tái)的GCN并行加速框架:首先,本文為GCN框架設(shè)計(jì)了一種高光譜圖像數(shù)據(jù)集預(yù)處理算法——PNPE(Parallel Neighbor Pixel Extraction)算法,該算法能夠并行地從原始高光譜圖像數(shù)據(jù)集中提取樣本并保存在GPU的Global Memory中,用于后續(xù)模型的訓(xùn)練。其次,結(jié)合Cube CNN各層的數(shù)據(jù)運(yùn)算特點(diǎn)和GPU的軟硬件體系結(jié)構(gòu)特點(diǎn),本文在GCN框架中引入了Cube CNN-To-GPU的映射機(jī)制,該機(jī)制能夠?qū)ube CNN各層的訓(xùn)練映射到GPU端的CUDA kernel,為模型訓(xùn)練的GPU并行加速奠定基礎(chǔ)。最后,本文設(shè)計(jì)了GPU端具體的數(shù)據(jù)存儲(chǔ)模式和同步機(jī)制,并將Multiple CUDA Streams技術(shù)與小批量梯度下降(MBGD)算法相結(jié)合,進(jìn)一步提高了該算法的執(zhí)行效率。實(shí)驗(yàn)證明,在保證Cube CNN模型精度的前提下,GCN框架能有效提升模型的訓(xùn)練速度,與常用并行加速平臺(tái)Caffe和Theano相比,最多分別能縮短85%+和90%+的模型訓(xùn)練時(shí)間。最后,本文通過設(shè)計(jì)跨平臺(tái)GPU上的模型訓(xùn)練時(shí)間對(duì)比實(shí)驗(yàn),驗(yàn)證了GCN框架具有良好的可移植性。
【學(xué)位授予單位】:南開大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP751;TP183
【圖文】:
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性多核處理器。無論是計(jì)算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)通個(gè)人電腦到 Top500 中的超級(jí)計(jì)算機(jī)中[16]。CPU 和 GPU 的計(jì)算能力對(duì)比如圖 1-1 所示,從 2011 年開始,與 Int圖 1-1 CPU 與 GPU 浮點(diǎn)計(jì)算能力對(duì)比[49]
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性、多線程的多核處理器。無論是計(jì)算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代表的眾核通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)用于從普通個(gè)人電腦到 Top500 中的超級(jí)計(jì)算機(jī)中[16]。CPU 和 GPU 的計(jì)算能力對(duì)比如圖 1-1 所示,從 2011 年開始,與 Intel CPU圖 1-1 CPU 與 GPU 浮點(diǎn)計(jì)算能力對(duì)比[49]
本文編號(hào):2734743
【學(xué)位授予單位】:南開大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP751;TP183
【圖文】:
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性多核處理器。無論是計(jì)算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)通個(gè)人電腦到 Top500 中的超級(jí)計(jì)算機(jī)中[16]。CPU 和 GPU 的計(jì)算能力對(duì)比如圖 1-1 所示,從 2011 年開始,與 Int圖 1-1 CPU 與 GPU 浮點(diǎn)計(jì)算能力對(duì)比[49]
與傳統(tǒng)的中央處理器 CPU 相比,GPU 已演化成為擁有高并發(fā)性、多線程的多核處理器。無論是計(jì)算能力和內(nèi)存帶寬都遠(yuǎn)超 CPU,以 GPU 為代表的眾核通用加速器迅速發(fā)展成為并行與高性能領(lǐng)域的主流技術(shù),并被廣泛應(yīng)用于從普通個(gè)人電腦到 Top500 中的超級(jí)計(jì)算機(jī)中[16]。CPU 和 GPU 的計(jì)算能力對(duì)比如圖 1-1 所示,從 2011 年開始,與 Intel CPU圖 1-1 CPU 與 GPU 浮點(diǎn)計(jì)算能力對(duì)比[49]
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2012年08期
本文編號(hào):2734743
本文鏈接:http://sikaile.net/guanlilunwen/gongchengguanli/2734743.html
最近更新
教材專著