基于GPU的高性能計(jì)算研究與應(yīng)用
本文關(guān)鍵詞:基于GPU的高性能計(jì)算研究與應(yīng)用,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,信息技術(shù)的迅猛發(fā)展和普及應(yīng)用所帶來的數(shù)據(jù)爆炸性增長,對現(xiàn)有的數(shù)據(jù)處理技術(shù)提出了新的挑戰(zhàn)。大數(shù)據(jù)的規(guī)模之大,使得現(xiàn)有的串行計(jì)算方法難以在可接受的時間內(nèi)快速完成其處理和計(jì)算。為了提高處理效率,需要利用高性能計(jì)算技術(shù),使用分而治之的并行計(jì)算模型來支撐大數(shù)據(jù)處理。而GPU由于其強(qiáng)大的并行計(jì)算能力、高吞吐率以及高性價比,已經(jīng)成為高性能計(jì)算領(lǐng)域的主流加速器。但是,目前基于GPU的高性能計(jì)算技術(shù)對GPU的計(jì)算能力的利用不夠充分,難以應(yīng)對大數(shù)據(jù)環(huán)境下的并行計(jì)算。另外,在一些實(shí)際應(yīng)用場景中,需要用戶熟悉GPU程序開發(fā)細(xì)節(jié),使得高性能計(jì)算系統(tǒng)的易用性受到影響。因此,本文中選取大數(shù)據(jù)環(huán)境下基于GPU的高性能計(jì)算的兩個方面進(jìn)行研究:(1)對基于GPU的高性能計(jì)算技術(shù)中的并行計(jì)算模型進(jìn)行研究與改進(jìn):MapReduce是一種適用于大數(shù)據(jù)處理的分布式計(jì)算模型,但其計(jì)算能力受到硬件設(shè)備的限制。因此,以MapReduce模型為基礎(chǔ),借助GPU的強(qiáng)大硬件并行能力,設(shè)計(jì)并實(shí)現(xiàn)了一種基于MapReduce的GPU并行計(jì)算模型——GSMR模型。實(shí)驗(yàn)顯示,GSMR與同類模型相比達(dá)到良好的加速比,并具有可擴(kuò)展性。(2)對GPU高性能計(jì)算技術(shù)的具體應(yīng)用進(jìn)行研究,涉及兩項(xiàng)問題:研究大數(shù)據(jù)環(huán)境下傳統(tǒng)網(wǎng)絡(luò)轉(zhuǎn)發(fā)設(shè)備進(jìn)行IP報文處理時所面臨的吞吐率不足問題,提出一種基于GPU的并行報文分類方法,并對不同類型報文分類算法的并行化及優(yōu)化方法進(jìn)行分析。實(shí)驗(yàn)顯示該方法能夠有效提高報文處理速度,提高網(wǎng)絡(luò)設(shè)備吞吐率。另外,針對科學(xué)計(jì)算用戶,研究如何提供GPU高性能計(jì)算的虛擬化服務(wù)。對此提出一種基于RPC的GPU虛擬化方法,通過函數(shù)級調(diào)用的方式,使得用戶可以無需關(guān)心GPU編程細(xì)節(jié)。實(shí)驗(yàn)顯示,該方法相對于本地計(jì)算而言大大提高了運(yùn)算速度,增強(qiáng)了GPU高性能計(jì)算的易用性。
【關(guān)鍵詞】:高性能計(jì)算 大數(shù)據(jù) GPU MapReduce 報文分類 虛擬化
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP38
【目錄】:
- 摘要4-5
- ABSTRACT5-12
- 注釋表12-13
- 縮略詞13-14
- 第一章 緒論14-20
- 1.1 研究背景14-17
- 1.1.1 高性能計(jì)算概述14-15
- 1.1.2 大數(shù)據(jù)研究概述15-17
- 1.2 研究內(nèi)容與意義17-18
- 1.3 本文的內(nèi)容安排18-20
- 第二章 高性能計(jì)算相關(guān)技術(shù)研究20-32
- 2.1 相關(guān)技術(shù)研究現(xiàn)狀20-21
- 2.2 GPU通用計(jì)算技術(shù)21-27
- 2.2.1 CUDA軟硬件體系21-25
- 2.2.2 CUDA編程模型25-27
- 2.3 Map Reduce分布式計(jì)算技術(shù)27-31
- 2.3.1 Map Reduce模型架構(gòu)27-29
- 2.3.2 Map Reduce實(shí)例29-31
- 2.4 本章小結(jié)31-32
- 第三章 基于Map Reduce的GPU并行計(jì)算模型設(shè)計(jì)與實(shí)現(xiàn)32-56
- 3.1 相關(guān)研究工作32-35
- 3.1.1 Mars架構(gòu)33-35
- 3.2 GSMR模型設(shè)計(jì)35-46
- 3.2.1 設(shè)計(jì)目標(biāo)35-37
- 3.2.2 工作流程37-42
- 3.2.3 緩沖區(qū)管理42-44
- 3.2.4 可擴(kuò)展性44-46
- 3.3 GSMR模型實(shí)現(xiàn)方法46-52
- 3.3.1 用戶接口46-50
- 3.3.2 實(shí)驗(yàn)配置50-51
- 3.3.3 實(shí)驗(yàn)應(yīng)用程序51-52
- 3.4 實(shí)驗(yàn)結(jié)果與分析52-55
- 3.4.1 與Mars對比實(shí)驗(yàn)52-54
- 3.4.2 可擴(kuò)展性實(shí)驗(yàn)54-55
- 3.5 本章小結(jié)55-56
- 第四章 GPU高性能計(jì)算技術(shù)應(yīng)用研究56-74
- 4.1 基于GPU的并行報文分類方法56-65
- 4.1.1 問題描述56-57
- 4.1.2 報文分類算法及其并行化方法57-60
- 4.1.3 并行報文分類算法的優(yōu)化60-62
- 4.1.4 實(shí)驗(yàn)結(jié)果與分析62-65
- 4.2 基于RPC的GPU虛擬化方法65-73
- 4.2.1 問題描述65-66
- 4.2.2 GPU遠(yuǎn)程調(diào)用方法66-68
- 4.2.3 基于RPC的GPU虛擬化方法68-70
- 4.2.4 實(shí)驗(yàn)結(jié)果與分析70-73
- 4.3 本章小結(jié)73-74
- 第五章 總結(jié)與展望74-76
- 5.1 全文小結(jié)74-75
- 5.2 未來工作75-76
- 參考文獻(xiàn)76-82
- 致謝82-83
- 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文83
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 焦鋒,劉群,邢文建;客戶機(jī)/服務(wù)器下的數(shù)據(jù)緩存技術(shù)[J];遼寧工程技術(shù)大學(xué)學(xué)報;2005年02期
2 張馳;李安波;;房產(chǎn)產(chǎn)權(quán)產(chǎn)籍系統(tǒng)中數(shù)據(jù)緩存的應(yīng)用[J];測繪科學(xué);2009年03期
3 顧榮慶;楊開杰;徐汀榮;;分布式數(shù)據(jù)緩存技術(shù)研究[J];計(jì)算機(jī)應(yīng)用與軟件;2011年06期
4 王家堯;王桂玲;張鵬;;基于緩存的復(fù)合數(shù)據(jù)服務(wù)更新優(yōu)化方法[J];微電子學(xué)與計(jì)算機(jī);2013年03期
5 黃世能,奚建清;分布訪問環(huán)境中的數(shù)據(jù)緩存體系研究[J];計(jì)算機(jī)工程與科學(xué);2000年06期
6 黃世能,奚建清;分布數(shù)據(jù)緩存體系[J];軟件學(xué)報;2001年07期
7 宋媛媛;徐生林;楊成忠;;基于OPC協(xié)議IO Server的設(shè)計(jì)與實(shí)現(xiàn)[J];工業(yè)控制計(jì)算機(jī);2007年04期
8 周京暉;;數(shù)據(jù)緩存按需同步的設(shè)計(jì)與應(yīng)用[J];軟件;2013年05期
9 王俐;;利用數(shù)據(jù)緩存技術(shù)提升系統(tǒng)性能的探討[J];價值工程;2012年09期
10 宋宏斌;肖曉強(qiáng);徐明;林磊;;一種城市車輛網(wǎng)絡(luò)中的數(shù)據(jù)緩存算法[J];計(jì)算機(jī)應(yīng)用;2010年01期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 石磊;陳曉敏;朱巖;李昆;;基于SDRAM的高速數(shù)據(jù)緩存的FPGA控制實(shí)現(xiàn)[A];第二十三屆全國空間探測學(xué)術(shù)交流會論文摘要集[C];2010年
2 孫凌;高西奇;;FUTURE系統(tǒng)中MT側(cè)RLC層的設(shè)計(jì)與實(shí)現(xiàn)[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(上)[C];2006年
3 蔡海興;符影杰;;基于Windows CE串行通信實(shí)現(xiàn)現(xiàn)場抄表[A];全國自動化新技術(shù)學(xué)術(shù)交流會會議論文集(一)[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前6條
1 王志強(qiáng);銀行應(yīng)用系統(tǒng)間的數(shù)據(jù)交換[N];計(jì)算機(jī)世界;2005年
2 陳代壽;網(wǎng)管不言愁[N];中國計(jì)算機(jī)報;2000年
3 本報記者 諶力;整合 從實(shí)時數(shù)據(jù)處理開始[N];網(wǎng)絡(luò)世界;2004年
4 易成;平安在上海深圳設(shè)立數(shù)據(jù)中心[N];中國保險報;2004年
5 ;數(shù)據(jù)庫的動態(tài)性能調(diào)優(yōu)[N];計(jì)算機(jī)世界;2002年
6 子言 王春秋 本報記者 姚睿;智能手機(jī)“芯”情報告[N];計(jì)算機(jī)世界;2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 殷君茹;分布式并行環(huán)境下林地落界數(shù)據(jù)快速統(tǒng)計(jì)技術(shù)研究[D];中國林業(yè)科學(xué)研究院;2015年
2 韓晶;大數(shù)據(jù)服務(wù)若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2013年
3 苗艷超;數(shù)字視頻服務(wù)關(guān)鍵技術(shù)研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 譚云;數(shù)據(jù)命名網(wǎng)絡(luò)上的一種存儲高效可并行的數(shù)據(jù)名查找方案[D];暨南大學(xué);2015年
2 劉汀枝;基于Coherence的債券數(shù)據(jù)緩存服務(wù)系統(tǒng)設(shè)計(jì)[D];復(fù)旦大學(xué);2014年
3 周學(xué)安;基于IEEE1394b數(shù)據(jù)光傳輸模塊研制[D];哈爾濱工業(yè)大學(xué);2015年
4 覃馨;基于最終一致性的數(shù)據(jù)緩存策略研究與設(shè)計(jì)[D];大連海事大學(xué);2015年
5 周瓊;基于大數(shù)據(jù)的新聞管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2014年
6 趙亞芳;高速可定時數(shù)據(jù)合成模塊設(shè)計(jì)[D];電子科技大學(xué);2014年
7 任亮;油氣田鉆采數(shù)據(jù)轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)研究及實(shí)現(xiàn)[D];中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2015年
8 趙振東;定向互聯(lián)網(wǎng)站點(diǎn)數(shù)據(jù)爬蟲及應(yīng)用服務(wù)接口的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2014年
9 楊光陽;基于FPGA的硬件千兆網(wǎng)絡(luò)通信設(shè)計(jì)[D];電子科技大學(xué);2015年
10 張彥怡;房地局統(tǒng)一數(shù)據(jù)服務(wù)平臺系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
本文關(guān)鍵詞:基于GPU的高性能計(jì)算研究與應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號:288700
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/288700.html