GPU上的同步機制及圖匹配方法研究
發(fā)布時間:2024-06-02 06:20
近年來,海量多源異構(gòu)數(shù)據(jù)急劇增長,數(shù)據(jù)表現(xiàn)形式變得更加復(fù)雜。數(shù)據(jù)規(guī)模的不斷增大,使得傳統(tǒng)CPU硬件平臺的存儲和計算能力遠(yuǎn)不能滿足應(yīng)用需求。GPU的出現(xiàn)可使這些問題在一定程度上得到解決,但對于GPU底層硬件而言,很難實現(xiàn)全局同步操作。圖數(shù)據(jù)具有靈活、強大的表示能力,圖匹配作為圖上的一種基本操作,被廣泛應(yīng)用于各個領(lǐng)域。研究基于GPU眾核平臺上的線程同步及高效、精準(zhǔn)的圖匹配方法,具有重要的理論研究意義及實際應(yīng)用價值。本文基于GPU眾核平臺,研究線程塊間的寬松同步機制以及不同評價標(biāo)準(zhǔn)下的圖匹配方法,主要的研究內(nèi)容如下:(1)GPU上線程塊間同步問題的研究。目前GPU上線程塊間的同步操作主要借助CPU實現(xiàn),大量CPU與GPU之間數(shù)據(jù)的傳輸,使得此方法效率較低,不能滿足某些對時間要求較嚴(yán)格的實際應(yīng)用的需求。本文針對該問題,提出了一種基于信號量的GPU設(shè)備上的寬松同步機制,旨在實現(xiàn)GPU上線程塊間的直接同步操作,可減少CPU與GPU之間頻繁的數(shù)據(jù)傳輸,提升整體計算效率。實驗中針對單源最短路徑,驗證了該寬松同步機制的有效性。(2)基于圖編輯距離評價的圖匹配方法研究。在明晰圖編輯距離與置換矩陣的基礎(chǔ)上,...
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3986979
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-2CPU與GPU架構(gòu)對比圖
ectX10GPU的出現(xiàn),使得通用計算圖形)開始被較多的科研工作者應(yīng)用。但GPGPU編程性低;序開發(fā)難度大。兩處弊端,傳統(tǒng)的GPGPU未能被開發(fā)人點,提高其可用性,在一些研究學(xué)者的基礎(chǔ)計算設(shè)備架構(gòu)編程模型(即CUDA),旨在充
圖2-3grid,block與thread三者之間關(guān)系圖
該block被劃分成大小為32的線程調(diào)度單元。因此,在實際編程過程中,線程塊中線程的個數(shù)推薦使用32的倍數(shù),以便更高效的利用資源。GPU線程以grid的形式組織,每個grid中包含若干線程塊,即SMs。同一block中的眾多thread具有相同的指....
圖2-5未經(jīng)過轉(zhuǎn)置的矩陣乘法運算的部分線程分布圖
Cache命中失效。對后者矩陣進(jìn)行轉(zhuǎn)置,可解決上述問題lano[36]研究發(fā)現(xiàn)在同一block中的所有線程,若相鄰的線程能夠依順序連續(xù)讀取物理內(nèi)存上相鄰位置的數(shù)值,則GPU上讀取內(nèi)存數(shù)大減少。在CUDA應(yīng)用程序中,block中的線程分布如圖2-5所示需要讀取矩....
圖2-6經(jīng)轉(zhuǎn)置之后的矩陣乘法運算的部分線程分布圖
涉及到的與圖相關(guān)的幾個定義,又闡述GPU硬件平臺,GPU上U上并行計算的映射方式做了簡單
本文編號:3986979
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3986979.html
最近更新
教材專著