GPU通用計算中的數(shù)據(jù)結(jié)構(gòu)組織與應(yīng)用研究
發(fā)布時間:2020-12-24 13:05
計算機圖形處理器(graphics processing unit,簡稱GPU)用于通用計算的研究現(xiàn)在已經(jīng)成為一個熱門的研究領(lǐng)域。數(shù)據(jù)結(jié)構(gòu)在GPU下的組織與應(yīng)用是研究GPU通用計算的前提,沒有數(shù)據(jù)結(jié)構(gòu)的支撐也就不會有GPU下具體的運算實現(xiàn)。本文在對GPU體系結(jié)構(gòu)、編程接口、常用繪制語言及流編程模型的分析基礎(chǔ)之上,主要以線性表這一基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)為研究對象,對其在GPU下的物理結(jié)構(gòu)和邏輯結(jié)構(gòu)進行了詳細的分析,從而給出相應(yīng)的組織方法。通過比較分析提出了一種在GPU下對線性表實現(xiàn)刪除和插入運算的方法。論文將數(shù)據(jù)結(jié)構(gòu)應(yīng)用于窮舉搜索,并通過此應(yīng)用來討論GPU下通用計算的性能。由CPU下窮舉搜索的性能較差,引出從軟件方面將其并行化的改進方法。其次,研究了從硬件方面的改進過程,即如何將窮舉搜索移植到GPU環(huán)境下,并與CPU下的窮舉法進行實驗性能對比,通過對測試結(jié)果的分析,得出GPU進行通用計算的具體性能指標。最后通過實驗得出如下結(jié)論:在不考慮帶寬影響的情況下,處理的數(shù)據(jù)規(guī)模越大在GPU下執(zhí)行時越能得到良好的加速比;能夠多遍調(diào)用渲染操作的算法很適合在GPU下實現(xiàn),這樣可以提高核心算法在計算中的耗時比例,...
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
頂點處理器流水線結(jié)構(gòu)
圖6片段處理器和像素流水線川{段處理器調(diào)用紋理單元(textureunit)從存儲器中讀取數(shù)據(jù),并選擇性的在段處理器之前進行過濾操作。紋理單元支持很多類型的源數(shù)據(jù)格式,數(shù)據(jù)可過濾、三線性過濾或各向異性過濾,所有的數(shù)據(jù)以印32或fP16數(shù)據(jù)格式返器。一個紋理可以看作是二維或三維的數(shù)組,紋理單元可以讀取其任意位置段處理器的每條流水線擁有兩個fP32格式的繪制單元(shaderunit),片段在循環(huán)流動之前,被定向到繪制單元和分支處理器執(zhí)行后續(xù)指令。這種重定鐘周期中發(fā)生一次。而且,第一個fP32繪制器(shader)可以在需要時用來行透視修正,或用來進行通用的乘法運算。通常來說,在一個時鐘周期內(nèi)8條或更多操作是可能的,或者在第一個繪制單元發(fā)生紋理讀取則能夠執(zhí)。GPU編程中的流水線結(jié)構(gòu)非圖形操作單元方面由于圖形硬件的可編程性越來越強大與標準的多邊
下-萬光柵掃描操作,一圖7可編程圖形流水線orce6系列體系結(jié)構(gòu)[23]為例所展示的其圖形流水線簡擎,一個可編程片段引擎,一個紋理加載/過濾引擎,(adepth一compare/blendingdatawriteengine)。中,GPU可以被看作是一個具有大量可編程浮點運算實現(xiàn)計算密集型應(yīng)用而完全與計算機圖形無關(guān)。
【參考文獻】:
期刊論文
[1]圖形處理器用于通用計算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J]. 吳恩華. 軟件學(xué)報. 2004(10)
[2]基于圖形處理器(GPU)的通用計算[J]. 吳恩華,柳有權(quán). 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2004(05)
碩士論文
[1]基于GPU的串匹配算法的實現(xiàn)[D]. 張慶丹.中國科學(xué)院研究生院(計算技術(shù)研究所) 2006
本文編號:2935707
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
頂點處理器流水線結(jié)構(gòu)
圖6片段處理器和像素流水線川{段處理器調(diào)用紋理單元(textureunit)從存儲器中讀取數(shù)據(jù),并選擇性的在段處理器之前進行過濾操作。紋理單元支持很多類型的源數(shù)據(jù)格式,數(shù)據(jù)可過濾、三線性過濾或各向異性過濾,所有的數(shù)據(jù)以印32或fP16數(shù)據(jù)格式返器。一個紋理可以看作是二維或三維的數(shù)組,紋理單元可以讀取其任意位置段處理器的每條流水線擁有兩個fP32格式的繪制單元(shaderunit),片段在循環(huán)流動之前,被定向到繪制單元和分支處理器執(zhí)行后續(xù)指令。這種重定鐘周期中發(fā)生一次。而且,第一個fP32繪制器(shader)可以在需要時用來行透視修正,或用來進行通用的乘法運算。通常來說,在一個時鐘周期內(nèi)8條或更多操作是可能的,或者在第一個繪制單元發(fā)生紋理讀取則能夠執(zhí)。GPU編程中的流水線結(jié)構(gòu)非圖形操作單元方面由于圖形硬件的可編程性越來越強大與標準的多邊
下-萬光柵掃描操作,一圖7可編程圖形流水線orce6系列體系結(jié)構(gòu)[23]為例所展示的其圖形流水線簡擎,一個可編程片段引擎,一個紋理加載/過濾引擎,(adepth一compare/blendingdatawriteengine)。中,GPU可以被看作是一個具有大量可編程浮點運算實現(xiàn)計算密集型應(yīng)用而完全與計算機圖形無關(guān)。
【參考文獻】:
期刊論文
[1]圖形處理器用于通用計算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J]. 吳恩華. 軟件學(xué)報. 2004(10)
[2]基于圖形處理器(GPU)的通用計算[J]. 吳恩華,柳有權(quán). 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2004(05)
碩士論文
[1]基于GPU的串匹配算法的實現(xiàn)[D]. 張慶丹.中國科學(xué)院研究生院(計算技術(shù)研究所) 2006
本文編號:2935707
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2935707.html
最近更新
教材專著