GPGPU多核流體系結(jié)構(gòu)與功耗模擬研究
發(fā)布時間:2021-08-23 13:27
隨著微處理器技術(shù)的不斷進步,單芯片多核處理器已成為微處理器發(fā)展的主流。其中,多核流處理器不但展現(xiàn)出巨大的計算性能潛力,而且在面積利用率、平均功耗和可編程靈活性上也有著顯著的優(yōu)勢。GPGPU作為簡單多核流處理器的典型代表,對數(shù)據(jù)密集型和高度并行性的計算進行加速能夠獲得顯著的效果,在科學(xué)計算和工程領(lǐng)域有著廣泛的應(yīng)用。通過研究GPGPU的體系結(jié)構(gòu),可以探索體系結(jié)構(gòu)的未來發(fā)展方向,為自主研制高性能的通用流處理器提供可借鑒的思路。模擬器是研究處理器體系結(jié)構(gòu)的一種有效手段。GPGPU的簡單多核流體系結(jié)構(gòu)作為一種新型的體系結(jié)構(gòu),既有多核處理器結(jié)構(gòu)特征,又有流體系結(jié)構(gòu)特征,與傳統(tǒng)的微處理器體系結(jié)構(gòu)有著很大的不同,需要研究新的模擬技術(shù)和方法。為此,本文對目前在學(xué)術(shù)界廣泛使用的NVIDIA公司的GPGPU進行了相關(guān)研究。本文通過研究GPGPU的發(fā)展和及其體系結(jié)構(gòu)的典型特點,并結(jié)合GPGPU的編程模型CUDA和多線程流執(zhí)行模式,詳細探討了GPGPU多核流體系結(jié)構(gòu)模擬器的主要思想。本文充分利用了現(xiàn)有模擬器GPGPU-Sim的實現(xiàn)技術(shù)和方法,通過軟件擴展和功能完善,結(jié)合功耗模擬器Wattch的應(yīng)用接口和算法,建...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)的GPU計算模型
圖 2.1 傳統(tǒng)的 GPU 計算模型2006 年,NVIDIA 推出的 GeForce 8800 圖形處理器是第一款基于 G80 GPU。G80 體系結(jié)構(gòu)使用統(tǒng)一著色單元取代了分離的頂點和像素處理了共享存儲器,而其編程方式 CUDA(Compute Unified Device Archite為友好,如圖 2.2,程序員可以利用 C 語言直接在 GPU 上進行程序設(shè)需要依賴 Direct 3D 或 OpenGL 等語言,極大地簡化了利用 GPU 進行難度。2008 年,NVIDIA 推出了基于 GT200 結(jié)構(gòu)的 GPU。GT200 體系體系結(jié)構(gòu)的基礎(chǔ)上進行了相應(yīng)改進,主要表現(xiàn)為加入了對共享存儲器和雙精度浮點運算的支持,并放寬了對存儲器的對齊訪問。
圖 2.3 G80 體系結(jié)構(gòu)SPA 在組成上又可以分為兩層:第一層由若干個 TPC 組成(Thread ProcessingCluster,線程處理器簇),第二層由多個 SM(Stream Multiprocessor,流多處理器)和一條共用的紋理流水線組成,紋理流水線為 TPC 內(nèi)的所有 SM 提供計算所需要的數(shù)據(jù)。
【參考文獻】:
期刊論文
[1]納米級工藝下多處理器功耗評估與優(yōu)化技術(shù)[J]. 張戈,張量,楊榮秋. 中國集成電路. 2008(07)
[2]多核、多線程處理器的低功耗設(shè)計技術(shù)研究[J]. 張駿,樊曉椏,劉松鶴. 計算機科學(xué). 2007(10)
[3]低功耗數(shù)字系統(tǒng)設(shè)計方法[J]. 梁宇,韓奇,魏同立,鄭茳. 東南大學(xué)學(xué)報(自然科學(xué)版). 2000(05)
碩士論文
[1]模式識別并行算法與GPU高速實現(xiàn)研究[D]. 張舒.電子科技大學(xué) 2009
本文編號:3357955
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)的GPU計算模型
圖 2.1 傳統(tǒng)的 GPU 計算模型2006 年,NVIDIA 推出的 GeForce 8800 圖形處理器是第一款基于 G80 GPU。G80 體系結(jié)構(gòu)使用統(tǒng)一著色單元取代了分離的頂點和像素處理了共享存儲器,而其編程方式 CUDA(Compute Unified Device Archite為友好,如圖 2.2,程序員可以利用 C 語言直接在 GPU 上進行程序設(shè)需要依賴 Direct 3D 或 OpenGL 等語言,極大地簡化了利用 GPU 進行難度。2008 年,NVIDIA 推出了基于 GT200 結(jié)構(gòu)的 GPU。GT200 體系體系結(jié)構(gòu)的基礎(chǔ)上進行了相應(yīng)改進,主要表現(xiàn)為加入了對共享存儲器和雙精度浮點運算的支持,并放寬了對存儲器的對齊訪問。
圖 2.3 G80 體系結(jié)構(gòu)SPA 在組成上又可以分為兩層:第一層由若干個 TPC 組成(Thread ProcessingCluster,線程處理器簇),第二層由多個 SM(Stream Multiprocessor,流多處理器)和一條共用的紋理流水線組成,紋理流水線為 TPC 內(nèi)的所有 SM 提供計算所需要的數(shù)據(jù)。
【參考文獻】:
期刊論文
[1]納米級工藝下多處理器功耗評估與優(yōu)化技術(shù)[J]. 張戈,張量,楊榮秋. 中國集成電路. 2008(07)
[2]多核、多線程處理器的低功耗設(shè)計技術(shù)研究[J]. 張駿,樊曉椏,劉松鶴. 計算機科學(xué). 2007(10)
[3]低功耗數(shù)字系統(tǒng)設(shè)計方法[J]. 梁宇,韓奇,魏同立,鄭茳. 東南大學(xué)學(xué)報(自然科學(xué)版). 2000(05)
碩士論文
[1]模式識別并行算法與GPU高速實現(xiàn)研究[D]. 張舒.電子科技大學(xué) 2009
本文編號:3357955
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3357955.html
最近更新
教材專著