可重構(gòu)眾核流處理器體系結(jié)構(gòu)關(guān)鍵技術(shù)研究
發(fā)布時間:2019-02-20 07:40
【摘要】:半導(dǎo)體工藝發(fā)展進入深亞微米工藝時代后,傳統(tǒng)的多核處理器設(shè)計面臨著功耗、線延遲和可擴展性等諸多問題,制約了傳統(tǒng)多核結(jié)構(gòu)處理器性能的提升。另一方面,應(yīng)用程序運行時對資源的需求呈現(xiàn)差異性和階段性的特征,固定粒度的處理器設(shè)計難以保證在程序運行全過程中資源分配的效率,勢必造成資源需求與實際資源分配的不匹配問題。因此,設(shè)計一種既符合半導(dǎo)體工藝發(fā)展趨勢,又能夠滿足應(yīng)用程序資源需求階段性特征的新型處理器結(jié)構(gòu)顯得迫在眉睫。 本文從編程模型、重構(gòu)模式、指令執(zhí)行模型、指令集以及硬件微結(jié)構(gòu)等方面較為系統(tǒng)地研究了可重構(gòu)眾核結(jié)構(gòu)的相關(guān)技術(shù)問題,提出并驗證了一種基于類數(shù)據(jù)流驅(qū)動模型的可重構(gòu)眾核流處理器結(jié)構(gòu)。研究工作對目前商用流處理器的結(jié)構(gòu)及編程模型進行分析,提煉出可重構(gòu)眾核流處理器的關(guān)鍵技術(shù)問題與趨勢;在軟件層面提出了支持可重構(gòu)眾核流處理器的流程序執(zhí)行模型,包括流編程模型、重構(gòu)模式、映射方案以及指令執(zhí)行模型;在硬件層面提出了分片式的可重構(gòu)眾核流處理器TPA-S,并設(shè)計了與之配套的片上二級緩存結(jié)構(gòu)。本文的主要研究內(nèi)容與所取得研究成果可歸納為以下四個方面: 1.研究了計算密集型應(yīng)用及流處理模型的特征,提出了適合可重構(gòu)眾核流處理器的流程序執(zhí)行模型。程序執(zhí)行模型采用CUDA作為流編程模型,提出并分析了深度優(yōu)先映射和廣度優(yōu)先映射兩種程序映射方案,提出了基于同構(gòu)物理核的邏輯處理器重構(gòu)模式,設(shè)計了基于超塊結(jié)構(gòu)的類數(shù)據(jù)流驅(qū)動的指令執(zhí)行模型和相應(yīng)指令集DISC-S. 2.研究了類數(shù)據(jù)流驅(qū)動執(zhí)行的硬件架構(gòu),提出了支持DISC-S指令集的可重構(gòu)眾核流處理器TPA-S設(shè)計,實現(xiàn)了邏輯處理器的運行時可重構(gòu)機制。TPA-S處理器采用了類數(shù)據(jù)流驅(qū)動的執(zhí)行模型,片上集成了多個擁有獨立計算和存儲部件的細粒度同構(gòu)物理核,物理核間采用基于路由節(jié)點的二維Mesh結(jié)構(gòu)互連,以數(shù)據(jù)報文的形式實現(xiàn)不同物理核之間的數(shù)據(jù)傳輸,并以物理核為基礎(chǔ)構(gòu)造運算能力更強的粗粒度邏輯處理器。 3.研究了不同硬件配置參數(shù)對TPA-S處理器性能的影響,對TPA-S處理器的設(shè)計空間進行探索,分析了影響程序在TPA-S處理器上執(zhí)行性能的關(guān)鍵因素。本文選取了10個真實應(yīng)用作為Benchmark,考察了TPA-S處理器的執(zhí)行性能,并對物理核中計算部件和存儲部件的配置以及物理核間的片上互連的帶寬與延遲等參數(shù)對程序執(zhí)行性能的影響進行了評估。 4.研究并提出了TPA-S處理器上基于UCA架構(gòu)和Mesh-SNUCA架構(gòu)的片上 二級緩存系統(tǒng)設(shè)計,評估了兩種不同架構(gòu)片上二級緩存的性能表現(xiàn),探討了基于Mesh-SNUCA架構(gòu)的片上二級緩存重構(gòu)機制。本文在TPA-S模擬器上利用真實應(yīng)用對UCA架構(gòu)和基Mesh-SNUCA架構(gòu)的片上二級緩存系統(tǒng)進行性能評估,還探討了Mesh-SNUCA架構(gòu)上片上二級緩存結(jié)構(gòu)的運行時重配置機制,通過在運行時動態(tài)修改片上二級緩存與物理核通信接口內(nèi)部的地址映射表,可實現(xiàn)對片上二級緩存結(jié)構(gòu)的重配置。 本文的研究工作還獲得了以下重要認識:(1)不同種類的應(yīng)用程序?qū)Y源的需求差異明顯,且同一個程序在執(zhí)行的不同階段對資源需求存在階段性,利用可重構(gòu)技術(shù)可適應(yīng)這種差異性和階段性;(2)流處理器可采用類數(shù)據(jù)流驅(qū)動的執(zhí)行模型,通過超塊級的數(shù)據(jù)流驅(qū)動來挖掘指令級并行性;(3)片上互連網(wǎng)絡(luò)的性能是影響采用分片式設(shè)計的可重構(gòu)眾核結(jié)構(gòu)性能的關(guān)鍵因素; 本文提出了一種類數(shù)據(jù)流驅(qū)動的可重構(gòu)眾核流處理器TPA-S,并對其硬件結(jié)構(gòu)、執(zhí)行模型、編程環(huán)境及重構(gòu)機制等方面的關(guān)鍵技術(shù)進行了研究,研究成果可供設(shè)計采用眾核結(jié)構(gòu)的高性能流處理器參考。
[Abstract]:......
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2012
【分類號】:TP332
本文編號:2426956
[Abstract]:......
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2012
【分類號】:TP332
【引證文獻】
相關(guān)期刊論文 前1條
1 王可鋒;吳曉;羅眉;;眾核多計算模式系統(tǒng)的構(gòu)建[J];現(xiàn)代電子技術(shù);2013年22期
相關(guān)博士學(xué)位論文 前1條
1 孫濤;面向動態(tài)異構(gòu)眾核處理器的任務(wù)調(diào)度研究[D];中國科學(xué)技術(shù)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前2條
1 孫敏敏;Backprojection成像多核并行計算系統(tǒng)設(shè)計[D];南京大學(xué);2013年
2 袁夢羽;深空目標(biāo)紅外光學(xué)特性仿真方法研究[D];南京理工大學(xué);2014年
,本文編號:2426956
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2426956.html
最近更新
教材專著