面向塊編程應(yīng)用的多核體系結(jié)構(gòu)關(guān)鍵技術(shù)研究與設(shè)計(jì)
【學(xué)位單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2011
【中圖分類】:TP332
【部分圖文】:
上海交通大學(xué)碩士學(xué)位論文該處理器是由美國(guó)斯坦福大學(xué)在 1997 年設(shè)計(jì)研制的[2]。該處理器在一塊芯片上集成了四個(gè)處理單元,每個(gè)均為 MIPS R10000 處理核。HYDRA 處理器核間采用私有一級(jí) cache,共享二級(jí) cache,使用兩條總線實(shí)現(xiàn)處理器和內(nèi)存的互連,同時(shí)寫信號(hào)在寫總線上廣播,從而實(shí)現(xiàn)讀寫一致性。該處理器在處理具有高度并行性的應(yīng)用程序時(shí)表現(xiàn)出了極好的性能。但是對(duì)于并行性一般的應(yīng)用程序,性能隨之下降。該處理器的具體結(jié)構(gòu)見圖 1-1。
圖 1- 2 CELL 處理器結(jié)構(gòu)圖[3]Fig.1-2 Structure of CELL processor3、RAW 處理器美國(guó)馬薩諸塞大學(xué)正在開發(fā)的 RAW 處理器[4]可以說(shuō)是 Tile 結(jié)構(gòu)的先驅(qū),它克服了布線延遲,充分利用了 Tile 結(jié)構(gòu)豐富的硬件資源和有限的管腳資源。RAW 處理器由 16 個(gè)結(jié)構(gòu)相同的 Tile 單元構(gòu)成,而每個(gè) Tile 單元由近似 MIPS 處理器的單指令發(fā)射內(nèi)部處理計(jì)算流水線和網(wǎng)絡(luò)構(gòu)成。每個(gè) Tile 單元可作為具有獨(dú)立程序計(jì)數(shù)器的處理器工作,當(dāng)指令或數(shù)據(jù)緩存發(fā)生錯(cuò)誤時(shí),則從配置在芯片外的主存獲取數(shù)據(jù)。Tile 單元間的通信必須借助寄存器,所有布線均設(shè)計(jì)成短于 Tile 單元單邊的長(zhǎng)度。因此,即使是根據(jù)應(yīng)用的性能要求或可用晶體管數(shù)的提高,而增加集成的 Tile 單元數(shù)也不會(huì)降低芯片的工作頻率。假使試制芯片經(jīng)過(guò)每個(gè) Tile 單元時(shí)產(chǎn)生 1 個(gè)周期的延遲,則右下 Tile 單元要使用左上 Tile 單元生成的數(shù)據(jù),會(huì)產(chǎn)生6 個(gè)周期的通信延遲。Tile 單元中的運(yùn)算流水線由 8 級(jí)流水線構(gòu)成,每條運(yùn)算流水線都采用單指令發(fā)射的簡(jiǎn)單結(jié)構(gòu)。盡管一個(gè) Tile 單元每個(gè)時(shí)鐘周期只能處理一條指令,但 16 個(gè) Tile 單元可同時(shí)進(jìn)行運(yùn)算,因而每個(gè)芯片一個(gè)時(shí)鐘周期就可完成
圖 1- 3 RAW 處理器結(jié)構(gòu)圖[4]Fig.1-3 Structure of RAW processor1.2.2 多核處理器發(fā)展的關(guān)鍵問(wèn)題多核處理器結(jié)構(gòu)不僅有性能潛力大、集成度高、并行度高、結(jié)構(gòu)簡(jiǎn)單和設(shè)計(jì)驗(yàn)證方便等諸多優(yōu)勢(shì),而且它還能繼承傳統(tǒng)單處理器研究中的某些成果,例如同時(shí)多線程、寬發(fā)射指令、降壓低功耗技術(shù)等。但多核處理器畢竟是一種新的結(jié)構(gòu),在多核結(jié)構(gòu)設(shè)計(jì)和應(yīng)用開發(fā)中出現(xiàn)了以前未曾遇到的新問(wèn)題,這些問(wèn)題給多核處理器的未來(lái)提出了挑戰(zhàn)。目前在多核技術(shù)的發(fā)展過(guò)程中,以下幾個(gè)問(wèn)題值得我們著重考慮。1、內(nèi)核類型的選擇目前多核處理器的內(nèi)核結(jié)構(gòu)主要有同構(gòu)和異構(gòu)兩種。同構(gòu)結(jié)構(gòu)采用對(duì)稱設(shè)計(jì),原理簡(jiǎn)單,硬件上較易實(shí)現(xiàn)。當(dāng)前主流的雙核和四核處理器基本上都采用同構(gòu)結(jié)構(gòu)。但是,通過(guò)增加 CPU 內(nèi)核來(lái)提升處理器的性能,存在一定的極限。達(dá)到極限值之后,性能就無(wú)法再隨著內(nèi)核數(shù)量的增加而提升了。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王海;李秦偉;;H.264視頻編碼的研究[J];電腦知識(shí)與技術(shù);2010年10期
2 李璐;湯躍科;陳杰;;基于Crossbar Switch結(jié)構(gòu)的多層AMBA高速總線的設(shè)計(jì)及其應(yīng)用[J];電子器件;2007年05期
3 鐘升;;基于SIMD PE陣列的DCT數(shù)據(jù)并行實(shí)現(xiàn)方法研究[J];電子學(xué)報(bào);2009年07期
4 張智澄;郭煒;祝永新;;一種改進(jìn)的后處理去塊濾波算法及其硬件實(shí)現(xiàn)[J];信息技術(shù);2008年02期
5 張駿;樊曉椏;劉松鶴;;多核、多線程處理器的低功耗設(shè)計(jì)技術(shù)研究[J];計(jì)算機(jī)科學(xué);2007年10期
6 郝松;都志輝;王曼;劉志強(qiáng);;多核處理器降低功耗技術(shù)綜述[J];計(jì)算機(jī)科學(xué);2007年11期
7 孫利榮,蔣澤軍,王麗芳;片上網(wǎng)絡(luò)[J];計(jì)算機(jī)工程;2005年20期
8 史莉雯;樊曉椏;張盛兵;;單片多處理器的研究[J];計(jì)算機(jī)應(yīng)用研究;2007年09期
9 林川;張曉瀟;陳杰;韓亮;周朝顯;李海軍;;超長(zhǎng)指令字DSP處理器的共享寄存器堆設(shè)計(jì)[J];科學(xué)技術(shù)與工程;2006年13期
10 鄧崇亮;覃煥昌;;SoC片上五種總線標(biāo)準(zhǔn)的分析比較[J];百色學(xué)院學(xué)報(bào);2008年03期
本文編號(hào):2856844
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2856844.html