基于FPGA的片上多處理器建模方法
發(fā)布時(shí)間:2018-05-01 22:01
本文選題:多核處理器體系結(jié)構(gòu) + 處理器建模。 參考:《中國科學(xué)技術(shù)大學(xué)》2012年博士論文
【摘要】:片上多處理器的發(fā)展給計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)研究帶來新的發(fā)展空間和挑戰(zhàn)。一方面片上多處理器的發(fā)展使微處理器性能的提升由挖掘指令級(jí)并行性轉(zhuǎn)變?yōu)殚_發(fā)線程級(jí)和數(shù)據(jù)級(jí)并行性。為了開發(fā)片上多處理器的這種并行性,我們必須拋棄傳統(tǒng)單核處理器系統(tǒng)的架構(gòu),重新設(shè)計(jì)處理器系統(tǒng)的軟硬件結(jié)構(gòu),包括硬件微結(jié)構(gòu)、編程模型、編譯器、運(yùn)行時(shí)系統(tǒng)等等。而另一方面,傳統(tǒng)上用于單核處理器結(jié)構(gòu)研究的軟件模擬器已經(jīng)明顯不能滿足片上多處理器系統(tǒng)下這種軟硬件研究的需要。處理器核數(shù)的膨脹使軟件模擬器的性能成比例降低,無法進(jìn)行周期精確的硬件結(jié)構(gòu)模擬,更無法進(jìn)行全系統(tǒng)模擬和系統(tǒng)軟件的研究。由于以上原因,多核處理器體系結(jié)構(gòu)的研究缺乏大量的實(shí)驗(yàn)評(píng)測和全面、有效的指導(dǎo),而軟件模擬器成為了多核時(shí)代處理器體系結(jié)構(gòu)研究的瓶頸。因此,新的處理器模擬工具是有效開展片上多處理器結(jié)構(gòu)研究的關(guān)鍵。FPGA天生的并行性使它在模擬片上多處理器時(shí)具有較高的模擬性能和高度的可擴(kuò)放性,成為研究多核處理器體系結(jié)構(gòu)理想的模擬平臺(tái)。 本文研究了基于FPGA的片上多處理器建模方法。主要研究內(nèi)容和成果包括:(1)研究了處理器的功能模型、性能模型以及原型,提出了一種功能與時(shí)序分離的處理器性能模型架構(gòu)。其中功能部分只完成處理器的動(dòng)作,不考慮硬件結(jié)構(gòu)和動(dòng)作的時(shí)序。時(shí)序部分則模擬處理器微結(jié)構(gòu),控制處理器動(dòng)作發(fā)生的時(shí)序,并驅(qū)動(dòng)功能部分模擬處理器的動(dòng)作。由于功能部分與處理器的微結(jié)構(gòu)無關(guān),所以相同的功能部分可以重用于各種時(shí)序部分,并且可以兼容各種模擬方式,包括使用軟件的模擬或者跨平臺(tái)的模擬。這種架構(gòu)使已有工作有效的被重用,減少了建模工作量。(2)研究了模擬器模塊間的同步方式,針對(duì)FPGA模擬的特點(diǎn)提出基于管道的性能模擬技術(shù)。這種技術(shù)允許不同的處理器模塊在同一時(shí)刻模擬不同的目標(biāo)時(shí)鐘周期,使運(yùn)行速度較快的模塊不必等待運(yùn)行速度較慢的模塊,顯著提升了系統(tǒng)的模擬性能。模擬器各個(gè)模塊之間的性能差距越大,管道模擬能發(fā)揮的作用也越大。(3)提出了使用軟硬件協(xié)同模擬調(diào)節(jié)FPGA資源使用量和簡化建模的方法。片上多處理器的模擬需要大量的FPGA資源,我們使用軟件實(shí)現(xiàn)的存儲(chǔ)緩存機(jī)制可以將數(shù)據(jù)緩存到宿主機(jī)器上,有效調(diào)節(jié)FPGA資源;贔PGA的模擬不適合實(shí)現(xiàn)某些復(fù)雜的結(jié)構(gòu),可以使用軟件實(shí)現(xiàn)這些結(jié)構(gòu)的功能,簡化FPGA建模過程。同時(shí),FPGA模擬調(diào)試復(fù)雜且編譯時(shí)間過長,我們通過使用軟件實(shí)現(xiàn)模塊并進(jìn)行調(diào)試,有效減小建模難度,縮短編譯時(shí)間。(4)研究了多核模擬的分時(shí)復(fù)用方法,提出了細(xì)粒度的分時(shí)復(fù)用技術(shù)。該技術(shù)將每個(gè)模塊分為邏輯與狀態(tài)兩部分,將狀態(tài)根據(jù)模擬核數(shù)復(fù)制多份,并將邏輯部分重用。細(xì)粒度的分時(shí)復(fù)用技術(shù)以模擬器各個(gè)模塊內(nèi)的規(guī)則為復(fù)用單位,使在任意時(shí)刻一個(gè)模塊內(nèi)可以同時(shí)進(jìn)行多個(gè)處理器核的模擬,提高了系統(tǒng)資源的利用率。(5)分析了基于FPGA的模擬器性能瓶頸,提出了若干模擬性能的優(yōu)化技術(shù)。包括在功能部分與時(shí)序部分之間統(tǒng)計(jì)功能部分延遲的機(jī)制,以及在時(shí)序部分各模塊之間統(tǒng)計(jì)延遲的機(jī)制。(6)基于以上研究工作實(shí)現(xiàn)了RAMP-Pink模擬平臺(tái)。RAMP-Pink平臺(tái)是對(duì)事務(wù)存儲(chǔ)和推測多線程提供統(tǒng)一支持的多核處理器模擬平臺(tái),采用了Alpha指令集;實(shí)現(xiàn)了RAMP-Pink平臺(tái)上創(chuàng)建多線程的機(jī)制,取代PThreads庫,該機(jī)制也可用于其他無操作系統(tǒng)支持的多核模擬平臺(tái);設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于目錄的MESI Cache一致性協(xié)議。 在研究基于FPGA的處理器建模和設(shè)計(jì)實(shí)現(xiàn)RAMP-Pink系統(tǒng)的過程中我們得到一些如何進(jìn)行多核處理器硬件建模的認(rèn)識(shí)。首先,軟件模擬片上多處理器的關(guān)鍵問題是軟件的串行性無法適應(yīng)不斷膨脹的處理器核數(shù),為此采用具有高度可擴(kuò)放性的FPGA模擬平臺(tái)可以應(yīng)對(duì)核數(shù)膨脹問題并帶來硬件級(jí)別的模擬性能。其次,FPGA建模的復(fù)雜度和建模周期都遠(yuǎn)遠(yuǎn)超過軟件建模,采用功能與時(shí)序分離的模擬架構(gòu)和軟硬件協(xié)同的模擬技術(shù)可以有效減少建模工作量,縮短建模周期。最后,實(shí)現(xiàn)多核模擬需要較多的FPGA資源,通過細(xì)粒度的分時(shí)復(fù)用以及軟硬件協(xié)同模擬技術(shù)可以調(diào)節(jié)FPGA資源的使用量。 本文的研究工作和結(jié)果可用于指導(dǎo)基于FPGA的多核處理器建模和進(jìn)一步的優(yōu)化。
[Abstract]:On the one hand , the development of multi - processor architecture brings new development space and challenge to computer system structure research . On the one hand , the development of multi - processor on the one hand makes microprocessor performance improve from the parallelism of mining instruction to the development of thread - level and data - level parallelism .
This paper studies the method of multi - processor modeling based on FPGA . The main research contents and achievements include : ( 1 ) the function model , performance model and prototype of the processor are studied .
The multi - threading mechanism is created on the platform of the platform , which replaces the PThreads library , and the mechanism can be used for other multi - core simulation platforms without operating system support ;
A directory - based MESI Cache coherency protocol is designed and implemented .
In this paper , we get some idea of how to model the hardware of multi - core processor in the process of processor modeling and design based on FPGA . First of all , the key problem of multi - processor on software simulation chip is that the serial nature of software can ' t adapt to the increasing number of processors . Secondly , the complexity and modeling period of FPGA modeling can reduce the modeling workload and shorten the modeling period . Finally , the realization of multi - core simulation requires more FPGA resources , and the use of FPGA resources can be adjusted through the time - division multiplexing of fine granularity and the software and hardware cooperative simulation technology .
The research work and results of this paper can be used to guide multi - core processor modeling and further optimization based on FPGA .
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP332;TN791
【引證文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前2條
1 馮亞楠;基于SOPC的嵌入式系統(tǒng)架構(gòu)及應(yīng)用驗(yàn)證[D];內(nèi)蒙古大學(xué);2014年
2 許釗;動(dòng)態(tài)自適應(yīng)片上網(wǎng)絡(luò)的設(shè)計(jì)與評(píng)估[D];西安電子科技大學(xué);2014年
,本文編號(hào):1831200
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1831200.html
最近更新
教材專著