對稱多核處理器中Cache一致性的研究與實現(xiàn)
發(fā)布時間:2020-05-15 16:48
【摘要】: 多內(nèi)核的處理器已經(jīng)是當(dāng)今時代趨勢的必然產(chǎn)物,多內(nèi)核微處理器的研究開發(fā)已經(jīng)成為世界范圍內(nèi)的熱點之一。本文簡要介紹了多核處理器的幾種主要體系結(jié)構(gòu)和指令集結(jié)構(gòu)。詳細(xì)論述了Leon3處理器的結(jié)構(gòu)和以其為核心的對稱多處理器結(jié)構(gòu)和SPARC指令集。在此基礎(chǔ)上引出了數(shù)據(jù)一致性問題,數(shù)據(jù)高速緩存的一致性(cache coherence)是解決多內(nèi)核之間通信的一個重要課題。同時,為了支持多任務(wù)和多用戶的Linux-smp操作系統(tǒng),就必須使用虛擬存儲技術(shù),虛擬存儲器也就成為本文研究的重要內(nèi)容之一。 本文以Leon3微處理器為內(nèi)核,深入研究了該內(nèi)核的結(jié)構(gòu)和指令系統(tǒng),就虛擬存儲器的使用和數(shù)據(jù)高速緩存的一致性問題進行了詳細(xì)分析與研究,研究現(xiàn)有的解決數(shù)據(jù)高速緩存一致性的兩種協(xié)議,分析了兩種具體實現(xiàn)方案的優(yōu)缺點。在此基礎(chǔ)上提出了在數(shù)據(jù)塊對應(yīng)的高速緩存中存儲兩個標(biāo)識(tag)的方法來解決以Leon3為內(nèi)核的對稱多處理器中的數(shù)據(jù)Cache一致性問題,其中一個是虛擬tag,用于高速緩存正常的讀、寫操作;另一個是物理tag,用于對總線的監(jiān)聽,保證數(shù)據(jù)的一致性。 論文最后講述了設(shè)計驗證的流程和使用的工具,給出了設(shè)計的驗證和性能測試結(jié)果。經(jīng)過仿真和把設(shè)計下載到FPGA開發(fā)板上并運行Linux-smp操作系統(tǒng),結(jié)果證明本設(shè)計能夠解決數(shù)據(jù)cache的一致性問題。使用標(biāo)準(zhǔn)小型測試程序dhrystone2.1進行性能測試,結(jié)果表明,相對單處理器,雙核處理器有近80%的提高,,四核處理器有近160%的提高。在沒有優(yōu)化的條件下,使用DC綜合出的頻率可達300MHz。該方法實現(xiàn)的Cache讀寫速度快,硬件代價小,結(jié)構(gòu)相對簡單,具有很好的實用價值。
【圖文】:
首款基于Cell的服務(wù)器,即 BladeCenterQSZO。今年3月65納米工藝的新的 CellBroadband在IBM位于紐約EastFishkill的工廠投入量產(chǎn)。圖1一 1Cen處理器的版圖結(jié)構(gòu)在對稱多核和非對稱多核之外,另一種微處理器結(jié)構(gòu)同樣很值得關(guān)注,這就是隊RROT架構(gòu)。此架構(gòu)的提出標(biāo)志著Intel以后的研究方向發(fā)生轉(zhuǎn)變。隊RROT出自Intel在以色列海爾法的CPU實驗室。早在2003年,該實驗室的工程師們公開發(fā)表了一篇名為“ powerAwarnessthroughSeleetiveDynamically OPtimizedTraces”(借助選擇性動態(tài)優(yōu)化線路實現(xiàn)功耗最優(yōu)化)的技術(shù)論文。該文中,研究者第一次提出“power一 AwareaRehiteetureRunningoptimizedTraee”一詞,隊RROT架構(gòu)由此得名。研究人員發(fā)現(xiàn)20%的程序代碼會占去80%的CPU動態(tài)執(zhí)行資源,這類操作被稱為 Hotexecutton(熱操作),其余的操作稱為“冷操作”。分析“熱操作”代碼的特點,讓“冷操作”和“熱操作”分別運行在不同的電路上
前窗口的輸入寄存器(ins)就是上一個窗口的輸出寄存器(。uts)。寄存器窗口數(shù)可以從8到32之間配置,這樣總寄存器數(shù)最多可達(8+16*32)520個。8個寄存器窗口的結(jié)構(gòu)如圖2一3所示。當(dāng)執(zhí)行SAVE指令時,就把當(dāng)前的窗口指針減1,則當(dāng)前窗口中的輸出寄存器(outs)就變成下一個窗口的輸入寄存器(ins)。當(dāng)執(zhí)行RESTORE指令時則與此相反。這樣當(dāng)發(fā)生跳轉(zhuǎn)或調(diào)用時,輸入輸出的數(shù)據(jù)能夠迅速的交換,提高了寄存器的利用率和數(shù)據(jù)傳輸速度。局部寄存器是用來存儲一些局部變量和常數(shù),只有當(dāng)前函數(shù)可見。而輸入輸出寄存器是調(diào)用函數(shù)和被調(diào)用函數(shù)頻繁使用的。當(dāng)寄存器窗口指針指向一個被屏蔽的或無效的寄存器窗口時,就會產(chǎn)生自陷。這時進入自陷處理程序。典型的處理方式是把此窗口內(nèi)的數(shù)據(jù)寫入一個堆棧中,然后再使用此窗口中的寄存器。圖2一3寄存器窗口2.2.2控制/狀態(tài)寄存器IU的控制/狀態(tài)寄存器都是32位讀/寫寄存器。它們包括:程序計數(shù)器PC (ProgramCounters)和npC
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:TP332
本文編號:2665343
【圖文】:
首款基于Cell的服務(wù)器,即 BladeCenterQSZO。今年3月65納米工藝的新的 CellBroadband在IBM位于紐約EastFishkill的工廠投入量產(chǎn)。圖1一 1Cen處理器的版圖結(jié)構(gòu)在對稱多核和非對稱多核之外,另一種微處理器結(jié)構(gòu)同樣很值得關(guān)注,這就是隊RROT架構(gòu)。此架構(gòu)的提出標(biāo)志著Intel以后的研究方向發(fā)生轉(zhuǎn)變。隊RROT出自Intel在以色列海爾法的CPU實驗室。早在2003年,該實驗室的工程師們公開發(fā)表了一篇名為“ powerAwarnessthroughSeleetiveDynamically OPtimizedTraces”(借助選擇性動態(tài)優(yōu)化線路實現(xiàn)功耗最優(yōu)化)的技術(shù)論文。該文中,研究者第一次提出“power一 AwareaRehiteetureRunningoptimizedTraee”一詞,隊RROT架構(gòu)由此得名。研究人員發(fā)現(xiàn)20%的程序代碼會占去80%的CPU動態(tài)執(zhí)行資源,這類操作被稱為 Hotexecutton(熱操作),其余的操作稱為“冷操作”。分析“熱操作”代碼的特點,讓“冷操作”和“熱操作”分別運行在不同的電路上
前窗口的輸入寄存器(ins)就是上一個窗口的輸出寄存器(。uts)。寄存器窗口數(shù)可以從8到32之間配置,這樣總寄存器數(shù)最多可達(8+16*32)520個。8個寄存器窗口的結(jié)構(gòu)如圖2一3所示。當(dāng)執(zhí)行SAVE指令時,就把當(dāng)前的窗口指針減1,則當(dāng)前窗口中的輸出寄存器(outs)就變成下一個窗口的輸入寄存器(ins)。當(dāng)執(zhí)行RESTORE指令時則與此相反。這樣當(dāng)發(fā)生跳轉(zhuǎn)或調(diào)用時,輸入輸出的數(shù)據(jù)能夠迅速的交換,提高了寄存器的利用率和數(shù)據(jù)傳輸速度。局部寄存器是用來存儲一些局部變量和常數(shù),只有當(dāng)前函數(shù)可見。而輸入輸出寄存器是調(diào)用函數(shù)和被調(diào)用函數(shù)頻繁使用的。當(dāng)寄存器窗口指針指向一個被屏蔽的或無效的寄存器窗口時,就會產(chǎn)生自陷。這時進入自陷處理程序。典型的處理方式是把此窗口內(nèi)的數(shù)據(jù)寫入一個堆棧中,然后再使用此窗口中的寄存器。圖2一3寄存器窗口2.2.2控制/狀態(tài)寄存器IU的控制/狀態(tài)寄存器都是32位讀/寫寄存器。它們包括:程序計數(shù)器PC (ProgramCounters)和npC
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:TP332
【參考文獻】
相關(guān)期刊論文 前2條
1 孫昱東,孫強南;并行處理系統(tǒng)的一致性機制研究[J];計算機工程與應(yīng)用;1997年06期
2 薛燕,樊曉椏,李瑛;多處理機系統(tǒng)中數(shù)據(jù)Cache的一種優(yōu)化設(shè)計[J];微電子學(xué)與計算機;2004年12期
本文編號:2665343
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2665343.html
最近更新
教材專著