數(shù)據(jù)值預(yù)測與存儲器預(yù)取技術(shù)研究
發(fā)布時間:2020-04-01 02:43
【摘要】: 現(xiàn)代制造技術(shù)的發(fā)展并未縮小處理器與存儲器之間的速度差距,而高性能處理器中指令并行技術(shù)的使用,使處理器與存儲器之間原來就存在的這種剪刀差有繼續(xù)擴大的趨勢。 無論采用大容量的Cache,還是采用多層次的存儲器體系結(jié)構(gòu),有兩個問題始終難以解決:如果處理器要訪問的數(shù)據(jù)不在Cache中,則無論在容量和存儲器層次結(jié)構(gòu)方面如何調(diào)整,都只能將流水線停頓下來;其次,如果Load指令所需要的數(shù)據(jù)已經(jīng)取入Cache,由于指令間存在數(shù)據(jù)相關(guān)問題,只要產(chǎn)生指令(Producer Instruction)沒有執(zhí)行完畢,在消費指令(Consumer Instruction)所需要的結(jié)果產(chǎn)生之前,流水線都只能停頓。 從目前的研究成果來看,解決上述問題的最佳手段是對數(shù)據(jù)進行預(yù)取。根據(jù)預(yù)取解決問題的對象不同,可以將其歸納為兩類。一類是研究如何在Load指令的有效地址計算產(chǎn)生之前,對指令的執(zhí)行結(jié)果進行預(yù)測并取入流水線,本文定義為數(shù)據(jù)值的預(yù)測技術(shù);另一類是如何在Load指令發(fā)出之前,將所需要的數(shù)據(jù)由Memory取入Cache中,本文定義為Memory預(yù)取技術(shù)。本文針對數(shù)據(jù)值的預(yù)測技術(shù)和存儲器的預(yù)取技術(shù)進行了深入研究,具體包括: 1、利用馬爾可夫模型來解決數(shù)據(jù)值的預(yù)測問題。 本文從指令流的分析入手,給出了數(shù)據(jù)值預(yù)測的數(shù)學(xué)描述,建立了相應(yīng)的馬爾可夫模型。由于狀態(tài)的提取方法不同,計算復(fù)雜度和產(chǎn)生的結(jié)果亦不相同,因此對狀態(tài)的定義是數(shù)據(jù)值預(yù)測數(shù)學(xué)描述中的關(guān)鍵問題之一。根據(jù)數(shù)據(jù)流的特征,將馬爾可夫模型的狀態(tài)定義為滑動窗內(nèi)一組數(shù)據(jù)組成的特征向量,通過狀態(tài)的轉(zhuǎn)移概率進行數(shù)據(jù)值預(yù)測,克服了單純根據(jù)數(shù)據(jù)值出現(xiàn)的概率大小進行預(yù)測的缺陷。 仿真結(jié)果表明,與采用二級值預(yù)測方案以及基于程序語句相關(guān)的預(yù)側(cè)方案相比,在預(yù)測指令的覆蓋率上分別提高了9.51%和2.02%,在預(yù)測精度上分別提高了12.9%和8.2%,而在IPC上,則分別提高了16.7%和7.4%,構(gòu)造的馬爾可夫模型適用于數(shù)據(jù)值的預(yù)側(cè)。 2、基于塊最后訪問指令跟蹤技術(shù),提出了一種混合的Memory預(yù)取方案。本方案融合了連續(xù)的預(yù)取技術(shù)以及Cache中塊的跟蹤技術(shù)。它將數(shù)據(jù)塊
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2006
【分類號】:TP333
本文編號:2609903
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2006
【分類號】:TP333
【相似文獻】
相關(guān)博士學(xué)位論文 前1條
1 謝學(xué)軍;數(shù)據(jù)值預(yù)測與存儲器預(yù)取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2006年
,本文編號:2609903
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2609903.html
最近更新
教材專著