天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向循環(huán)級(jí)數(shù)組訪問(wèn)的數(shù)據(jù)預(yù)取技術(shù)研究

發(fā)布時(shí)間:2020-06-23 06:19
【摘要】: 微處理器和DRAM之間日趨增大的性能差距促使人們探索新的技術(shù)以減少或者隱藏訪存延遲。Cache層次存儲(chǔ)結(jié)構(gòu)能夠有效減少大部分運(yùn)用程序的訪存延遲,但是在科學(xué)計(jì)算程序中,訪存延遲在程序執(zhí)行時(shí)間中占很大比重,Cache的利用率低。這類(lèi)程序中存在大量的線性訪問(wèn)的數(shù)組,數(shù)組規(guī)模越大,強(qiáng)制失效和容量失效的次數(shù)也就越多。數(shù)據(jù)預(yù)取技術(shù)是解決這類(lèi)訪存失效的有效方法,它預(yù)測(cè)可能的失效情況,提前發(fā)出數(shù)據(jù)訪問(wèn)操作,將訪存與計(jì)算重疊起來(lái),有效地隱藏了訪存延遲。 本文對(duì)科學(xué)計(jì)算程序中循環(huán)級(jí)數(shù)組訪問(wèn)的數(shù)據(jù)預(yù)取技術(shù)進(jìn)行了深入研究和探討。文章詳細(xì)分析了各種預(yù)取方案的優(yōu)劣,討論了研究對(duì)象的特點(diǎn)和各種影響因素,提出了一種軟硬件結(jié)合的數(shù)據(jù)預(yù)取方法。以此方法為指導(dǎo),本文首先對(duì)預(yù)取調(diào)度問(wèn)題進(jìn)行了重點(diǎn)研究,提出了一種新的預(yù)取度算法,改進(jìn)了預(yù)取距離計(jì)算公式,并在Suif2平臺(tái)上實(shí)現(xiàn)了預(yù)取分析算法。其次,本文還設(shè)計(jì)了一個(gè)自適應(yīng)型的順序預(yù)取硬件單元,并移植了Simplescalar模擬器,模擬驗(yàn)證了該硬件單元的功能行為。 實(shí)驗(yàn)評(píng)測(cè)結(jié)果表明,本文的數(shù)據(jù)預(yù)取方法可以有效地減少循環(huán)級(jí)數(shù)組訪問(wèn)的訪存延遲,降低程序的執(zhí)行時(shí)間,提高系統(tǒng)性能。
【學(xué)位授予單位】:國(guó)防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2008
【分類(lèi)號(hào)】:TP332
【圖文】:

框圖,預(yù)取,程序片,非理想


lllIII圖2.1程序片段執(zhí)行框圖(a)沒(méi)有預(yù)取(b)理想預(yù)取(c)非理想預(yù)取圖2.1(a)和圖2.1(b)的對(duì)比,直觀的顯示了預(yù)取可以減少執(zhí)行時(shí)間。這里,計(jì)算和訪存的并行隱藏了訪存延遲,提高了程序執(zhí)行效率。圖中顯示的是一種理想情況,即預(yù)取的數(shù)據(jù)恰好及時(shí)響應(yīng)微處理器的訪問(wèn)請(qǐng)求。圖2.l(c)顯示的是一種不太樂(lè)觀的情景,rl,r2的預(yù)取操作發(fā)出的太晚,以至于不能完全避免處理器的空轉(zhuǎn)。而:3又預(yù)取的過(guò)早,雖然隱藏了訪存時(shí)延,但在被使用之前,它將保存在Cache中一段時(shí)間

柱狀圖,失效率,柱狀圖,預(yù)取


EEEPPPNPB3.2220.2379990.8792220.0148881.0854440.0085550.724666為了便于對(duì)比,我們將上面的統(tǒng)計(jì)結(jié)果轉(zhuǎn)化成柱狀圖的形式,圖5.7是8個(gè)測(cè)試程取Pass前后LlCache失效率的對(duì)比圖,圖5.8是8個(gè)測(cè)試程序預(yù)取pass前后IPC的圖。

【共引文獻(xiàn)】

相關(guān)期刊論文 前8條

1 王正華;陸平靜;車(chē)永剛;;迭代編譯優(yōu)化技術(shù)綜述[J];計(jì)算機(jī)工程與應(yīng)用;2008年32期

2 陸平靜;車(chē)永剛;束堯;王正華;;多面體表示技術(shù)及在程序性能優(yōu)化中的應(yīng)用[J];計(jì)算機(jī)工程與科學(xué);2008年09期

3 侯永生;趙榮彩;高偉;高偉;;非正規(guī)化循環(huán)的單指令多數(shù)據(jù)向量化[J];計(jì)算機(jī)應(yīng)用;2013年11期

4 趙捷;趙榮彩;韓林;李寶亮;;面向MPI代碼生成的Open64編譯器后端[J];計(jì)算機(jī)學(xué)報(bào);2014年07期

5 劉松;伍衛(wèi)國(guó);趙博;蔣慶;;面向局部性和并行優(yōu)化的循環(huán)分塊技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2015年05期

6 趙捷;趙榮彩;丁銳;黃品豐;;基于嵌套循環(huán)分類(lèi)的并行識(shí)別技術(shù)[J];軟件學(xué)報(bào);2012年10期

7 侯永生;趙榮彩;高偉;李璇;;面向多面體模型的非規(guī)則程序SIMD投機(jī)優(yōu)化技術(shù)[J];信息工程大學(xué)學(xué)報(bào);2014年03期

8 鄒燕燕;安虹;崔慧敏;周軍蕊;;矩陣形狀無(wú)關(guān)的并行編譯優(yōu)化[J];小型微型計(jì)算機(jī)系統(tǒng);2014年07期

相關(guān)博士學(xué)位論文 前4條

1 嚴(yán)明;面向領(lǐng)域應(yīng)用的異構(gòu)多核SoC系統(tǒng)結(jié)構(gòu)設(shè)計(jì)與優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

2 陸平靜;低開(kāi)銷(xiāo)的迭代編譯優(yōu)化關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

3 姚遠(yuǎn);SIMD自動(dòng)向量識(shí)別及代碼調(diào)優(yōu)技術(shù)研究[D];解放軍信息工程大學(xué);2012年

4 王慶;面向嵌入式多核系統(tǒng)的并行程序優(yōu)化技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前5條

1 張媛媛;自動(dòng)向量化中的收益評(píng)估技術(shù)研究[D];解放軍信息工程大學(xué);2011年

2 趙捷;面向分布存儲(chǔ)的并行編譯優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2012年

3 高偉;面向SIMD的自動(dòng)向量化優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年

4 鄒燕燕;數(shù)據(jù)中心計(jì)算環(huán)境下基于語(yǔ)義模式的編譯優(yōu)化[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

5 謝俊;基于TMS320C6678的細(xì)胞圖像識(shí)別并行系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];湘潭大學(xué);2014年



本文編號(hào):2726924

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2726924.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0f187***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com