天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

數(shù)據(jù)局部性及其編譯優(yōu)化技術(shù)研究

發(fā)布時(shí)間:2021-02-02 15:08
  隨著工藝水平的進(jìn)步和處理器體系結(jié)構(gòu)的發(fā)展,處理器的速度已遠(yuǎn)遠(yuǎn)超過(guò)了存儲(chǔ)器的速度,從而導(dǎo)致了“存儲(chǔ)墻”的出現(xiàn)。為了解決“存儲(chǔ)墻”問(wèn)題,減少存儲(chǔ)訪問(wèn)延遲,當(dāng)前的計(jì)算機(jī)大都采用層次存儲(chǔ)系統(tǒng)。層次存儲(chǔ)系統(tǒng)中各級(jí)存儲(chǔ)器的有效利用依賴于程序存儲(chǔ)訪問(wèn)的局部性特性,因此針對(duì)層次存儲(chǔ)系統(tǒng)的局部性優(yōu)化技術(shù)成為了充分發(fā)揮計(jì)算機(jī)系統(tǒng)性能,解決“存儲(chǔ)墻”問(wèn)題的關(guān)鍵技術(shù)之一。 本文著重研究了如何通過(guò)編譯優(yōu)化來(lái)改善程序存儲(chǔ)訪問(wèn)的局部性問(wèn)題。cache局部性優(yōu)化和內(nèi)存局部性優(yōu)化是局部性優(yōu)化中的關(guān)鍵問(wèn)題。改善cache局部性可以有效減少cache失效,而改善內(nèi)存局部性可以有效減少處理器間的數(shù)據(jù)通信。除了局部性之外,偽共享也對(duì)程序的執(zhí)行性能有著重要的影響。因此,本文主要針對(duì)cache局部性優(yōu)化、內(nèi)存局部性優(yōu)化和提高局部性并同時(shí)消除偽共享的問(wèn)題進(jìn)行了深入的研究。本文所做的創(chuàng)新工作主要體現(xiàn)在以下幾點(diǎn): (1) 在利用數(shù)據(jù)變換技術(shù)來(lái)優(yōu)化cache局部性方面,當(dāng)前的方法大都僅考慮了對(duì)仿射下標(biāo)的優(yōu)化,并且優(yōu)化方法相對(duì)來(lái)說(shuō)比較復(fù)雜,有的還限制了數(shù)據(jù)變換的種類,存在著一定的不足之處。針對(duì)這些不足之處,本文深入探討了用數(shù)據(jù)變... 

【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:207 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

數(shù)據(jù)局部性及其編譯優(yōu)化技術(shù)研究


不同數(shù)據(jù)存儲(chǔ)方式的執(zhí)行時(shí)間比較

執(zhí)行時(shí)間,原程序,數(shù)組,程序


(e)mytest圖7.4原程序和優(yōu)化后的程序的執(zhí)行時(shí)間比較【圖7.4中橫坐標(biāo)為處理器數(shù)目,縱坐標(biāo)為執(zhí)行時(shí)間,且執(zhí)行時(shí)間的單位是秒。測(cè)試程序的問(wèn)題規(guī)模如下:matmult使用1o24x1024的數(shù)組;s”Zk使用lo24xlo24的數(shù)組;adi使用200ox2000x3的數(shù)組;卿nta使用92ox92ox3的三維數(shù)組以及92ox92o的二維數(shù)組;mytest的L,=256,LZ=256,L3=225。上述數(shù)組中每個(gè)數(shù)組元素的大小都是8個(gè)字節(jié)]。第169頁(yè)


本文編號(hào):3014902

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3014902.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶85b7b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com