天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

面向程序訪存特征的存儲(chǔ)優(yōu)化技術(shù)研究

發(fā)布時(shí)間:2020-09-19 15:54
   性能的提高一直是計(jì)算機(jī)研究人員孜孜不倦追求的目標(biāo)。隨著大規(guī)模集成電路的發(fā)展,處理器的計(jì)算能力飛速提高。計(jì)算機(jī)性能提高的瓶頸由計(jì)算轉(zhuǎn)變?yōu)榇鎯?chǔ)。存儲(chǔ)性能是程序訪存特征和特定的存儲(chǔ)結(jié)構(gòu)共同作用的結(jié)果。程序訪存特征的研究一直伴隨著處理器的發(fā)展,為存儲(chǔ)結(jié)構(gòu)提供發(fā)展方向。 針對(duì)Cache結(jié)構(gòu)不區(qū)分程序數(shù)據(jù)和主存物理實(shí)現(xiàn)一維連續(xù)的特征,本文選取具有典型訪存特征的應(yīng)用程序,通過分析訪存特征給出合理的存儲(chǔ)優(yōu)化方案: 1)在共享Cache存儲(chǔ)體系結(jié)構(gòu)中,利用Simics+GEMS體系結(jié)構(gòu)模擬器,分析基于PostgreSQL數(shù)據(jù)庫在線事務(wù)處理不同數(shù)據(jù)集的訪存特征,建立數(shù)據(jù)分類模型,將數(shù)據(jù)集劃分為放棄型、保護(hù)型和自由競爭型三類;然后提出一種軟件協(xié)同的半透明共享Cache結(jié)構(gòu)區(qū)分對(duì)待三類數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果證明Cache失效率最高下降率為12%。 2)針對(duì)矩陣行列訪問二維連續(xù)的特征和DRAM存儲(chǔ)一維連續(xù)的特性,提出一種針對(duì)行列交替訪問的優(yōu)化方案——窗口訪問,并證明了最優(yōu)窗口原理,利用可重構(gòu)實(shí)驗(yàn)平臺(tái)實(shí)現(xiàn)窗口訪問存儲(chǔ)控制器,實(shí)驗(yàn)證明矩陣行列交替訪問的存儲(chǔ)性能提高可達(dá)73.6%,一維FFT并行算法性能可提高45.1%。 3)基于窗口訪問原理,指導(dǎo)CPU和GPU上矩陣數(shù)據(jù)的布局,優(yōu)化矩陣行列交替訪問程序,實(shí)驗(yàn)證明CPU中矩陣行列交替訪問的存儲(chǔ)性能最大提高58.4%,并實(shí)現(xiàn)窗口訪問和FFTW結(jié)合的一維FFT并行算法,與FFTW相比計(jì)算性能提高可達(dá)7%;分析CUDA編程框架和相應(yīng)GPU的結(jié)構(gòu)特點(diǎn),將窗口原理應(yīng)用到GPU中以warp為單位的訪存過程上,實(shí)驗(yàn)表明矩陣行列交替訪問的存儲(chǔ)性能提高了1倍。
【學(xué)位單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2011
【中圖分類】:TP333
【部分圖文】:

結(jié)構(gòu)圖,內(nèi)部邏輯,結(jié)構(gòu)圖,替換算法


在組相聯(lián)和全相聯(lián) Cache 中,有多個(gè) Cache 塊供選擇,就必須使用替換算法。主要的替換算法有隨機(jī)法、先進(jìn)先出法(First-In-First-Out,F(xiàn)IFO)、最近最少使用法(Least Recently Used,LRU)。隨機(jī)法,顧名思義隨機(jī)選擇一個(gè)塊替換出去;FIFO 替換最早調(diào)入的塊;LRU 選擇最近訪問最少的塊作為被替換出去的塊。通過以上對(duì) Cache 組織結(jié)構(gòu)、替換算法的描述,可知提高 Cache 命中率的方法有:增加 Cache 容量,優(yōu)化 Cache 組織結(jié)構(gòu),更加有效的替換算法,優(yōu)化算法使存儲(chǔ)訪問更加連續(xù);減少訪存時(shí)間的方法有:多級(jí) Cache,數(shù)據(jù)預(yù)取,根據(jù)算法特性優(yōu)化數(shù)據(jù)放置。2.3.3 DRAM 的存儲(chǔ)特點(diǎn)主存是存儲(chǔ)層次中位于 Cache 下的一個(gè)層次,是數(shù)據(jù)輸入的主要目的地和數(shù)據(jù)輸入的發(fā)源地,用來滿足 Cache 和 I/O 外設(shè)的請(qǐng)求。主存的性能主要通過延遲和貸款來衡量。DRAM 是一種高速動(dòng)態(tài)隨機(jī)訪問的存儲(chǔ)器,其工作速度和系統(tǒng)總線速度同步,支持高速總線時(shí)鐘頻率,內(nèi)部邏輯結(jié)構(gòu)如 2.2 所示[13][14][15]。

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 朱海濤;陳云霽;錢誠;王玲;胡偉武;;基于向量擴(kuò)展多核處理器的矩陣乘法算法優(yōu)化研究[J];中國科學(xué)技術(shù)大學(xué)學(xué)報(bào);2011年02期

相關(guān)博士學(xué)位論文 前2條

1 周杰;合成孔徑雷達(dá)數(shù)據(jù)處理應(yīng)用的細(xì)粒度并行算法與結(jié)構(gòu)[D];國防科學(xué)技術(shù)大學(xué);2010年

2 鄧林;單芯片多核處理器存儲(chǔ)優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

相關(guān)碩士學(xué)位論文 前3條

1 李鑫;面向事務(wù)處理應(yīng)用的多核共享存儲(chǔ)體系結(jié)構(gòu)性能評(píng)價(jià)[D];國防科學(xué)技術(shù)大學(xué);2010年

2 雷元武;合成孔徑雷達(dá)成像處理硬件加速器技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2007年

3 蘇波;ATLAS在龍芯2F上的訪存優(yōu)化[D];中國科學(xué)技術(shù)大學(xué);2009年



本文編號(hào):2822704

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2822704.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶70329***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
中文字幕乱码亚洲三区| 大尺度激情福利视频在线观看| 97人妻精品免费一区二区| 91人妻人人揉人人澡人| 国产免费一区二区三区av大片| 日本精品中文字幕人妻| 好骚国产99在线中文| 老司机这里只有精品视频| 国产亚洲精品岁国产微拍精品| 亚洲最新中文字幕在线视频 | 久久永久免费一区二区| 99秋霞在线观看视频| 91欧美日韩中在线视频| 国产成人精品午夜福利| 国产精品久久熟女吞精| 国产成人精品资源在线观看| 日韩毛片视频免费观看| 日韩女优精品一区二区三区| 欧洲一区二区三区自拍天堂| 九九热国产这里只有精品| 粉嫩内射av一区二区| 国产亚洲系列91精品| 亚洲第一视频少妇人妻系列| 亚洲国产成人精品福利| 亚洲中文字幕综合网在线| 高清亚洲精品中文字幕乱码| 丰满人妻熟妇乱又伦精另类视频| 97人妻精品免费一区二区| 日本加勒比不卡二三四区| 日本人妻的诱惑在线观看| 色小姐干香蕉在线综合网| 国产又粗又猛又大爽又黄同志 | 久久大香蕉精品在线观看| 日本在线不卡高清欧美| 太香蕉久久国产精品视频| 真实国产乱子伦对白视频不卡 | 亚洲中文字幕在线观看四区 | 粗暴蹂躏中文一区二区三区| 黑丝袜美女老师的小逼逼| 国产91人妻精品一区二区三区| 99久久精品免费精品国产|