面向高密度計(jì)算的多核處理器結(jié)構(gòu)研究
【學(xué)位單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2011
【中圖分類】:TP332
【文章目錄】:
摘要
ABSTRACT
目錄
圖目錄
表目錄
第1章 緒論
1.1 研究背景
1.1.1 微處理器在高性能計(jì)算中的應(yīng)用
1.1.2 微處理器發(fā)展現(xiàn)狀
1.2 本文研究的問(wèn)題及意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀
1.4 本文研究?jī)?nèi)容及論文組織
第2章 面向高密度計(jì)算的相關(guān)研究工作
2.1 幾種面向高密度計(jì)算的處理器結(jié)構(gòu)
2.1.1 Cell處理器
2.1.2 TRIPS處理器
2.1.3 Intel core i7處理器
2.1.4 GPU處理器結(jié)構(gòu)
2.1.5 Godson-3號(hào)處理器
2.1.6 計(jì)算/訪存分離的處理器結(jié)構(gòu)模型
2.2 性能分析相關(guān)研究
2.2.1 現(xiàn)有的性能分析方法
2.2.2 稀疏矩陣向量乘法性能模型
2.2.3 矩陣乘法性能模型
2.3 矩陣乘法的相關(guān)研究工作
2.3.1 單核矩陣乘法相關(guān)工作
2.3.2 多核矩陣乘法相關(guān)工作
2.4 小結(jié)
第3章 矩陣乘法性能模型
3.1 矩陣乘法劃分方法
3.2 單核性能模型
3.2.1 單核性能模型的建立
3.2.2 處理器結(jié)構(gòu)參數(shù)優(yōu)化分析
3.3 多核性能模型
3.4 性能模型的驗(yàn)證
3.4.1 Intel core i7上的性能模型驗(yàn)證
3.4.2 Godson-3A上的性能模型驗(yàn)證
3.5 小結(jié)
3.6 附錄
3.6.1 引理3.1的證明
3.6.2 定理3.1的證明
3.6.3 定理3.2的證明
3.6.4 定理3.3的證明
第4章 多核處理器結(jié)構(gòu)優(yōu)化
4.1 一種乘加-shuffle融合的浮點(diǎn)向量指令
4.2 一種計(jì)算/訪存分離的處理器結(jié)構(gòu)
4.2.1 新的計(jì)算/訪存分離的處理器結(jié)構(gòu)介紹
4.2.2 訪存協(xié)處理器
4.2.3 訪存協(xié)處理器的帶寬測(cè)試
4.3 基于性能模型對(duì)Godson-3B進(jìn)行評(píng)估
4.4 小結(jié)
第5章 Godson-3B上的矩陣乘法
5.1 高效的單核矩陣乘法
5.1.1 GEBP核心循環(huán)實(shí)現(xiàn)方法
5.1.2 寄存器層的訪存優(yōu)化
5.1.3 L2 cache層的訪存優(yōu)化
5.2 多核矩陣乘法
5.3 實(shí)驗(yàn)結(jié)果和分析
5.3.1 實(shí)驗(yàn)平臺(tái)介紹
5.3.2 不同寄存器分組下的核心性能測(cè)試
5.3.3 與性能模型預(yù)測(cè)值的對(duì)比
5.3.4 GEBP核心循環(huán)中時(shí)間開銷分布統(tǒng)計(jì)
5.3.5 與其它處理器的比較
5.4 小結(jié)
第6章 結(jié)論
6.1 本文工作總結(jié)
6.2 進(jìn)一步工作
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
在讀期間參與的科研項(xiàng)目
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 李忠澤,陳瑾,龍翔,李未;基于 Pentium Pro 的高性能 BLAS 的設(shè)計(jì)與實(shí)現(xiàn)[J];北京航空航天大學(xué)學(xué)報(bào);1998年04期
2 蔣孟奇;張?jiān)迫?宋剛;李玉成;;GOTOBLAS一般矩陣乘法高效實(shí)現(xiàn)機(jī)制的研究[J];計(jì)算機(jī)工程;2008年07期
3 喬香珍;Cache性能與程序優(yōu)化[J];計(jì)算機(jī)學(xué)報(bào);1996年11期
4 高翔;陳云霽;王煥東;唐丹;胡偉武;;System Architecture of Godson-3 Multi-Core Processors[J];Journal of Computer Science & Technology;2010年02期
5 江建慧;嵌入式系統(tǒng)性能評(píng)估的基準(zhǔn)程序方法[J];機(jī)械與電子;2002年04期
6 夏培肅,胡偉武;高性能計(jì)算技術(shù)展望[J];中國(guó)科學(xué)院院刊;1998年05期
7 李玉成,朱鵬;BLAS的加速方法與實(shí)現(xiàn)技術(shù)[J];數(shù)值計(jì)算與計(jì)算機(jī)應(yīng)用;1998年03期
相關(guān)博士學(xué)位論文 前4條
1 張福新;微處理器性能分析與優(yōu)化[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
2 馬可;微處理器性能分析模型的建立和研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
3 高翔;多核處理器的訪存模擬與優(yōu)化技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
4 徐光;分片式流處理器體系結(jié)構(gòu)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前3條
1 梅小露;高性能通用處理器中浮點(diǎn)乘加部件的設(shè)計(jì)[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
2 譚彩鳳;基于計(jì)算智能應(yīng)用映射的GPU體系結(jié)構(gòu)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年
3 梁娟娟;基于GPU的BLAS庫(kù)的設(shè)計(jì)和實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
本文編號(hào):2828081
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2828081.html