天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于龍芯3B處理器的Linpack優(yōu)化實(shí)現(xiàn)

發(fā)布時(shí)間:2018-05-20 18:38

  本文選題:計(jì)算機(jī)系統(tǒng)結(jié)構(gòu) + 龍芯B處理器 ; 參考:《深圳大學(xué)學(xué)報(bào)(理工版)》2014年03期


【摘要】:HPL是高性能計(jì)算廣泛采用的Linpack測(cè)試軟件包.針對(duì)龍芯3B處理器體系結(jié)構(gòu)的特點(diǎn),為L(zhǎng)inpack中的核心部分——矩陣乘法設(shè)計(jì)矩陣分塊策略,利用龍芯3B的cache鎖機(jī)制將頻繁調(diào)用的數(shù)據(jù)分塊鎖在cache中,從而顯著降低cache缺失率.同時(shí)為龍芯3B處理器中的訪存加速部件設(shè)計(jì)了高效的預(yù)取算法,以實(shí)現(xiàn)計(jì)算時(shí)間掩蓋訪存時(shí)間.另外,分別對(duì)Linpack所調(diào)用的dtrsm和行交換等熱點(diǎn)函數(shù)進(jìn)行優(yōu)化,并通過(guò)參數(shù)訓(xùn)練來(lái)優(yōu)化Linpack參數(shù).實(shí)驗(yàn)結(jié)果表明,在龍芯3B處理器上,單節(jié)點(diǎn)4核以及雙節(jié)點(diǎn)8核的Linpack實(shí)測(cè)性能均達(dá)到理論峰值的60%左右,優(yōu)化后的Linpack性能較優(yōu)化前提升了10倍左右.
[Abstract]:HPL is a widely used Linpack test software package for high performance computing. According to the characteristics of the architecture of Ronson 3B processor, matrix partitioning strategy is designed for matrix multiplication, which is the core part of Linpack. The frequently invoked data block is locked in cache by using the cache locking mechanism of Ronson 3B, thus significantly reducing the cache deletion rate. At the same time, an efficient prefetching algorithm is designed for the memory access acceleration part of the Godson 3B processor to realize the computation of time masking memory access time. In addition, the hot functions such as dtrsm and row exchange called by Linpack are optimized, and the parameters of Linpack are optimized by parameter training. The experimental results show that the measured Linpack performance of single-node 4-core and two-node 8-core on Ronson 3B processor reaches about 60% of the theoretical peak, and the optimized Linpack performance is about 10 times higher than that before optimization.
【作者單位】: 深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院 廣東省普及型高性能計(jì)算機(jī)實(shí)驗(yàn)室;
【基金】:國(guó)家高技術(shù)研究發(fā)展計(jì)劃資助項(xiàng)目(2012AA01A30904) 廣東省院士工作站建設(shè)項(xiàng)目(2012B090500020)~~
【分類號(hào)】:TP332

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 李文龍,劉利,湯志忠;軟件流水中的循環(huán)展開(kāi)優(yōu)化[J];北京航空航天大學(xué)學(xué)報(bào);2004年11期

2 張文力;陳明宇;樊建平;;HPL測(cè)試性能仿真與預(yù)測(cè)[J];計(jì)算機(jī)研究與發(fā)展;2006年03期

3 陳國(guó)良;蔡曄;羅秋明;;國(guó)產(chǎn)個(gè)人高性能計(jì)算機(jī)系統(tǒng)研制[J];深圳大學(xué)學(xué)報(bào)(理工版);2011年06期

4 蔡曄;劉剛;毛睿;羅秋明;陳國(guó)良;;KD-90普及型個(gè)人高性能計(jì)算機(jī)系統(tǒng)設(shè)計(jì)與性能優(yōu)化[J];深圳大學(xué)學(xué)報(bào)(理工版);2013年02期

5 何頌頌;顧乃杰;朱海濤;劉燕君;;面向龍芯3A體系結(jié)構(gòu)的BLAS庫(kù)優(yōu)化[J];小型微型計(jì)算機(jī)系統(tǒng);2012年03期

6 朱海濤;陳云霽;錢誠(chéng);王玲;胡偉武;;基于向量擴(kuò)展多核處理器的矩陣乘法算法優(yōu)化研究[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2011年02期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 萬(wàn)曉姣;;基于linux系統(tǒng)集群的架構(gòu)與實(shí)現(xiàn)[J];電子世界;2012年10期

2 李錚;薛質(zhì);;基于Linux的高性能集群的構(gòu)建和性能優(yōu)化[J];信息技術(shù);2012年03期

3 郭淑婷;;DSP匯編語(yǔ)言優(yōu)化設(shè)計(jì)[J];河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期

4 陳堅(jiān)禎;陽(yáng)平;李斌;沈丹平;;多核并行計(jì)算下的流量傳感器流場(chǎng)模擬研究[J];衡陽(yáng)師范學(xué)院學(xué)報(bào);2011年06期

5 孟金濤;賀鵬程;劉濤;;Nehalem平臺(tái)的Linpack參數(shù)訓(xùn)練與優(yōu)化[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年S1期

6 周國(guó)建;吳少剛;李祖松;史崗;;基于四階段人工優(yōu)化的軟件流水技術(shù)[J];計(jì)算機(jī)工程;2009年05期

7 高一波;丁亞平;于美麗;;杜利特爾算法在條件優(yōu)化中的應(yīng)用[J];計(jì)算機(jī)與應(yīng)用化學(xué);2009年11期

8 嚴(yán)歷;郭力;;三維宏觀擬顆粒模擬程序計(jì)算代碼優(yōu)化研究與實(shí)現(xiàn)[J];計(jì)算機(jī)與應(yīng)用化學(xué);2009年12期

9 馬曉靜;;一種雷達(dá)信號(hào)處理機(jī)的軟件設(shè)計(jì)[J];雷達(dá)與對(duì)抗;2012年01期

10 王申;漆鋒濱;谷洪峰;潘治;;Linpack并行性能模型及其預(yù)測(cè)[J];計(jì)算機(jī)工程;2012年16期

相關(guān)博士學(xué)位論文 前5條

1 陳堅(jiān)禎;一種新型多電極插入式電磁流量傳感器及其基礎(chǔ)研究[D];上海大學(xué);2009年

2 朱虎明;基于集群計(jì)算的免疫優(yōu)化算法及其應(yīng)用研究[D];西安電子科技大學(xué);2010年

3 廖銀;動(dòng)態(tài)二進(jìn)制翻譯建模及其并行化研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

4 張志敏;化學(xué)計(jì)量學(xué)算法實(shí)現(xiàn)的軟件開(kāi)發(fā)基礎(chǔ)研究[D];中南大學(xué);2012年

5 賈海鵬;面向GPU計(jì)算平臺(tái)的若干并行優(yōu)化關(guān)鍵技術(shù)研究[D];中國(guó)海洋大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 馬慶懷;基于CPU與GPU混合架構(gòu)集群的性能測(cè)試與優(yōu)化[D];中國(guó)地質(zhì)大學(xué)(北京);2011年

2 劉灝;基于NiosⅡ的光纖熔接機(jī)圖像測(cè)量及軟件系統(tǒng)設(shè)計(jì)[D];西北大學(xué);2011年

3 沈旭;無(wú)人機(jī)滅火控制系統(tǒng)及其關(guān)鍵技術(shù)研究[D];長(zhǎng)安大學(xué);2011年

4 韓永杰;LLVM編譯系統(tǒng)結(jié)構(gòu)分析及ARCA3后端移植[D];哈爾濱工業(yè)大學(xué);2010年

5 許玉婷;GPS同步算法的ASIP實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年

6 李錚;基于Linux的小型高性能集群的研究和優(yōu)化[D];上海交通大學(xué);2012年

7 史建國(guó);X10語(yǔ)言機(jī)制研究和實(shí)現(xiàn)優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

8 余小喜;面向嵌入式系統(tǒng)的迭代式循環(huán)展開(kāi)優(yōu)化[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

9 馬萌;面向程序訪存特征的存儲(chǔ)優(yōu)化技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

10 周正;HCO網(wǎng)絡(luò)操作系統(tǒng)的Cx51實(shí)現(xiàn)[D];合肥工業(yè)大學(xué);2006年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 蔡曄;史崗;;基于鎖的Cache一致性協(xié)議的硬件優(yōu)化策略[J];高技術(shù)通訊;2009年09期

2 陳國(guó)良;蔡曄;羅秋明;;國(guó)產(chǎn)個(gè)人高性能計(jì)算機(jī)系統(tǒng)研制[J];深圳大學(xué)學(xué)報(bào)(理工版);2011年06期

3 張俊霞;張煥杰;李會(huì)民;;基于龍芯2F的國(guó)產(chǎn)萬(wàn)億次高性能計(jì)算機(jī)KD-50-I的研制[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2008年01期

4 孫凝暉;陳國(guó)良;;PHPC:一種普及型高性能計(jì)算機(jī)[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2008年07期

5 顧乃杰;李凱;陳國(guó)良;吳超;;基于龍芯2F體系結(jié)構(gòu)的BLAS庫(kù)優(yōu)化[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2008年07期

6 張俊霞;李春生;張煥杰;;KD-50-I-E:一臺(tái)增強(qiáng)型高性能計(jì)算機(jī)[J];中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào);2009年08期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 沈緒榜;嵌入式MPP處理器的發(fā)展[J];電子產(chǎn)品世界;2005年21期

2 于永斌;徐潔;吳曉華;王華;丁旭陽(yáng);;多核時(shí)代的“計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)”課程[J];計(jì)算機(jī)教育;2011年06期

3 羅沛霖;羅晉;凱睿;Steve Novack;Victor Berman;;混合式可重構(gòu)數(shù)字多核并行處理器平臺(tái)[J];前沿科學(xué);2008年04期

4 ;通過(guò)FLIX指令結(jié)構(gòu)提高可配置處理器計(jì)算性能[J];電子設(shè)計(jì)技術(shù);2006年02期

5 許珊琳;;ARM公司的多處理技術(shù)[J];中國(guó)集成電路;2006年05期

6 ;龍芯2號(hào)增強(qiáng)型處理器Loongson2E[J];中國(guó)集成電路;2008年02期

7 王瑩;;Wind River為Altera軟核NiosII提供Linux支持[J];電子產(chǎn)品世界;2009年04期

8 郭從征;王沁;;低速率聲碼器芯片設(shè)計(jì)[J];河北工業(yè)大學(xué)成人教育學(xué)院學(xué)報(bào);2005年04期

9 趙德斌,陳耀強(qiáng),胡良校;Feig快速DCT算法及其處理器的體系結(jié)構(gòu)設(shè)計(jì)[J];計(jì)算機(jī)研究與發(fā)展;1998年12期

10 Peter Coffee;;快不是唯一標(biāo)準(zhǔn)[J];每周電腦報(bào);1999年44期

相關(guān)會(huì)議論文 前10條

1 彭林;張小強(qiáng);劉德峰;謝倫國(guó);田祖?zhèn)?;一種挖掘多核處理器存儲(chǔ)級(jí)并行的算法[A];第15屆全國(guó)信息存儲(chǔ)技術(shù)學(xué)術(shù)會(huì)議論文集[C];2008年

2 陳虎;歐彥麟;陳海波;;面向多核處理器平臺(tái)的并行Hash JOIN算法設(shè)計(jì)與實(shí)現(xiàn)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

3 陳虎;羅偉良;干蕓蕓;;Multi_MINT:一個(gè)基于MINT的多核處理器模擬器[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年

4 何軍;王飆;;通用多核處理器發(fā)展現(xiàn)狀和趨勢(shì)研究[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

5 周巍;孫冰;戰(zhàn)立明;呂建華;王國(guó)仁;于戈;;基于DOM模型的XML查詢處理器的設(shè)計(jì)與實(shí)現(xiàn)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

6 王海鵬;倪遠(yuǎn)平;;U-boot在mini2440平臺(tái)上的移植方法[A];2010年西南三省一市自動(dòng)化與儀器儀表學(xué)術(shù)年會(huì)論文集[C];2010年

7 胡杏;胡瑜;李曉維;;基于存儲(chǔ)級(jí)并行的同時(shí)多線程電壓緊急容錯(cuò)技術(shù)[A];第十四屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議(CFTC'2011)論文集[C];2011年

8 王慶;季振洲;劉濤;;面向嵌入式多核存儲(chǔ)層次的OpenMP優(yōu)化研究[A];2010年第16屆全國(guó)信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年

9 李勇;劉勝;甄體智;;C64x+DSP內(nèi)核分析及其性能評(píng)價(jià)[A];第15屆全國(guó)信息存儲(chǔ)技術(shù)學(xué)術(shù)會(huì)議論文集[C];2008年

10 張民選;;前言[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 溫慶生 特約記者 王握文;“算盤王國(guó)”新傳奇[N];光明日?qǐng)?bào);2010年

2 學(xué)健 編譯;Linux:一種趨勢(shì)[N];計(jì)算機(jī)世界;2001年

3 心元;PC“心臟”的搏擊[N];計(jì)算機(jī)世界;2004年

4 本報(bào)記者 湯銘;“天河一號(hào)” 躍居世界榜首[N];計(jì)算機(jī)世界;2010年

5 ;Microsoft Embeded OS縮小的桌面系統(tǒng)[N];中國(guó)計(jì)算機(jī)報(bào);2001年

6 本報(bào)記者 薛仁 王握文 特約通訊員 司宏偉;超越之路[N];解放軍報(bào);2010年

7 本報(bào)記者 張群英;10年布局IBM豪賭“一種服務(wù)器”[N];網(wǎng)絡(luò)世界;2002年

8 ;HP為Itanium提供Linux開(kāi)發(fā)工具包[N];計(jì)算機(jī)世界;2000年

9 井之;新一代安騰處理器[N];網(wǎng)絡(luò)世界;2002年

10 本報(bào)記者 向利 實(shí)習(xí)記者 孫冠杰;“天河”因自主創(chuàng)新而騰飛[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2010年

相關(guān)博士學(xué)位論文 前10條

1 徐光;分片式流處理器體系結(jié)構(gòu)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

2 孫濤;面向動(dòng)態(tài)異構(gòu)眾核處理器的任務(wù)調(diào)度研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

3 劉德峰;面向存儲(chǔ)級(jí)并行的多核處理器關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

4 李靜梅;多核處理器的設(shè)計(jì)技術(shù)研究[D];哈爾濱工程大學(xué);2010年

5 朱海濤;面向高密度計(jì)算的多核處理器結(jié)構(gòu)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年

6 劉谷;可重構(gòu)眾核流處理器上的編譯與程序優(yōu)化技術(shù)[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

7 陳虎;面向應(yīng)用的指令集處理器關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

8 黃立波;片上集群體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

9 張惠臻;可重構(gòu)指令集處理器設(shè)計(jì)中的軟件重定向關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年

10 許牧;可重構(gòu)眾核流處理器體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 趙麗麗;基于TTA內(nèi)核的流處理器設(shè)計(jì)的研究[D];上海交通大學(xué);2010年

2 董珍;異構(gòu)多核處理器的任務(wù)調(diào)度分配問(wèn)題及算法研究[D];哈爾濱工程大學(xué);2010年

3 尤凱迪;高性能低功耗多核處理器研究[D];復(fù)旦大學(xué);2011年

4 鐘松延;可配置可擴(kuò)展處理器編譯器設(shè)計(jì)[D];天津大學(xué);2012年

5 劉子揚(yáng);基于虛擬計(jì)算群的眾核處理器動(dòng)態(tài)在線任務(wù)調(diào)度算法研究[D];上海交通大學(xué);2013年

6 盛肖煒;多核處理器內(nèi)部核間通信研究[D];沈陽(yáng)理工大學(xué);2013年

7 董正楊;亂序處理器指令吞吐量平穩(wěn)化的動(dòng)態(tài)調(diào)節(jié)方法研究[D];華中科技大學(xué);2012年

8 閔銀皮;同構(gòu)通用流多核處理器存儲(chǔ)部件關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年

9 葉新棟;一種Java處理器的體系結(jié)構(gòu)設(shè)計(jì)與研究[D];復(fù)旦大學(xué);2011年

10 馬媛;基于多核處理器平臺(tái)的分流模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2012年

,

本文編號(hào):1915787

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1915787.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶182f8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美日韩在线观看自拍| 午夜福利网午夜福利网| 超碰在线播放国产精品| 东京热一二三区在线免| 国产亚洲精品岁国产微拍精品| 婷婷伊人综合中文字幕| 国产亚洲视频香蕉一区| 成人精品视频在线观看不卡| 欧美日韩免费黄片观看| 人妻露脸一区二区三区| 午夜精品成年人免费视频| 丝袜诱惑一区二区三区| 国产精品午夜小视频观看| 男人大臿蕉香蕉大视频| 国产原创中文av在线播放| 能在线看的视频你懂的| 亚洲欧美日韩中文字幕二欧美| 国产成人精品国产亚洲欧洲| 91亚洲精品国产一区| 东京热加勒比一区二区三区| 一区二区三区亚洲国产| 91人妻人人澡人人人人精品| 美日韩一区二区精品系列| 亚洲一区二区精品国产av| 国产综合一区二区三区av| 欧美一区二区三区视频区| 中文字幕一区二区免费| 亚洲av秘片一区二区三区| 国产成人亚洲精品青草天美 | 亚洲国产精品国自产拍社区| 天海翼精品久久中文字幕| 国内自拍偷拍福利视频| 福利在线午夜绝顶三级| 午夜久久精品福利视频| 欧美一区二区三区播放| 亚洲国产成人精品一区刚刚| 国产熟女一区二区不卡| 麻豆视传媒短视频免费观看| 国产精品欧美激情在线观看| 99久久人妻精品免费一区| 中文字幕高清不卡一区|