基于龍芯3A2000處理器的高性能Goto BLAS庫的實(shí)現(xiàn)
本文選題:Goto + BLAS。 參考:《高技術(shù)通訊》2016年Z2期
【摘要】:用Linpack測試集測試了計(jì)算機(jī)系統(tǒng)浮點(diǎn)性能,測試用函數(shù)運(yùn)算庫為Goto BLAS庫。該庫對Linpach的測試結(jié)果有很大影響。為了提高Goto BLAS性能,觀察了Goto BLAS庫在龍芯3A2000處理器平臺(tái)的性能表現(xiàn),分析了測試軟件的執(zhí)行流程、數(shù)據(jù)的處理方法,根據(jù)處理器的結(jié)構(gòu)特點(diǎn),合理配置矩陣分塊參數(shù),優(yōu)化核心循環(huán)的實(shí)現(xiàn)方案,同時(shí)采用軟硬件數(shù)據(jù)預(yù)取技術(shù)及優(yōu)化的內(nèi)核TLB配置策略。在這些優(yōu)化方法的共同作用下,仿真平臺(tái)上核心函數(shù)的浮點(diǎn)部件效率超過90%。優(yōu)化方案在本實(shí)驗(yàn)中取得了顯著的效果。
[Abstract]:The floating-point performance of computer system is tested with Linpack test set, and the function operation library is Goto BLAS library. This library has great influence on the test results of Linpach. In order to improve the performance of Goto BLAS, the performance of Goto BLAS library in Longson 3A2000 processor platform is observed, and the execution flow of test software and the method of data processing are analyzed. According to the structural characteristics of the processor, the block parameters of matrix are reasonably configured. At the same time, the hardware and software data prefetching technology and the optimized kernel TLB configuration strategy are used to optimize the implementation of the core cycle. Under the joint action of these optimization methods, the floating-point component efficiency of the core function on the simulation platform is more than 90%. The optimized scheme has achieved remarkable results in this experiment.
【作者單位】: 中國科學(xué)院計(jì)算技術(shù)研究所計(jì)算機(jī)體系結(jié)構(gòu)國家重點(diǎn)實(shí)驗(yàn)室;中國科學(xué)院大學(xué);龍芯中科技術(shù)有限公司;
【基金】:“核高基”科技重大專項(xiàng)課題(2014ZX01020201) 863計(jì)劃(2012AA012202,2013AA014301)資助項(xiàng)目
【分類號(hào)】:TP332;TP306
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;新一代高端服務(wù)器的標(biāo)準(zhǔn)──康柏8路處理器系統(tǒng)結(jié)構(gòu)[J];上海微型計(jì)算機(jī);2000年36期
2 ;調(diào)試嵌入式處理器的幾種常用方法[J];電子產(chǎn)品世界;2003年08期
3 ;軟核嵌入式處理器挑戰(zhàn)性價(jià)比[J];今日電子;2004年06期
4 仲海梅;紀(jì)斌;;安全處理器的研究[J];計(jì)算機(jī)與信息技術(shù);2007年05期
5 Jorge Carrillo;Raj Nagarajan;Oliver Oppitz;;應(yīng)對高級(jí)嵌入式處理器系統(tǒng)調(diào)試挑戰(zhàn)[J];電子設(shè)計(jì)技術(shù);2008年11期
6 ;飛思卡爾為成本敏感的網(wǎng)絡(luò)和工業(yè)應(yīng)用推出新處理器[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2010年12期
7 ;飛思卡爾為成本敏感的網(wǎng)絡(luò)和工業(yè)應(yīng)用推出新處理器[J];電子產(chǎn)品世界;2010年12期
8 ;飛思卡爾為成本敏感的網(wǎng)絡(luò)和工業(yè)應(yīng)用推出新處理器[J];世界電子元器件;2010年12期
9 ;飛思卡爾為成本敏感的網(wǎng)絡(luò)和工業(yè)應(yīng)用推出新處理器[J];半導(dǎo)體技術(shù);2011年01期
10 王晨旭;張凱峰;張祥建;喻明艷;;嵌入式處理器中分支目標(biāo)緩沖器的研究與設(shè)計(jì)[J];微電子學(xué)與計(jì)算機(jī);2012年01期
相關(guān)會(huì)議論文 前1條
1 梁祺愷;;Si(Li)X射線譜儀用的315型脈沖處理器[A];第7屆全國核電子學(xué)與核探測技術(shù)學(xué)術(shù)年會(huì)論文集(一)[C];1994年
相關(guān)重要報(bào)紙文章 前10條
1 ;采用通用技術(shù) SGI銷售高端Linux系統(tǒng)[N];計(jì)算機(jī)世界;2003年
2 ;預(yù)計(jì)下半年正式推向市場[N];人民郵電;2009年
3 本報(bào)記者 姜波;高端大事件[N];網(wǎng)絡(luò)世界;2004年
4 莊莊;64位處理器前瞻[N];中國計(jì)算機(jī)報(bào);2002年
5 廣西 姑蘇飄雪;走入雙(多)內(nèi)核處理器的世界[N];電腦報(bào);2004年
6 吳挺;多核不問真假[N];計(jì)算機(jī)世界;2007年
7 Ray;一個(gè)頂倆 Intel Hyper-Threading技術(shù)[N];中國計(jì)算機(jī)報(bào);2002年
8 新城;突破頻率的桎梏[N];計(jì)算機(jī)世界;2001年
9 袁欽玲;AMD緊抓SQL Server 2005企業(yè)市場機(jī)會(huì)[N];中國計(jì)算機(jī)報(bào);2005年
10 孫定;明年,英特爾的黃金時(shí)代或?qū)⒔K結(jié)[N];計(jì)算機(jī)世界;2011年
相關(guān)博士學(xué)位論文 前9條
1 王延升;粗粒度動(dòng)態(tài)可重構(gòu)處理器中的高能效關(guān)鍵配置技術(shù)研究[D];清華大學(xué);2014年
2 張曉旭;應(yīng)用驅(qū)動(dòng)的多處理器片上系統(tǒng)能耗優(yōu)化技術(shù)研究[D];浙江大學(xué);2015年
3 洪春濤;眾核處理器編程模式關(guān)鍵技術(shù)研究[D];清華大學(xué);2011年
4 陳小文;同構(gòu)眾核處理器的片上存儲(chǔ)管理與同步機(jī)制研究[D];國防科學(xué)技術(shù)大學(xué);2011年
5 段然;嵌入式可重構(gòu)DSP體系結(jié)構(gòu)研究[D];西北工業(yè)大學(xué);2005年
6 韓澤耀;高速高性能FFT處理器的VLSI實(shí)現(xiàn)研究[D];浙江大學(xué);2002年
7 趙學(xué)秘;可編程密碼處理器關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2006年
8 李文;存儲(chǔ)控制系統(tǒng)性能優(yōu)化技術(shù)研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
9 鄭偉;多媒體應(yīng)用的高性能數(shù)字信號(hào)處理器功能部件結(jié)構(gòu)設(shè)計(jì)研究[D];浙江大學(xué);2003年
相關(guān)碩士學(xué)位論文 前10條
1 何驚昱;16位RISC處理器的設(shè)計(jì)和FPGA實(shí)現(xiàn)[D];蘭州大學(xué);2015年
2 王桂花;非相似平臺(tái)管理計(jì)算機(jī)的余度管理技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
3 楊帆;安全處理器研究[D];華北電力大學(xué);2015年
4 張學(xué)敏;基于可擴(kuò)展片上系統(tǒng)的處理器設(shè)計(jì)[D];電子科技大學(xué);2014年
5 王康;應(yīng)用于MIMO-OFDM系統(tǒng)的高性能FFT/IFFT處理器的設(shè)計(jì)及實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 任玉濤;鋼水紅外輻射測溫信號(hào)處理器的研究與實(shí)現(xiàn)[D];東北大學(xué);2013年
7 陳小均;基于FPGA+DSP的某監(jiān)控雷達(dá)信號(hào)處理器設(shè)計(jì)與實(shí)現(xiàn)[D];南京理工大學(xué);2014年
8 段金松;熒光測鈾系統(tǒng)的研究與應(yīng)用[D];東華理工大學(xué);2014年
9 韓君妹;SDR-4902軟件無線電平臺(tái)異構(gòu)處理器互聯(lián)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2013年
10 韓冬;鋼水比色紅外測溫信號(hào)處理器的研究與實(shí)現(xiàn)[D];東北大學(xué);2014年
,本文編號(hào):1856963
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1856963.html