天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

LAPACK線性方程求解函數(shù)在龍芯3A上的并行化

發(fā)布時(shí)間:2018-07-12 15:43

  本文選題:LAPACK + BLAS。 參考:《小型微型計(jì)算機(jī)系統(tǒng)》2014年05期


【摘要】:針對(duì)龍芯3A體系結(jié)構(gòu),該文通過變量代換或消除、簡化依賴關(guān)系、增加熱點(diǎn)數(shù)據(jù)副本、并行流水等方法對(duì)BLAS函數(shù)和LAPACK函數(shù)做并行化,基于原LAPACK庫的結(jié)構(gòu)層次實(shí)現(xiàn)了線性方程求解函數(shù)的并行化版本,用戶只需設(shè)定核數(shù)重新編譯出LAPACK的多核庫便可使用.通過LAPACK自帶的性能測試程序進(jìn)行測試,實(shí)驗(yàn)結(jié)果表明,在四核模式下,大多數(shù)函數(shù)加速比達(dá)到2以上,部分函數(shù)加速比超過了3,所有線性方程求解類函數(shù)加速比的算術(shù)平均值達(dá)到2.04.
[Abstract]:In this paper, by means of variable substitution or elimination, dependency simplification, hot data replica, parallel pipelining and so on, the BLAS function and LAPACK function are parallelized. Based on the structure hierarchy of the original LAPACK library, the parallel version of the linear equation solving function is implemented. The user only need to set the kernel number to compile the LAPACK multi-core library. The test results show that, in the four-core mode, the speedup ratio of most functions is more than 2. The speedup ratio of some functions exceeds 3, and the arithmetic average of speedup of all linear equations is 2.04.
【作者單位】: 中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院;安徽省計(jì)算與通信軟件重點(diǎn)實(shí)驗(yàn)室;中國科學(xué)技術(shù)大學(xué)中科院沈陽計(jì)算所網(wǎng)絡(luò)與通信聯(lián)合實(shí)驗(yàn)室;
【基金】:國家“核高基”重大專項(xiàng)項(xiàng)目(2009ZX01028-002-003-005)資助
【分類號(hào)】:TP311.11;TP332

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 李毅;何頌頌;李愷;;多核龍芯3A上二級(jí)BLAS庫的優(yōu)化[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年01期

2 顧麗紅;吳少剛;;訪存密集型應(yīng)用在SMP機(jī)群系統(tǒng)中的性能分析[J];小型微型計(jì)算機(jī)系統(tǒng);2006年07期

3 何頌頌;顧乃杰;朱海濤;劉燕君;;面向龍芯3A體系結(jié)構(gòu)的BLAS庫優(yōu)化[J];小型微型計(jì)算機(jī)系統(tǒng);2012年03期

4 劉暢;;求解三對(duì)角線性方程組兩類并行算法的特點(diǎn)[J];中國教師;2009年S1期

【共引文獻(xiàn)】

相關(guān)期刊論文 前3條

1 謝林川;;計(jì)算機(jī)性能優(yōu)化技術(shù)中存在的問題[J];硅谷;2012年05期

2 毛曉煒;陶先平;何萬青;;Intel Bensley平臺(tái)下前端總線競爭對(duì)訪存密集型程序的性能影響分析[J];南京大學(xué)學(xué)報(bào)(自然科學(xué));2010年02期

3 何頌頌;顧乃杰;任開新;;一種面向數(shù)據(jù)密集型應(yīng)用的并行程序執(zhí)行模型[J];小型微型計(jì)算機(jī)系統(tǒng);2013年07期

相關(guān)博士學(xué)位論文 前2條

1 龍柏;并行計(jì)算平臺(tái)上的數(shù)據(jù)索引技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年

2 廖銀;動(dòng)態(tài)二進(jìn)制翻譯建模及其并行化研究[D];中國科學(xué)技術(shù)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前2條

1 馮X;嵌入式環(huán)境下三線性分解算法優(yōu)化技術(shù)研究[D];湖南大學(xué);2012年

2 鐘逸;龍芯3A環(huán)境下的EJTAG調(diào)試技術(shù)[D];華中科技大學(xué);2013年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 駱志剛,李曉梅,王正華;三對(duì)角線性方程組的一種有效分布式并行算法[J];計(jì)算機(jī)研究與發(fā)展;2000年07期

2 吳少剛,章隆兵,蔡飛,顧麗紅,唐志敏;機(jī)群Open MP系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)學(xué)報(bào);2004年07期

3 蘇波;李凱;徐志廣;何頌頌;;龍芯2F上的訪存優(yōu)化[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年01期

4 顧乃杰;李凱;陳國良;吳超;;基于龍芯2F體系結(jié)構(gòu)的BLAS庫優(yōu)化[J];中國科學(xué)技術(shù)大學(xué)學(xué)報(bào);2008年07期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 ;一切為了數(shù)字生活 航嘉多核DH6電源[J];電腦愛好者;2006年14期

2 李靜;;使用多核電腦是浪費(fèi)嗎[J];IT時(shí)代周刊;2008年Z3期

3 李曉明;王韜;劉東;杜江凌;;走進(jìn)多核時(shí)代[J];計(jì)算機(jī)科學(xué)與探索;2008年06期

4 伊君翰;;基于多核處理器的并行編程模型[J];計(jì)算機(jī)工程;2009年08期

5 肖朝暉;;計(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展及技術(shù)問題探討[J];信息化縱橫;2009年12期

6 黃安文;高軍;張民選;;多核處理器片上存儲(chǔ)系統(tǒng)研究[J];計(jì)算機(jī)工程;2010年04期

7 劉俊;劉志祥;;應(yīng)用Amdahl定律對(duì)多核處理器性能的分析[J];信息技術(shù);2010年06期

8 任平;;從UTM駕馭多核看信息安全產(chǎn)品的革新[J];信息安全與技術(shù);2010年07期

9 劉熱;;OpenMP多核技術(shù)研究及其在遺傳算法中的應(yīng)用[J];沈陽大學(xué)學(xué)報(bào);2010年05期

10 周本海;喬建忠;林樹寬;;基于多核處理器的動(dòng)態(tài)共享緩存分配算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

相關(guān)會(huì)議論文 前10條

1 劉濤;季振洲;王慶;朱素霞;;嵌入式多核平臺(tái)大容量高速存儲(chǔ)與增強(qiáng)可靠性研究[A];2010年第16屆全國信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年

2 李鑫;竇勇;鄧林;張勁;;多核平臺(tái)下事務(wù)處理類應(yīng)用性能分析及評(píng)價(jià)[A];2010年第16屆全國信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年

3 何軍;王飆;;通用多核處理器發(fā)展現(xiàn)狀和趨勢研究[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

4 劉奇;郝守青;沈海華;章隆兵;;一種基于RAM的降低異構(gòu)多核切換開銷的方法[A];2010年第16屆全國信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年

5 陳遠(yuǎn)知;;多核處理器的里程碑——TILE64[A];全國第三屆信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)交流會(huì)?痆C];2009年

6 彭林;張小強(qiáng);劉德峰;謝倫國;田祖?zhèn)?;一種挖掘多核處理器存儲(chǔ)級(jí)并行的算法[A];第15屆全國信息存儲(chǔ)技術(shù)學(xué)術(shù)會(huì)議論文集[C];2008年

7 劉杰;馬彥;葉維;高劍剛;;多核處理器存儲(chǔ)體系分析[A];第十五屆計(jì)算機(jī)工程與工藝年會(huì)暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年

8 陳遠(yuǎn)知;楊帆;;Tilera多核處理器網(wǎng)絡(luò)應(yīng)用研究[A];全國第五屆信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議專刊(第一冊)[C];2011年

9 單書暢;胡瑜;李曉維;;多核處理器的核級(jí)冗余容錯(cuò)技術(shù)[A];第六屆中國測試學(xué)術(shù)會(huì)議論文集[C];2010年

10 萬志濤;;基于多核處理器的面向時(shí)延敏感服務(wù)的云基礎(chǔ)架構(gòu)[A];中國通信學(xué)會(huì)信息通信網(wǎng)絡(luò)技術(shù)委員會(huì)2011年年會(huì)論文集(上冊)[C];2011年

相關(guān)重要報(bào)紙文章 前10條

1 張?jiān)迫?并行計(jì)算:迎接多核時(shí)代的挑戰(zhàn)[N];計(jì)算機(jī)世界;2006年

2 清華大學(xué)計(jì)算機(jī)系 教授 汪東升;多核架構(gòu)讓硬件變“軟”[N];計(jì)算機(jī)世界;2007年

3 本報(bào)記者 李敬;多核催熟UTM[N];計(jì)算機(jī)世界;2008年

4 專題策劃、撰稿:劉雨 編譯:天虹;多核帶來新格局[N];中國計(jì)算機(jī)報(bào);2005年

5 清華大學(xué)計(jì)算機(jī)系 教授 鄭緯民;“多核”成為關(guān)鍵詞[N];計(jì)算機(jī)世界;2007年

6 《計(jì)算機(jī)世界》評(píng)測實(shí)驗(yàn)室 吳挺;圖形工作站的多核棋局[N];計(jì)算機(jī)世界;2007年

7 劉學(xué)習(xí);挺進(jìn)多核[N];計(jì)算機(jī)世界;2006年

8 劉洪宇;x86多核技術(shù)解析[N];中國計(jì)算機(jī)報(bào);2008年

9 評(píng)測實(shí)驗(yàn)室 吳挺;主板秋點(diǎn)兵[N];計(jì)算機(jī)世界;2004年

10 郭長佑;多核處理器:從封裝到芯片[N];電子資訊時(shí)報(bào);2006年

相關(guān)博士學(xué)位論文 前10條

1 侯寧;嵌入式多核處理器設(shè)計(jì)與實(shí)現(xiàn)關(guān)鍵技術(shù)研究[D];合肥工業(yè)大學(xué);2012年

2 翟文正;基于模型的異構(gòu)多核嵌入式系統(tǒng)開發(fā)研究[D];上海大學(xué);2013年

3 王耀彬;多核平臺(tái)上支持推測并行化的事務(wù)存儲(chǔ)體系結(jié)構(gòu)性能優(yōu)化[D];中國科學(xué)技術(shù)大學(xué);2010年

4 鄧林;單芯片多核處理器存儲(chǔ)優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

5 郭御風(fēng);面向多核微處理器芯片的高效能I/O體系結(jié)構(gòu)及其實(shí)現(xiàn)技術(shù)[D];國防科學(xué)技術(shù)大學(xué);2010年

6 白明澤;多核集群上的混合并行分子動(dòng)力學(xué)計(jì)算研究[D];電子科技大學(xué);2012年

7 杜建軍;共享高速緩存多核處理器的關(guān)鍵技術(shù)研究[D];重慶大學(xué);2011年

8 聶鵬程;多核處理器上的操作系統(tǒng)調(diào)度[D];西安電子科技大學(xué);2013年

9 陳芳園;基于多核處理器平臺(tái)的實(shí)時(shí)系統(tǒng)WCET分析研究[D];國防科學(xué)技術(shù)大學(xué);2011年

10 呂正;多核處理器存儲(chǔ)系統(tǒng)的驗(yàn)證方法研究[D];西北大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 王雪梅;嵌入式多核處理器的仿真器設(shè)計(jì)[D];國防科學(xué)技術(shù)大學(xué);2010年

2 程丹;NIOS Ⅱ多核通信及在神經(jīng)網(wǎng)絡(luò)硬件實(shí)現(xiàn)中的應(yīng)用研究[D];東北師范大學(xué);2010年

3 奚海波;并行編程技術(shù)在多核處理器上的研究與應(yīng)用[D];東北師范大學(xué);2010年

4 羅s,

本文編號(hào):2117645


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2117645.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e1af5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
午夜福利精品视频视频| 亚洲美女国产精品久久| 国产av熟女一区二区三区四区| 欧美91精品国产自产| 五月婷婷欧美中文字幕| 午夜福利视频日本一区| 91麻豆精品欧美视频| 国产欧美日韩在线一区二区| 国产av天堂一区二区三区粉嫩| 久草国产精品一区二区| 亚洲综合天堂一二三区| 国产精品一区二区传媒蜜臀| 国产欧美一区二区久久 | 亚洲国产成人av毛片国产 | 美女被后入视频在线观看| 国产色偷丝袜麻豆亚洲| 沐浴偷拍一区二区视频| 国产一区二区精品丝袜| 欧美久久一区二区精品| 日韩欧美在线看一卡一卡| 国产又大又硬又粗又黄| 久久久免费精品人妻一区二区三区| 欧美一区二区黑人在线| 国产一区二区三区四区中文| 中文字幕亚洲在线一区| 爽到高潮嗷嗷叫之在现观看| 亚洲中文字幕有码在线观看| 亚洲一区二区三区四区| 91亚洲熟女少妇在线观看| 高清欧美大片免费在线观看| 亚洲精品成人综合色在线| 亚洲最新一区二区三区| 三级理论午夜福利在线看| 国产又粗又猛又大爽又黄| 99久久国产精品成人观看| 免费特黄一级一区二区三区| 亚洲欧美日韩熟女第一页| 欧美午夜性刺激在线观看| 精品亚洲一区二区三区w竹菊| 99精品人妻少妇一区二区人人妻| 国产99久久精品果冻传媒|