LAPACK線性方程求解函數(shù)在龍芯3A上的并行化
本文選題:LAPACK + BLAS ; 參考:《小型微型計算機系統(tǒng)》2014年05期
【摘要】:針對龍芯3A體系結(jié)構,該文通過變量代換或消除、簡化依賴關系、增加熱點數(shù)據(jù)副本、并行流水等方法對BLAS函數(shù)和LAPACK函數(shù)做并行化,基于原LAPACK庫的結(jié)構層次實現(xiàn)了線性方程求解函數(shù)的并行化版本,用戶只需設定核數(shù)重新編譯出LAPACK的多核庫便可使用.通過LAPACK自帶的性能測試程序進行測試,實驗結(jié)果表明,在四核模式下,大多數(shù)函數(shù)加速比達到2以上,部分函數(shù)加速比超過了3,所有線性方程求解類函數(shù)加速比的算術平均值達到2.04.
[Abstract]:In this paper, by means of variable substitution or elimination, dependency simplification, hot data replica, parallel pipelining and so on, the BLAS function and LAPACK function are parallelized. Based on the structure hierarchy of the original LAPACK library, the parallel version of the linear equation solving function is implemented. The user only need to set the kernel number to compile the LAPACK multi-core library. The test results show that, in the four-core mode, the speedup ratio of most functions is more than 2. The speedup ratio of some functions exceeds 3, and the arithmetic average of speedup of all linear equations is 2.04.
【作者單位】: 中國科學技術大學計算機科學技術學院;安徽省計算與通信軟件重點實驗室;中國科學技術大學中科院沈陽計算所網(wǎng)絡與通信聯(lián)合實驗室;
【基金】:國家“核高基”重大專項項目(2009ZX01028-002-003-005)資助
【分類號】:TP311.11;TP332
【參考文獻】
相關期刊論文 前4條
1 李毅;何頌頌;李愷;;多核龍芯3A上二級BLAS庫的優(yōu)化[J];計算機系統(tǒng)應用;2011年01期
2 顧麗紅;吳少剛;;訪存密集型應用在SMP機群系統(tǒng)中的性能分析[J];小型微型計算機系統(tǒng);2006年07期
3 何頌頌;顧乃杰;朱海濤;劉燕君;;面向龍芯3A體系結(jié)構的BLAS庫優(yōu)化[J];小型微型計算機系統(tǒng);2012年03期
4 劉暢;;求解三對角線性方程組兩類并行算法的特點[J];中國教師;2009年S1期
【共引文獻】
相關期刊論文 前3條
1 謝林川;;計算機性能優(yōu)化技術中存在的問題[J];硅谷;2012年05期
2 毛曉煒;陶先平;何萬青;;Intel Bensley平臺下前端總線競爭對訪存密集型程序的性能影響分析[J];南京大學學報(自然科學);2010年02期
3 何頌頌;顧乃杰;任開新;;一種面向數(shù)據(jù)密集型應用的并行程序執(zhí)行模型[J];小型微型計算機系統(tǒng);2013年07期
相關博士學位論文 前2條
1 龍柏;并行計算平臺上的數(shù)據(jù)索引技術研究[D];中國科學技術大學;2011年
2 廖銀;動態(tài)二進制翻譯建模及其并行化研究[D];中國科學技術大學;2013年
相關碩士學位論文 前2條
1 馮X;嵌入式環(huán)境下三線性分解算法優(yōu)化技術研究[D];湖南大學;2012年
2 鐘逸;龍芯3A環(huán)境下的EJTAG調(diào)試技術[D];華中科技大學;2013年
【二級參考文獻】
相關期刊論文 前4條
1 駱志剛,李曉梅,王正華;三對角線性方程組的一種有效分布式并行算法[J];計算機研究與發(fā)展;2000年07期
2 吳少剛,章隆兵,蔡飛,顧麗紅,唐志敏;機群Open MP系統(tǒng)的設計與實現(xiàn)[J];計算機學報;2004年07期
3 蘇波;李凱;徐志廣;何頌頌;;龍芯2F上的訪存優(yōu)化[J];計算機系統(tǒng)應用;2010年01期
4 顧乃杰;李凱;陳國良;吳超;;基于龍芯2F體系結(jié)構的BLAS庫優(yōu)化[J];中國科學技術大學學報;2008年07期
【相似文獻】
相關期刊論文 前10條
1 ;一切為了數(shù)字生活 航嘉多核DH6電源[J];電腦愛好者;2006年14期
2 李靜;;使用多核電腦是浪費嗎[J];IT時代周刊;2008年Z3期
3 李曉明;王韜;劉東;杜江凌;;走進多核時代[J];計算機科學與探索;2008年06期
4 伊君翰;;基于多核處理器的并行編程模型[J];計算機工程;2009年08期
5 肖朝暉;;計算機體系結(jié)構的發(fā)展及技術問題探討[J];信息化縱橫;2009年12期
6 黃安文;高軍;張民選;;多核處理器片上存儲系統(tǒng)研究[J];計算機工程;2010年04期
7 劉俊;劉志祥;;應用Amdahl定律對多核處理器性能的分析[J];信息技術;2010年06期
8 任平;;從UTM駕馭多核看信息安全產(chǎn)品的革新[J];信息安全與技術;2010年07期
9 劉熱;;OpenMP多核技術研究及其在遺傳算法中的應用[J];沈陽大學學報;2010年05期
10 周本海;喬建忠;林樹寬;;基于多核處理器的動態(tài)共享緩存分配算法[J];東北大學學報(自然科學版);2011年01期
相關會議論文 前10條
1 劉濤;季振洲;王慶;朱素霞;;嵌入式多核平臺大容量高速存儲與增強可靠性研究[A];2010年第16屆全國信息存儲技術大會(IST2010)論文集[C];2010年
2 李鑫;竇勇;鄧林;張勁;;多核平臺下事務處理類應用性能分析及評價[A];2010年第16屆全國信息存儲技術大會(IST2010)論文集[C];2010年
3 何軍;王飆;;通用多核處理器發(fā)展現(xiàn)狀和趨勢研究[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
4 劉奇;郝守青;沈海華;章隆兵;;一種基于RAM的降低異構多核切換開銷的方法[A];2010年第16屆全國信息存儲技術大會(IST2010)論文集[C];2010年
5 陳遠知;;多核處理器的里程碑——TILE64[A];全國第三屆信號和智能信息處理與應用學術交流會?痆C];2009年
6 彭林;張小強;劉德峰;謝倫國;田祖?zhèn)?;一種挖掘多核處理器存儲級并行的算法[A];第15屆全國信息存儲技術學術會議論文集[C];2008年
7 劉杰;馬彥;葉維;高劍剛;;多核處理器存儲體系分析[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
8 陳遠知;楊帆;;Tilera多核處理器網(wǎng)絡應用研究[A];全國第五屆信號和智能信息處理與應用學術會議專刊(第一冊)[C];2011年
9 單書暢;胡瑜;李曉維;;多核處理器的核級冗余容錯技術[A];第六屆中國測試學術會議論文集[C];2010年
10 萬志濤;;基于多核處理器的面向時延敏感服務的云基礎架構[A];中國通信學會信息通信網(wǎng)絡技術委員會2011年年會論文集(上冊)[C];2011年
相關重要報紙文章 前10條
1 張云泉;并行計算:迎接多核時代的挑戰(zhàn)[N];計算機世界;2006年
2 清華大學計算機系 教授 汪東升;多核架構讓硬件變“軟”[N];計算機世界;2007年
3 本報記者 李敬;多核催熟UTM[N];計算機世界;2008年
4 專題策劃、撰稿:劉雨 編譯:天虹;多核帶來新格局[N];中國計算機報;2005年
5 清華大學計算機系 教授 鄭緯民;“多核”成為關鍵詞[N];計算機世界;2007年
6 《計算機世界》評測實驗室 吳挺;圖形工作站的多核棋局[N];計算機世界;2007年
7 劉學習;挺進多核[N];計算機世界;2006年
8 劉洪宇;x86多核技術解析[N];中國計算機報;2008年
9 評測實驗室 吳挺;主板秋點兵[N];計算機世界;2004年
10 郭長佑;多核處理器:從封裝到芯片[N];電子資訊時報;2006年
相關博士學位論文 前10條
1 侯寧;嵌入式多核處理器設計與實現(xiàn)關鍵技術研究[D];合肥工業(yè)大學;2012年
2 翟文正;基于模型的異構多核嵌入式系統(tǒng)開發(fā)研究[D];上海大學;2013年
3 王耀彬;多核平臺上支持推測并行化的事務存儲體系結(jié)構性能優(yōu)化[D];中國科學技術大學;2010年
4 鄧林;單芯片多核處理器存儲優(yōu)化技術研究[D];國防科學技術大學;2011年
5 郭御風;面向多核微處理器芯片的高效能I/O體系結(jié)構及其實現(xiàn)技術[D];國防科學技術大學;2010年
6 白明澤;多核集群上的混合并行分子動力學計算研究[D];電子科技大學;2012年
7 杜建軍;共享高速緩存多核處理器的關鍵技術研究[D];重慶大學;2011年
8 聶鵬程;多核處理器上的操作系統(tǒng)調(diào)度[D];西安電子科技大學;2013年
9 陳芳園;基于多核處理器平臺的實時系統(tǒng)WCET分析研究[D];國防科學技術大學;2011年
10 呂正;多核處理器存儲系統(tǒng)的驗證方法研究[D];西北大學;2013年
相關碩士學位論文 前10條
1 王雪梅;嵌入式多核處理器的仿真器設計[D];國防科學技術大學;2010年
2 程丹;NIOS Ⅱ多核通信及在神經(jīng)網(wǎng)絡硬件實現(xiàn)中的應用研究[D];東北師范大學;2010年
3 奚海波;并行編程技術在多核處理器上的研究與應用[D];東北師范大學;2010年
4 羅s,
本文編號:2117645
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2117645.html