基于SMP集群的性能優(yōu)化方法的研究
發(fā)布時(shí)間:2023-12-08 20:33
80年代初的Intel 8088微處理器,運(yùn)行在4.77MHz的頻率之上。二十多年過去了,目前市面上最快的微處理器Intel XERO 3.8GHz的速度比那個(gè)時(shí)候提高了600多倍。 今天的軟件比起以前那些僅僅基于文本界面的簡(jiǎn)單應(yīng)用要復(fù)雜多了而且還集成了更多功能。從游戲軟件,商業(yè)軟件到用于科學(xué)計(jì)算的軟件,它們需要使用比以前更多的計(jì)算機(jī)資源,而且對(duì)于它們來說,目前的資源還遠(yuǎn)遠(yuǎn)不夠。一個(gè)應(yīng)用程序的性能完全取決于程序員是如何實(shí)現(xiàn)它的特性或者如何去解決這個(gè)應(yīng)用的。高度優(yōu)化的應(yīng)用能夠在速度上數(shù)十倍于性能很差的應(yīng)用。使用一個(gè)優(yōu)秀的算法和非常好的設(shè)計(jì)去實(shí)現(xiàn)它能夠帶來軟件性能上質(zhì)的變化。 本文以一個(gè)優(yōu)化相關(guān)器為例子來說明性能優(yōu)化的方法學(xué)及其重要性。 21CMA利用綜合孔徑成像原理,把天線采集的電壓信號(hào)進(jìn)行快速傅立葉變換后再做相關(guān)運(yùn)算,獲得復(fù)可見度函數(shù),再分析成圖。采集的數(shù)據(jù)量相當(dāng)大(每天約1.38PB),要求現(xiàn)場(chǎng)作相關(guān)運(yùn)算,這樣可把每天存儲(chǔ)數(shù)據(jù)量壓縮至890GB(假設(shè)積分10秒存盤一次),且得到了數(shù)據(jù)分析所需的最小單位。以往被正式應(yīng)用的相關(guān)器都是在硬件上實(shí)現(xiàn)的,存在著開發(fā)周期長(zhǎng)...
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
第一章 項(xiàng)目背景
1.1 課題的來源和意義:
1.2 主要任務(wù)
1.3 國(guó)內(nèi)外研究現(xiàn)狀:
第二章 SMP集群
2.1 集群
2.1.1 集群的概念
2.1.2 集群的重要指標(biāo)
2.2 對(duì)稱多處理器(SMP,Symmetrical Multi-Processing)
2.3 Infiniband
2.4 Linux
2.5 21CMA集群的優(yōu)化
2.5.1 優(yōu)化策略
2.5.2 不同實(shí)現(xiàn)方法的比較
2.5.3 使用Intel C Compiler
2.5.4 Linux 2.6.12內(nèi)核帶來的性能變化
第三章 性能優(yōu)化方法的探討
3.1 性能優(yōu)化的必要性
3.2 性能優(yōu)化方法的分析與討論
3.3 使用正確的工具
3.3.1 Intel VTune performance Analyzer
3.3.2 Intel Performance Primitives
3.3.3 Intel Thread Check
3.3.4 Intel Thread Profiler
第四章 MPI+OpenMP混合編程模型的實(shí)現(xiàn)
4.1 MPI
4.2 OpenMP:基于命令的并行編程標(biāo)準(zhǔn)
4.3 OpenMP+MPI混合編程模式
4.3.1 混合編程模式的實(shí)現(xiàn)
4.3.2 OpenMP+MPI混合編程模式的優(yōu)缺點(diǎn)分析比較
4.4 實(shí)際的測(cè)試以及結(jié)果分析
4.4.1 實(shí)驗(yàn)基本環(huán)境
4.4.2 Jacobi迭代實(shí)驗(yàn)
4.4.3 通信與計(jì)算重疊實(shí)驗(yàn)
4.4.4 試驗(yàn)結(jié)果分析
4.5 混合模型對(duì)于21CMA的優(yōu)化
第五章 相關(guān)器的優(yōu)化
5.1 相關(guān)算法的理論依據(jù)
5.2 21CMA相關(guān)器的數(shù)據(jù)流程
5.3 相關(guān)器主要部分的優(yōu)化
5.3.1 FFT模塊的優(yōu)化
5.3.2 相關(guān)計(jì)算模塊的優(yōu)化策略
5.3.3 相關(guān)模塊的優(yōu)化過程
5.3.4 利用Cache重用原則
第六章 結(jié)束語
6.1 目前數(shù)據(jù)分析成圖的成果
6.2 集群規(guī)模擴(kuò)大
6.3 未來工作的展望
參考文獻(xiàn)
致謝
本文編號(hào):3871105
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
第一章 項(xiàng)目背景
1.1 課題的來源和意義:
1.2 主要任務(wù)
1.3 國(guó)內(nèi)外研究現(xiàn)狀:
第二章 SMP集群
2.1 集群
2.1.1 集群的概念
2.1.2 集群的重要指標(biāo)
2.2 對(duì)稱多處理器(SMP,Symmetrical Multi-Processing)
2.3 Infiniband
2.4 Linux
2.5 21CMA集群的優(yōu)化
2.5.1 優(yōu)化策略
2.5.2 不同實(shí)現(xiàn)方法的比較
2.5.3 使用Intel C Compiler
2.5.4 Linux 2.6.12內(nèi)核帶來的性能變化
第三章 性能優(yōu)化方法的探討
3.1 性能優(yōu)化的必要性
3.2 性能優(yōu)化方法的分析與討論
3.3 使用正確的工具
3.3.1 Intel VTune performance Analyzer
3.3.2 Intel Performance Primitives
3.3.3 Intel Thread Check
3.3.4 Intel Thread Profiler
第四章 MPI+OpenMP混合編程模型的實(shí)現(xiàn)
4.1 MPI
4.2 OpenMP:基于命令的并行編程標(biāo)準(zhǔn)
4.3 OpenMP+MPI混合編程模式
4.3.1 混合編程模式的實(shí)現(xiàn)
4.3.2 OpenMP+MPI混合編程模式的優(yōu)缺點(diǎn)分析比較
4.4 實(shí)際的測(cè)試以及結(jié)果分析
4.4.1 實(shí)驗(yàn)基本環(huán)境
4.4.2 Jacobi迭代實(shí)驗(yàn)
4.4.3 通信與計(jì)算重疊實(shí)驗(yàn)
4.4.4 試驗(yàn)結(jié)果分析
4.5 混合模型對(duì)于21CMA的優(yōu)化
第五章 相關(guān)器的優(yōu)化
5.1 相關(guān)算法的理論依據(jù)
5.2 21CMA相關(guān)器的數(shù)據(jù)流程
5.3 相關(guān)器主要部分的優(yōu)化
5.3.1 FFT模塊的優(yōu)化
5.3.2 相關(guān)計(jì)算模塊的優(yōu)化策略
5.3.3 相關(guān)模塊的優(yōu)化過程
5.3.4 利用Cache重用原則
第六章 結(jié)束語
6.1 目前數(shù)據(jù)分析成圖的成果
6.2 集群規(guī)模擴(kuò)大
6.3 未來工作的展望
參考文獻(xiàn)
致謝
本文編號(hào):3871105
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3871105.html
最近更新
教材專著