虛擬機環(huán)境下基于PMU的NUMA性能剖析方法及工具
本文關(guān)鍵詞:虛擬機環(huán)境下基于PMU的NUMA性能剖析方法及工具,由筆耕文化傳播整理發(fā)布。
【摘要】:由于NUMA(Non-Uniform Memory Access)架構(gòu)良好的可擴展性和易編程性等優(yōu)點,使得NUMA架構(gòu)平臺成為高性能計算乃至云計算的主要基礎(chǔ)設(shè)施,同時由于虛擬機的高度隔離性、易于讓用戶接受、支持不同的操作系統(tǒng)和應(yīng)用程序、低風險和易于維護等特性,使得虛擬機無論是在個人PC還是在商業(yè)服務(wù)器上都被使用得非常廣泛,NUMA架構(gòu)硬件設(shè)施結(jié)合虛擬機技術(shù)已經(jīng)成為云計算中的一種核心的平臺環(huán)境。在非虛擬化環(huán)境下,有較多的性能剖析工具可以用于NUMA平臺的性能剖析,也有許多相關(guān)的性能剖析與優(yōu)化的研究成果,從現(xiàn)有的論文和報告中可以看出在虛擬機環(huán)境下仍然有許多對NUMA平臺優(yōu)化的工作可做,但由于在虛擬機環(huán)境下上層的客戶虛擬機無法感知底層的NUMA硬件架構(gòu)以及相應(yīng)的性能剖析工具的缺乏,導(dǎo)致在虛擬機環(huán)境下對NUMA平臺的性能剖析與優(yōu)化的研究工作相對較少,而且集中在虛擬機管理和vcpu調(diào)度上,缺乏從真實平臺的微架構(gòu)角度進行性能剖析和優(yōu)化。本文旨在提取和歸納NUMA平臺的性能因素,設(shè)計并實現(xiàn)一種能適應(yīng)于虛擬機環(huán)境下的NUMA平臺性能剖析工具,使用此工具,從NUMA平臺微架構(gòu)的角度提出一種能檢測和評估虛擬機環(huán)境下NUMA平臺各節(jié)點出現(xiàn)這些性能瓶頸因素的方法,以指導(dǎo)在虛擬機環(huán)境下從vcpu調(diào)度方面對NUMA平臺進行性能優(yōu)化。本文首先以Intel westmere微架構(gòu)為例研究NUMA平臺的微架構(gòu)及其訪存數(shù)據(jù)流特點,提取和總結(jié)影響NUMA架構(gòu)性能的主要因素,包括傳統(tǒng)的NUMA性能瓶頸因素(訪存局部性因素,最后一級cache競爭因素,cache數(shù)據(jù)共享問題和內(nèi)存帶寬競爭因素)以及本文新提出的GQ緩沖隊列的競爭因素,并且設(shè)計一個基準程序,通過實驗對這五個主要性能因素進行驗證和分析說明。接著,在了解了NUMA平臺微架構(gòu)和NUMA平臺性能瓶頸問題的基礎(chǔ)上,設(shè)計并實現(xiàn)一種基于處理器內(nèi)部性能監(jiān)控單元(PMU)的適應(yīng)于虛擬機環(huán)境下對NUMA平臺進行性能剖析的工具(暫命名為VMMprof)。從公開文獻看,VMMprof是首個在xen虛擬機上完善支持NUMA Uncore部分的性能剖析的工具,并且VMMprof靈活的支持用戶自定義的剖析模式,支持多用戶同時進行不同的性能事件剖析,支持通過遠程進行性能剖析,而且擁有良好的圖形操作界面。并通過實驗對該工具的進行了正確性驗證。最后結(jié)合前面分析得到的NUMA架構(gòu)的主要性能瓶頸因素,利用VMMprof工具,提出一種虛擬機環(huán)境下NUMA平臺各節(jié)點的性能瓶頸因素的檢測和評估方法,實驗結(jié)果表明,通過此方法能正確的發(fā)現(xiàn)和評估虛擬機環(huán)境下底層硬件NUMA平臺各個節(jié)點的性能瓶頸問題,根據(jù)上述分析,我們又從vcpu調(diào)度的角度對虛擬機環(huán)境下各個節(jié)點出現(xiàn)的這些性能瓶頸問題提出了基本的優(yōu)化思路。
【關(guān)鍵詞】:NUMA PMU 虛擬機 性能剖析
【學(xué)位授予單位】:深圳大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP302
【目錄】:
- 摘要4-6
- Abstract6-10
- 第一章 緒論10-17
- 1.1 研究背景10-11
- 1.2 研究意義11-12
- 1.3 國內(nèi)外研究現(xiàn)狀12-15
- 1.4 論文結(jié)構(gòu)15-17
- 第二章NUMA性能因素分析17-29
- 2.1 NUMA架構(gòu)17-19
- 2.2 NUMA訪存通路19-21
- 2.3 NUMA性能因素的提取與驗證21-27
- 2.3.1 實驗平臺與基準程序22-24
- 2.3.2 測試方法24-25
- 2.3.3 驗證與分析25-27
- 2.4 小結(jié)27-29
- 第三章VMMprof的設(shè)計與實現(xiàn)29-43
- 3.1 虛擬機29-30
- 3.2 性能監(jiān)控單元(PMU)30-32
- 3.3 總體設(shè)計32-33
- 3.4 詳細設(shè)計33-37
- 3.4.1 hypercall層設(shè)計33-34
- 3.4.2 PMU操作功能接口層設(shè)計34
- 3.4.3 服務(wù)端設(shè)計34-35
- 3.4.4 客戶端設(shè)計35-37
- 3.5 VMMprof測試37-42
- 3.5.1 核內(nèi)部分的性能剖析37-39
- 3.5.2 Uncore部分性能剖析39-42
- 3.6 小結(jié)42-43
- 第四章VM中NUMA性能瓶頸剖析43-58
- 4.1 VM中NUMA布局綁定43-45
- 4.2 性能瓶頸剖析方法與驗證45-56
- 4.2.1 訪存局部性46-48
- 4.2.2 GQ緩沖隊列競爭48-49
- 4.2.3 LLC競爭49-52
- 4.2.4 Sharing overhead52-54
- 4.2.5 IMC帶寬競爭54-56
- 4.4 優(yōu)化思路56
- 4.5 小結(jié)56-58
- 第五章 總結(jié)與展望58-60
- 5.1 論文總結(jié)58-59
- 5.2 展望59-60
- 參考文獻60-64
- 致謝64-65
- 攻讀碩士學(xué)位期間的研究成果65-66
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 孫琳琳;侯秀萍;朱波;孫士明;高燦;;基于多線程歸并排序算法設(shè)計[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2015年01期
2 王文義;冉曉龍;;關(guān)于多核系統(tǒng)并行程序效率的編程因素及其研究[J];計算機科學(xué);2015年08期
3 唐龍;何冰;張武;;MPI+OpenMP混合編程在三維電磁輻射計算中的應(yīng)用[J];微電子學(xué)與計算機;2014年08期
4 詹治海;;基于混合并行模型的熱傳導(dǎo)問題研究及測試[J];電子測試;2015年05期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 張向洪;高超聲速流場電磁干擾數(shù)值模擬研究[D];南京航空航天大學(xué);2013年
2 王希忠;基于MPI的分段線性混沌映射加密算法的研究[D];哈爾濱理工大學(xué);2014年
3 林天軍;二維/三維非結(jié)構(gòu)化動態(tài)混合網(wǎng)格變形方法研究[D];大連理工大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 李滋田;基于OpenMP的多核多線程負載均衡調(diào)度策略研究[D];西安工業(yè)大學(xué);2014年
2 朱長皓;基于框圖模型的自動生成并行代碼的研究[D];中國科學(xué)技術(shù)大學(xué);2014年
3 王雅娟;腔內(nèi)電阻抗成像正問題邊界元法求解的并行計算研究[D];河北工業(yè)大學(xué);2014年
4 施偉;GPP平臺無線信號通用多線程并行處理技術(shù)[D];北京郵電大學(xué);2014年
5 李瑩;基于共享存儲結(jié)構(gòu)的并行化技術(shù)及其優(yōu)化問題的研究[D];中國石油大學(xué)(華東);2013年
本文關(guān)鍵詞:虛擬機環(huán)境下基于PMU的NUMA性能剖析方法及工具,由筆耕文化傳播整理發(fā)布。
,本文編號:269760
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/269760.html