天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

龍芯多核平臺上性能分析工具的設(shè)計與實(shí)現(xiàn)

發(fā)布時間:2020-08-08 05:15
【摘要】:近年來,片上多核處理器成為主流,國產(chǎn)芯片龍芯也推出了四核處理器-龍芯3A。為了充分利用多核處理器的片上資源,使多核處理器的硬件資源轉(zhuǎn)變?yōu)槌绦蛐阅艿奶嵘?并行程序設(shè)計變得越來越重要。并行程序一直是程序設(shè)計的難點(diǎn),從串行程序到并行程序的改造主要依靠對程序算法的分析和對程序行為的理解,同時也需要理解硬件的運(yùn)行行為,因此需要一套性能分析工具來幫助程序員分析程序和硬件的行為。 大多數(shù)現(xiàn)代處理器都集成了性能計數(shù)器(PMU),它能夠收集應(yīng)用程序、操作系統(tǒng)以及處理器的性能信息,這些信息可以幫助程序找到應(yīng)用程序或者操作系統(tǒng)的熱點(diǎn),分析程序的運(yùn)行瓶頸。本文基于龍芯3A平臺的性能計數(shù)器(PMU)實(shí)現(xiàn)了一款性能分析工具TProfiler。 本文在實(shí)現(xiàn)的過程中參考了已有的性能分析工具VTune、Oprofile以及Perf的實(shí)現(xiàn)原理,最終采用了單進(jìn)程采樣。主要的研究內(nèi)容包括:(1)通過分析已有的性能調(diào)優(yōu)工具Oprofile和Perf的代碼,分析它們的實(shí)現(xiàn)原理以及各自的優(yōu)缺點(diǎn),然后結(jié)合龍芯3A平臺的硬件特性,確定TProfiler的設(shè)計方案為單進(jìn)程采樣的方式。(2)設(shè)計TProfiler的軟件架構(gòu),將其實(shí)現(xiàn)分為兩個模塊:前端和后端。其中前端運(yùn)行于用戶層,負(fù)責(zé)分析后端收集的性能信息,指導(dǎo)程序員優(yōu)化代碼;后端運(yùn)行于內(nèi)核層,負(fù)責(zé)控制性能計數(shù)器,收集程序運(yùn)行過程中產(chǎn)生的硬件事件信息。(3)針對TProfiler的軟件架構(gòu),分別實(shí)現(xiàn)前端和后端的功能。為了支持單進(jìn)程采樣,在內(nèi)核中進(jìn)程相關(guān)部分添加支持單進(jìn)程采樣的代碼,在進(jìn)程描述符中添加支持性能計數(shù)器上下文切換的數(shù)據(jù)結(jié)構(gòu),此外為了用戶層和內(nèi)核層的數(shù)據(jù)傳遞,還添加了文件映射的功能。最后借助編譯技術(shù)并分析二進(jìn)制文件將采樣信息與程序代碼對應(yīng)起來產(chǎn)生對程序員有用的信息。 本文基于龍芯3A平臺的硬件性能計數(shù)器(PMU)實(shí)現(xiàn)了一個單進(jìn)程采樣的性能分析工具TProfiler,它實(shí)現(xiàn)了Oprofile的大部分功能,通過與Oprofile的對比實(shí)驗(yàn),可以看到TProfiler的采樣數(shù)據(jù)更加精確,采樣范圍也更加廣泛。最后本文還提出了TProfiler需要改進(jìn)的地方,并針對龍芯平臺,提出其硬件計數(shù)器(PMU)需要加強(qiáng)和完善的地方,并初步提出了改進(jìn)的手段。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP332
【圖文】:

處理器,架構(gòu),主頻,剪刀差


這些障礙阻止了通過提高主頻來獲得性能提升的道路;其次,單個芯片可以集成的引腳數(shù)目和帶寬限制都意味著處理器和主存之間的速度的剪刀差在越拉越大。2006 年,Intel 被迫放棄了 4G 主頻的 Tejas 奔騰 4 處理器的開發(fā),這幾乎也標(biāo)志著主頻至上的理論走到了盡頭,取而代之的是片上多核設(shè)計。

插樁,靜態(tài),動態(tài),工具


靜態(tài)插樁這種類型的插樁是在源代碼編譯或鏈接時完成的,它的唯一優(yōu)勢是我們復(fù)雜的功能并且對程序性能影響很小。但是,靜態(tài)插樁卻有很多限制,最一個限制是,如何執(zhí)行程序中的代碼和數(shù)據(jù)是混合放置的,靜態(tài)插樁工具取足夠的信息來分開它們;靜態(tài)插樁工具也很難處理間接分支、共享庫以產(chǎn)生的代碼。靜態(tài)插樁的最經(jīng)典的工具便是 Gcc 自帶的 Gprof(FSF,1998 動態(tài)插樁與靜態(tài)插樁相反,動態(tài)插樁在程序運(yùn)行時實(shí)現(xiàn)。它克服了靜態(tài)插樁所有。動態(tài)插樁不需要重新編譯或鏈接程序,能夠處理運(yùn)行中的程序以及共享為程序優(yōu)化提供了更多機(jī)會。動態(tài)插樁方面的代表性的工作包括 ATI(Srivastava,1994)、Dtrace(Cantrill,2004)、Pin(Luk, 2005)等。.2 采樣技術(shù) 基于時間的采樣

性能計數(shù)器,事件,硬件,分析性能


) 基于事件的采樣性能計數(shù)器(HPCs)越來越多的用于分析性能以及確定性能瓶頸的原因。大現(xiàn)代處理器中都帶有一定數(shù)量的性能計數(shù)器。例如:IBM POWER4 有 8 對計數(shù)器、Intel Itanium 4 個、AMDAthlon 有 4 個。這些性能計數(shù)器的功能就錄硬件事件,通過性能調(diào)優(yōu)工具的處理之后,產(chǎn)生對程序員有用的信息;谑录牟蓸邮侵挥涗浱囟ǖ挠布录ū热 L2 Cache Miss)的發(fā)生,當(dāng)達(dá)到用戶設(shè)定的閾值時就記錄一下(采一個樣)。具體的工作方式是:選擇需要記錄的硬件事件(例如:L2 Cache Miss),該事件每發(fā)生一次就觸發(fā)計數(shù)器加 1,當(dāng)性能計數(shù)器的值達(dá)到設(shè)置的閾值時,就向上溢出,觸發(fā)處理內(nèi)部中斷控制器,中斷處理器進(jìn)行采樣,如圖 1.3 所示是基于事件的采樣的:

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 程煊,欒靜,顧君忠;軟硬件協(xié)同設(shè)計環(huán)境中性能分析工具的研究與實(shí)現(xiàn)[J];計算機(jī)系統(tǒng)應(yīng)用;2005年11期

2 盧風(fēng)順;宋君強(qiáng);朱小謙;;WRF三維變分同化并行程序性能分析[J];計算機(jī)工程與科學(xué);2007年11期

3 張軍超,張兆慶;匯編代碼中的熱路徑搜尋工具[J];計算機(jī)工程;2005年16期

4 衛(wèi)興武;劉曉平;;一種實(shí)用的并行程序可視化性能分析方法[J];電腦應(yīng)用技術(shù);2007年04期

5 武劍鋒,戈弋,李三立;基于數(shù)據(jù)庫的機(jī)群檢查點(diǎn)的研究與實(shí)現(xiàn)[J];小型微型計算機(jī)系統(tǒng);2002年03期

6 楊小華;;利用OProfile對多核多線程進(jìn)行性能分析[J];程序員;2009年05期

7 周國建;吳少剛;李祖松;史崗;;基于四階段人工優(yōu)化的軟件流水技術(shù)[J];計算機(jī)工程;2009年05期

8 戎韓桃;王曉斌;郝宗波;崔娟娜;;無陷入插裝方式的研究與設(shè)計[J];計算機(jī)應(yīng)用研究;2011年01期

9 游玲;;RML for Sql Server性能分析工具的使用[J];機(jī)電技術(shù);2010年01期

10 富弘毅,周海芳,楊學(xué)軍;OpenMP并行程序的性能數(shù)據(jù)采集[J];計算機(jī)工程;2005年19期

相關(guān)會議論文 前10條

1 ;創(chuàng)建模型,對現(xiàn)有建筑進(jìn)行性能分析[A];工程三維模型與虛擬現(xiàn)實(shí)表現(xiàn)——第二屆工程建設(shè)計算機(jī)應(yīng)用創(chuàng)新論壇論文集[C];2009年

2 蘇銘;王華;;基于C++及其擴(kuò)展語言的動態(tài)剖析[A];計算機(jī)在土木工程中的應(yīng)用——第十屆全國工程設(shè)計計算機(jī)應(yīng)用學(xué)術(shù)會議論文集[C];2000年

3 靳京;陳晶;孔令富;劉海英;;基于MDS3的網(wǎng)格資源監(jiān)控系統(tǒng)體系結(jié)構(gòu)[A];2005年全國理論計算機(jī)科學(xué)學(xué)術(shù)年會論文集[C];2005年

4 盧山;;山西移動BOSS存儲運(yùn)維分析系統(tǒng)設(shè)計[A];兩化融合與物聯(lián)網(wǎng)發(fā)展學(xué)術(shù)研討會論文集[C];2010年

5 杜素忠;;基于事件驅(qū)動的寬厚板進(jìn)程管理方法[A];全國冶金自動化信息網(wǎng)2010年年會論文集[C];2010年

6 余金鵬;葛曉;;加熱爐過程控制系統(tǒng)的優(yōu)化調(diào)整應(yīng)用[A];中國計量協(xié)會冶金分會2007年會論文集[C];2007年

7 彭會軍;;.NET Remoting技術(shù)在軋鋼二級自動化系統(tǒng)中的應(yīng)用[A];中國計量協(xié)會冶金分會2008年會論文集[C];2008年

8 彭會軍;;.NET Remoting技術(shù)在軋鋼二級自動化系統(tǒng)中的應(yīng)用[A];2008全國第十三屆自動化應(yīng)用技術(shù)學(xué)術(shù)交流會論文集[C];2008年

9 馬文騫;王珊;;DBMS進(jìn)程結(jié)構(gòu)研究及多線索DBMS的設(shè)計與實(shí)現(xiàn)[A];第十一屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1993年

10 張魯飛;程華;;高性能計算機(jī)容錯技術(shù)綜述[A];2010通信理論與技術(shù)新發(fā)展——第十五屆全國青年通信學(xué)術(shù)會議論文集(下冊)[C];2010年

相關(guān)重要報紙文章 前10條

1 ;引入創(chuàng)新機(jī)制和性能分析工具[N];中國電子報;2009年

2 譯自《Infoworld》;解決性能瓶頸的15種方法[N];計算機(jī)世界;2005年

3 ;Unix服務(wù)器環(huán)境的性能監(jiān)控[N];網(wǎng)絡(luò)世界;2006年

4 王宏;英特爾、中科院計算所升級ORC性能更強(qiáng)[N];中國計算機(jī)報;2003年

5 泰克科技(中國)有限公司;優(yōu)化UMTS網(wǎng)絡(luò)KPI出奇招[N];通信產(chǎn)業(yè)報;2005年

6 齊興一;QoS保證更需“軟管理”[N];通信產(chǎn)業(yè)報;2006年

7 時培植 劉鵬;透明化管理[N];計算機(jī)世界;2001年

8 清華大學(xué) 鄭緯民 陳文光;開發(fā)環(huán)境—搭建應(yīng)用的基礎(chǔ)[N];計算機(jī)世界;2003年

9 本報記者 江波;Galaxy Sun未來的關(guān)鍵一筆[N];網(wǎng)絡(luò)世界;2005年

10 胡永生;高性能計算的現(xiàn)狀與未來[N];科技日報;2002年

相關(guān)博士學(xué)位論文 前6條

1 陸平靜;低開銷的迭代編譯優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年

2 劉雪梅;服務(wù)器端軟件性能分析和診斷方法研究[D];哈爾濱工程大學(xué);2010年

3 劉建新;脈沖及脈間二相編碼雷達(dá)高度表信號處理方法研究[D];電子科技大學(xué);2004年

4 高翔;多核處理器的訪存模擬與優(yōu)化技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2007年

5 楊帆;基于多核平臺的網(wǎng)絡(luò)流量監(jiān)測研究與優(yōu)化[D];北京郵電大學(xué);2011年

6 楊帆;基于多核平臺的網(wǎng)絡(luò)流量監(jiān)測研究與優(yōu)化[D];北京郵電大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 徐恒陽;龍芯多核平臺上性能分析工具的設(shè)計與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2011年

2 齊學(xué)智;Java程序性能分析工具的研究與設(shè)計[D];浙江大學(xué);2005年

3 袁立威;基于性能計數(shù)器的攻擊檢測,防御與分析[D];復(fù)旦大學(xué);2011年

4 朱孝銀;針對多核體系結(jié)構(gòu)性能調(diào)試的研究[D];復(fù)旦大學(xué);2009年

5 殷順昌;OpenMP并行程序性能分析[D];國防科學(xué)技術(shù)大學(xué);2006年

6 宋瀟豫;嵌入式性能分析工具的研究與設(shè)計[D];國防科學(xué)技術(shù)大學(xué);2006年

7 崔娟娜;嵌入式環(huán)境下代碼動態(tài)性能分析的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2011年

8 譚膺;基于SMP的并行游戲樹搜索程序負(fù)載分析研究[D];電子科技大學(xué);2006年

9 吳f[;OpenRISC處理器內(nèi)的性能計數(shù)器的設(shè)計和實(shí)現(xiàn)[D];上海交通大學(xué);2009年

10 史鳴飛;基于性能計數(shù)器的多核處理器功耗估算[D];上海交通大學(xué);2010年



本文編號:2785107

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2785107.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶91e03***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com