天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

龍芯多核平臺上性能分析工具的設計與實現(xiàn)

發(fā)布時間:2020-08-08 05:15
【摘要】:近年來,片上多核處理器成為主流,國產(chǎn)芯片龍芯也推出了四核處理器-龍芯3A。為了充分利用多核處理器的片上資源,使多核處理器的硬件資源轉(zhuǎn)變?yōu)槌绦蛐阅艿奶嵘?并行程序設計變得越來越重要。并行程序一直是程序設計的難點,從串行程序到并行程序的改造主要依靠對程序算法的分析和對程序行為的理解,同時也需要理解硬件的運行行為,因此需要一套性能分析工具來幫助程序員分析程序和硬件的行為。 大多數(shù)現(xiàn)代處理器都集成了性能計數(shù)器(PMU),它能夠收集應用程序、操作系統(tǒng)以及處理器的性能信息,這些信息可以幫助程序找到應用程序或者操作系統(tǒng)的熱點,分析程序的運行瓶頸。本文基于龍芯3A平臺的性能計數(shù)器(PMU)實現(xiàn)了一款性能分析工具TProfiler。 本文在實現(xiàn)的過程中參考了已有的性能分析工具VTune、Oprofile以及Perf的實現(xiàn)原理,最終采用了單進程采樣。主要的研究內(nèi)容包括:(1)通過分析已有的性能調(diào)優(yōu)工具Oprofile和Perf的代碼,分析它們的實現(xiàn)原理以及各自的優(yōu)缺點,然后結合龍芯3A平臺的硬件特性,確定TProfiler的設計方案為單進程采樣的方式。(2)設計TProfiler的軟件架構,將其實現(xiàn)分為兩個模塊:前端和后端。其中前端運行于用戶層,負責分析后端收集的性能信息,指導程序員優(yōu)化代碼;后端運行于內(nèi)核層,負責控制性能計數(shù)器,收集程序運行過程中產(chǎn)生的硬件事件信息。(3)針對TProfiler的軟件架構,分別實現(xiàn)前端和后端的功能。為了支持單進程采樣,在內(nèi)核中進程相關部分添加支持單進程采樣的代碼,在進程描述符中添加支持性能計數(shù)器上下文切換的數(shù)據(jù)結構,此外為了用戶層和內(nèi)核層的數(shù)據(jù)傳遞,還添加了文件映射的功能。最后借助編譯技術并分析二進制文件將采樣信息與程序代碼對應起來產(chǎn)生對程序員有用的信息。 本文基于龍芯3A平臺的硬件性能計數(shù)器(PMU)實現(xiàn)了一個單進程采樣的性能分析工具TProfiler,它實現(xiàn)了Oprofile的大部分功能,通過與Oprofile的對比實驗,可以看到TProfiler的采樣數(shù)據(jù)更加精確,采樣范圍也更加廣泛。最后本文還提出了TProfiler需要改進的地方,并針對龍芯平臺,提出其硬件計數(shù)器(PMU)需要加強和完善的地方,并初步提出了改進的手段。
【學位授予單位】:中國科學技術大學
【學位級別】:碩士
【學位授予年份】:2011
【分類號】:TP332
【圖文】:

處理器,架構,主頻,剪刀差


這些障礙阻止了通過提高主頻來獲得性能提升的道路;其次,單個芯片可以集成的引腳數(shù)目和帶寬限制都意味著處理器和主存之間的速度的剪刀差在越拉越大。2006 年,Intel 被迫放棄了 4G 主頻的 Tejas 奔騰 4 處理器的開發(fā),這幾乎也標志著主頻至上的理論走到了盡頭,取而代之的是片上多核設計。

插樁,靜態(tài),動態(tài),工具


靜態(tài)插樁這種類型的插樁是在源代碼編譯或鏈接時完成的,它的唯一優(yōu)勢是我們復雜的功能并且對程序性能影響很小。但是,靜態(tài)插樁卻有很多限制,最一個限制是,如何執(zhí)行程序中的代碼和數(shù)據(jù)是混合放置的,靜態(tài)插樁工具取足夠的信息來分開它們;靜態(tài)插樁工具也很難處理間接分支、共享庫以產(chǎn)生的代碼。靜態(tài)插樁的最經(jīng)典的工具便是 Gcc 自帶的 Gprof(FSF,1998 動態(tài)插樁與靜態(tài)插樁相反,動態(tài)插樁在程序運行時實現(xiàn)。它克服了靜態(tài)插樁所有。動態(tài)插樁不需要重新編譯或鏈接程序,能夠處理運行中的程序以及共享為程序優(yōu)化提供了更多機會。動態(tài)插樁方面的代表性的工作包括 ATI(Srivastava,1994)、Dtrace(Cantrill,2004)、Pin(Luk, 2005)等。.2 采樣技術 基于時間的采樣

性能計數(shù)器,事件,硬件,分析性能


) 基于事件的采樣性能計數(shù)器(HPCs)越來越多的用于分析性能以及確定性能瓶頸的原因。大現(xiàn)代處理器中都帶有一定數(shù)量的性能計數(shù)器。例如:IBM POWER4 有 8 對計數(shù)器、Intel Itanium 4 個、AMDAthlon 有 4 個。這些性能計數(shù)器的功能就錄硬件事件,通過性能調(diào)優(yōu)工具的處理之后,產(chǎn)生對程序員有用的信息。基于事件的采樣是只記錄特定的硬件事件(比如 L2 Cache Miss)的發(fā)生,當達到用戶設定的閾值時就記錄一下(采一個樣)。具體的工作方式是:選擇需要記錄的硬件事件(例如:L2 Cache Miss),該事件每發(fā)生一次就觸發(fā)計數(shù)器加 1,當性能計數(shù)器的值達到設置的閾值時,就向上溢出,觸發(fā)處理內(nèi)部中斷控制器,中斷處理器進行采樣,如圖 1.3 所示是基于事件的采樣的:

【相似文獻】

相關期刊論文 前10條

1 程煊,欒靜,顧君忠;軟硬件協(xié)同設計環(huán)境中性能分析工具的研究與實現(xiàn)[J];計算機系統(tǒng)應用;2005年11期

2 盧風順;宋君強;朱小謙;;WRF三維變分同化并行程序性能分析[J];計算機工程與科學;2007年11期

3 張軍超,張兆慶;匯編代碼中的熱路徑搜尋工具[J];計算機工程;2005年16期

4 衛(wèi)興武;劉曉平;;一種實用的并行程序可視化性能分析方法[J];電腦應用技術;2007年04期

5 武劍鋒,戈弋,李三立;基于數(shù)據(jù)庫的機群檢查點的研究與實現(xiàn)[J];小型微型計算機系統(tǒng);2002年03期

6 楊小華;;利用OProfile對多核多線程進行性能分析[J];程序員;2009年05期

7 周國建;吳少剛;李祖松;史崗;;基于四階段人工優(yōu)化的軟件流水技術[J];計算機工程;2009年05期

8 戎韓桃;王曉斌;郝宗波;崔娟娜;;無陷入插裝方式的研究與設計[J];計算機應用研究;2011年01期

9 游玲;;RML for Sql Server性能分析工具的使用[J];機電技術;2010年01期

10 富弘毅,周海芳,楊學軍;OpenMP并行程序的性能數(shù)據(jù)采集[J];計算機工程;2005年19期

相關會議論文 前10條

1 ;創(chuàng)建模型,對現(xiàn)有建筑進行性能分析[A];工程三維模型與虛擬現(xiàn)實表現(xiàn)——第二屆工程建設計算機應用創(chuàng)新論壇論文集[C];2009年

2 蘇銘;王華;;基于C++及其擴展語言的動態(tài)剖析[A];計算機在土木工程中的應用——第十屆全國工程設計計算機應用學術會議論文集[C];2000年

3 靳京;陳晶;孔令富;劉海英;;基于MDS3的網(wǎng)格資源監(jiān)控系統(tǒng)體系結構[A];2005年全國理論計算機科學學術年會論文集[C];2005年

4 盧山;;山西移動BOSS存儲運維分析系統(tǒng)設計[A];兩化融合與物聯(lián)網(wǎng)發(fā)展學術研討會論文集[C];2010年

5 杜素忠;;基于事件驅(qū)動的寬厚板進程管理方法[A];全國冶金自動化信息網(wǎng)2010年年會論文集[C];2010年

6 余金鵬;葛曉;;加熱爐過程控制系統(tǒng)的優(yōu)化調(diào)整應用[A];中國計量協(xié)會冶金分會2007年會論文集[C];2007年

7 彭會軍;;.NET Remoting技術在軋鋼二級自動化系統(tǒng)中的應用[A];中國計量協(xié)會冶金分會2008年會論文集[C];2008年

8 彭會軍;;.NET Remoting技術在軋鋼二級自動化系統(tǒng)中的應用[A];2008全國第十三屆自動化應用技術學術交流會論文集[C];2008年

9 馬文騫;王珊;;DBMS進程結構研究及多線索DBMS的設計與實現(xiàn)[A];第十一屆全國數(shù)據(jù)庫學術會議論文集[C];1993年

10 張魯飛;程華;;高性能計算機容錯技術綜述[A];2010通信理論與技術新發(fā)展——第十五屆全國青年通信學術會議論文集(下冊)[C];2010年

相關重要報紙文章 前10條

1 ;引入創(chuàng)新機制和性能分析工具[N];中國電子報;2009年

2 譯自《Infoworld》;解決性能瓶頸的15種方法[N];計算機世界;2005年

3 ;Unix服務器環(huán)境的性能監(jiān)控[N];網(wǎng)絡世界;2006年

4 王宏;英特爾、中科院計算所升級ORC性能更強[N];中國計算機報;2003年

5 泰克科技(中國)有限公司;優(yōu)化UMTS網(wǎng)絡KPI出奇招[N];通信產(chǎn)業(yè)報;2005年

6 齊興一;QoS保證更需“軟管理”[N];通信產(chǎn)業(yè)報;2006年

7 時培植 劉鵬;透明化管理[N];計算機世界;2001年

8 清華大學 鄭緯民 陳文光;開發(fā)環(huán)境—搭建應用的基礎[N];計算機世界;2003年

9 本報記者 江波;Galaxy Sun未來的關鍵一筆[N];網(wǎng)絡世界;2005年

10 胡永生;高性能計算的現(xiàn)狀與未來[N];科技日報;2002年

相關博士學位論文 前6條

1 陸平靜;低開銷的迭代編譯優(yōu)化關鍵技術研究[D];國防科學技術大學;2010年

2 劉雪梅;服務器端軟件性能分析和診斷方法研究[D];哈爾濱工程大學;2010年

3 劉建新;脈沖及脈間二相編碼雷達高度表信號處理方法研究[D];電子科技大學;2004年

4 高翔;多核處理器的訪存模擬與優(yōu)化技術研究[D];中國科學技術大學;2007年

5 楊帆;基于多核平臺的網(wǎng)絡流量監(jiān)測研究與優(yōu)化[D];北京郵電大學;2011年

6 楊帆;基于多核平臺的網(wǎng)絡流量監(jiān)測研究與優(yōu)化[D];北京郵電大學;2011年

相關碩士學位論文 前10條

1 徐恒陽;龍芯多核平臺上性能分析工具的設計與實現(xiàn)[D];中國科學技術大學;2011年

2 齊學智;Java程序性能分析工具的研究與設計[D];浙江大學;2005年

3 袁立威;基于性能計數(shù)器的攻擊檢測,防御與分析[D];復旦大學;2011年

4 朱孝銀;針對多核體系結構性能調(diào)試的研究[D];復旦大學;2009年

5 殷順昌;OpenMP并行程序性能分析[D];國防科學技術大學;2006年

6 宋瀟豫;嵌入式性能分析工具的研究與設計[D];國防科學技術大學;2006年

7 崔娟娜;嵌入式環(huán)境下代碼動態(tài)性能分析的研究與實現(xiàn)[D];電子科技大學;2011年

8 譚膺;基于SMP的并行游戲樹搜索程序負載分析研究[D];電子科技大學;2006年

9 吳f[;OpenRISC處理器內(nèi)的性能計數(shù)器的設計和實現(xiàn)[D];上海交通大學;2009年

10 史鳴飛;基于性能計數(shù)器的多核處理器功耗估算[D];上海交通大學;2010年



本文編號:2785107

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2785107.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶91e03***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日本午夜免费福利视频| 亚洲天堂一区在线播放| 久久一区内射污污内射亚洲| 国产一级内射麻豆91| 男人大臿蕉香蕉大视频| 亚洲熟女精品一区二区成人| 国语对白刺激高潮在线视频| 能在线看的视频你懂的| 国产精品夜色一区二区三区不卡| 中文字幕人妻日本一区二区| 国产日韩欧美在线播放| 91欧美一区二区三区成人| 日韩黄色一级片免费收看| 国产精品免费自拍视频| 欧美性欧美一区二区三区| 成年人免费看国产视频| 国产成人免费高潮激情电| 欧美日不卡无在线一区| 日韩精品毛片视频免费看| 尤物天堂av一区二区| 日本人妻熟女一区二区三区| 精品一区二区三区免费看| 国产精品日韩精品最新| 麻豆最新出品国产精品| 91熟女大屁股偷偷对白| 亚洲av一区二区三区精品| 精品高清美女精品国产区| 成人精品一区二区三区综合 | 午夜日韩在线观看视频| 国产乱淫av一区二区三区| 成人欧美一区二区三区视频| 91人妻人人澡人人人人精品| 久久精品久久精品中文字幕| 五月激情婷婷丁香六月网| 欧美极品欧美精品欧美| 免费在线观看激情小视频| 亚洲一区二区亚洲日本| 男人的天堂的视频东京热| 国产精品一区二区香蕉视频| 久久人妻人人澡人人妻| 亚洲国产成人久久一区二区三区|