面向多核競(jìng)爭(zhēng)環(huán)境的多線程應(yīng)用優(yōu)化方法研究

發(fā)布時(shí)間：2020-01-21 09:15

【摘要】：隨著多核處理器的迅猛普及,計(jì)算機(jī)編程模式由傳統(tǒng)串行編程模式向線程級(jí)并行編程模式轉(zhuǎn)變,以發(fā)揮出與核數(shù)量的增長(zhǎng)相一致的實(shí)際效果。由于多核機(jī)器具有充足的計(jì)算資源和內(nèi)存容量,為了最大化資源的利用率,單臺(tái)多核機(jī)器往往并發(fā)運(yùn)行多個(gè)多線程應(yīng)用,或者被多個(gè)運(yùn)行多線程應(yīng)用的虛擬機(jī)所共享,使多線程應(yīng)用陷于CPU資源的競(jìng)爭(zhēng)。例如,VMware于2010年發(fā)表的研究成果表明,在云計(jì)算環(huán)境下,平均每個(gè)處理器核被4個(gè)虛擬CPU(Virtual CPU,VCPU)時(shí)分復(fù)用。在這種多核競(jìng)爭(zhēng)環(huán)境下,多線程應(yīng)用中的無(wú)用線程(比如同步操作中的忙等線程)會(huì)浪費(fèi)原本可以分配給有用線程的CPU資源,嚴(yán)重影響應(yīng)用的性能。因此,如何有效地利用寶貴的CPU資源,是使多線程應(yīng)用在多核競(jìng)爭(zhēng)環(huán)境下高效執(zhí)行的關(guān)鍵問(wèn)題。首先,大量多線程應(yīng)用是基于單個(gè)程序多數(shù)據(jù)(Single Program Multiple Data,SPMD)編程模型實(shí)現(xiàn)的。SPMD編程模型由計(jì)算階段和強(qiáng)制障礙(Barrier)同步通信交替組成。因此,多線程應(yīng)用的性能很大程度上取決于Barrier同步延時(shí)。但是,在多應(yīng)用并發(fā)執(zhí)行的環(huán)境下,Barrier同步延時(shí)會(huì)被極大延長(zhǎng)。這是因?yàn)楫?dāng)前大多數(shù)操作系統(tǒng)無(wú)法感知到多線程應(yīng)用中的同步操作,以至于尚未到達(dá)Barrier同步點(diǎn)的線程沒(méi)有被及時(shí)調(diào)度。在Barrier同步期間,處于忙等狀態(tài)的線程可能會(huì)浪費(fèi)CPU資源;當(dāng)忙等線程被阻塞后,它們又可能將自己的CPU資源讓給其它應(yīng)用。這會(huì)極大地影響系統(tǒng)的整體吞吐量和公平性。為了解決這些問(wèn)題,一種多核競(jìng)爭(zhēng)環(huán)境下的Barrier同步策略(代號(hào)為Tidon)將等待線程的時(shí)間片捐獻(xiàn)給它們被搶占、落后的姊妹線程。其中,姊妹線程是指來(lái)自相同應(yīng)用的線程。在這種方式下,等待線程可以直接輔助同步操作的完成。實(shí)驗(yàn)結(jié)果表明,在多應(yīng)用并發(fā)執(zhí)行的環(huán)境下,Tidon能夠?yàn)锽arrier密集型應(yīng)用帶來(lái)最高17.9倍的性能加速,同時(shí)不損害甚至提升非Barrier密集型應(yīng)用的性能,從而保障并發(fā)應(yīng)用之間的性能公平性。此外,Tidon在虛擬化環(huán)境下同樣有效。其次,平衡線程間的任務(wù)量是保障多線程應(yīng)用高效運(yùn)行于多核平臺(tái)的重要手段。這是因?yàn)槎嗑€程應(yīng)用通常要等待所有線程完成分配的任務(wù)后,才算運(yùn)行完畢。任務(wù)竊取(Work-stealing)技術(shù)是廣泛用于動(dòng)態(tài)保障多線程應(yīng)用負(fù)載均衡的方法。但是,前人的工作證明,Work-stealing技術(shù)在諸如傳統(tǒng)多應(yīng)用并發(fā)和虛擬化環(huán)境這樣的競(jìng)爭(zhēng)環(huán)境下,存在效率低下的問(wèn)題。這是因?yàn)閃ork-stealing中的小偷線程會(huì)浪費(fèi)CPU資源。盡管目前存在優(yōu)化Work-stealing在傳統(tǒng)多應(yīng)用并發(fā)環(huán)境下性能的方法,但是尚未存在改善Work-stealing在虛擬化環(huán)境下性能的有效方法。虛擬化引入的語(yǔ)義鴻溝和兩層調(diào)度問(wèn)題,增加了虛擬化環(huán)境下Work-stealing優(yōu)化的困難。為此,一種虛擬化環(huán)境下面向Work-stealing的性能優(yōu)化方法(代號(hào)為Robinhood)在客戶操作系統(tǒng)和虛擬機(jī)監(jiān)控器這兩個(gè)層面,利用小偷線程的CPU資源來(lái)加速有用線程的執(zhí)行進(jìn)度,以致于減少應(yīng)用的執(zhí)行時(shí)間。實(shí)驗(yàn)結(jié)果表明,與Cilk++和BWS(Balanced Work Stealing)相比,Robinhood能夠分別為Work-stealing帶來(lái)最高90%和72%的性能提升。最后,數(shù)據(jù)并行應(yīng)用是云計(jì)算環(huán)境下的典型應(yīng)用。多核平臺(tái)強(qiáng)大的處理能力和迅猛的發(fā)展趨勢(shì)使其在數(shù)據(jù)并行應(yīng)用領(lǐng)域有著極為廣闊的前景。MapReduce作為最初針對(duì)集群平臺(tái)設(shè)計(jì)和實(shí)現(xiàn)的數(shù)據(jù)并行編程模型,亦被許多研究者證明可作為單機(jī)多核環(huán)境下易用、高性能的并行編程模型。與此同時(shí),隨著云計(jì)算環(huán)境下運(yùn)行于單機(jī)多核平臺(tái)的虛擬機(jī)數(shù)量不斷增加,CPU資源變得越來(lái)越寶貴。但是,現(xiàn)有單機(jī)多核平臺(tái)上的MapReduce系統(tǒng)更多的關(guān)注于通用性而缺乏針對(duì)性,使其在某些應(yīng)用領(lǐng)域和計(jì)算需求下會(huì)產(chǎn)生不必要的開銷,以至于浪費(fèi)CPU資源。為此,一種面向單機(jī)多核平臺(tái)的可定制MapReduce系統(tǒng)(代號(hào)為Peacock)通過(guò)建立一種應(yīng)用分類模型,將基于MapReduce的多線程應(yīng)用劃分為四種不同的類型,并為不同類型的應(yīng)用定制高效的執(zhí)行流程,從根本上減少應(yīng)用中的不必要開銷。實(shí)驗(yàn)結(jié)果表明,與當(dāng)前單機(jī)多核平臺(tái)最為成功的MapReduce系統(tǒng)Phoenix++相比,Peacock能夠?yàn)椴划a(chǎn)生具有相同鍵的中間數(shù)據(jù)對(duì)應(yīng)用帶來(lái)最高3.6倍的性能加速。綜上所述,通過(guò)從不同角度研究如何增強(qiáng)多線程應(yīng)用對(duì)CPU資源的有效利用,形成一系列面向多核競(jìng)爭(zhēng)環(huán)境的多線程應(yīng)用優(yōu)化方法,可以有效保證多線程應(yīng)用在多核競(jìng)爭(zhēng)環(huán)境下的性能。
【圖文】：

測(cè)試應(yīng)用,間隔時(shí)間,細(xì)粒度

華中科技大學(xué) 博士學(xué) 位論文多核系統(tǒng)中的共享內(nèi)存應(yīng)用程序的發(fā)展趨勢(shì)。圖 2.6 描述了這些測(cè)試應(yīng)用在測(cè)試平臺(tái)上運(yùn)行的 Barrier 同步之間的平均間隔時(shí)間�；� Barrier 同步之間的平均間隔時(shí)間，本章將測(cè)試應(yīng)用分為三類：細(xì)粒度應(yīng)用、中等粒度應(yīng)用，以及粗粒度應(yīng)用。本章將細(xì)粒度應(yīng)用和中等粒度應(yīng)用統(tǒng)稱為 Barrier 同步密集型應(yīng)用。

并發(fā)執(zhí)行,細(xì)粒度,吞吐量

盡管 BS-De 和 BS-Pa 能夠在很大程度上解決 Barrier 密集型應(yīng)用的性能損耗，但是，在大多數(shù)情況下，CFS-De 可以獲取比這兩種策略更高的系統(tǒng)吞吐量。正如 2.2.3小節(jié)所分析的那樣，在平衡調(diào)度的支持下，EP 的所有線程都會(huì)被分配到相對(duì)較高負(fù)載的處理器核。而在 CFS 的支持下，來(lái)自 EP 的線程有可能被分配到相對(duì)較低負(fù)載的處理器核。因此，在平衡調(diào)度的支持下，由于處理器核上的負(fù)載越高，調(diào)度延時(shí)更大，EP 的性能會(huì)相對(duì)較差，從而覆蓋了主應(yīng)用性能的相對(duì)提升，降低了系統(tǒng)的整體吞吐量。除了 EP 和 EP 并發(fā)執(zhí)行的組合外，Tidon 可以在不明顯降低甚至提升 EP 性能的基礎(chǔ)上，緩解 Barrier 密集型應(yīng)用的性能損耗，從而在所有策略中獲取了最好的系統(tǒng)吞吐量。例如，當(dāng) BT 和兩線程的 EP 并發(fā)執(zhí)行時(shí)，，與其它四種策略相比，BT 在 Tidon 支持下的性能被提升了 59%到 110%，同時(shí) EP 的性能被提升了 40%到 163%，以至于將系統(tǒng)吞吐量提升了 64%到 102%。這是因?yàn)?Tidon 通過(guò)利用時(shí)間片捐獻(xiàn)策略來(lái)加速Barrier 同步操作的完成，提高了 CFS 在系統(tǒng)吞吐量方面的優(yōu)勢(shì)，從而提升了寶貴的
【學(xué)位授予單位】：華中科技大學(xué)
【學(xué)位級(jí)別】：博士
【學(xué)位授予年份】：2016
【分類號(hào)】：TP332

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 陳超;;高性能可移植的多核多線程解決方案[J];科技廣場(chǎng);2010年03期

2 董曉瑩;多線程在C#中的應(yīng)用[J];安徽職業(yè)技術(shù)學(xué)院學(xué)報(bào);2005年02期

3 朱建軍;肖小聰;陳武;;C#多線程應(yīng)用探究[J];湘潭師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2006年03期

4 周廣川;;多線程應(yīng)用程序調(diào)試技術(shù)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2011年03期

5 尹華成;;C++BUILDER中——多線程的實(shí)現(xiàn)[J];中文信息;2002年04期

6 孫志于;;用Visual Basic.NET開發(fā)多線程應(yīng)用程序[J];新疆氣象;2006年02期

7 李太君,張樹亮;利用Visual Basic.Net開發(fā)多線程應(yīng)用程序[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2002年11期

8 穆振海,唐建清;多線程在C++Builder中的實(shí)現(xiàn)[J];桂林航天工業(yè)高等�？茖W(xué)校學(xué)報(bào);2004年01期

9 孟鉑;樊新華;;Java的多線程應(yīng)用[J];電腦知識(shí)與技術(shù);2006年23期

10 冉彥中;許志軍;曹婧華;;基于Delphi多線程局域網(wǎng)IP信息采集的實(shí)現(xiàn)[J];長(zhǎng)春師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年08期

相關(guān)重要報(bào)紙文章前4條

1 Mache Creeger;多核的大眾時(shí)代尚未到來(lái)[N];網(wǎng)絡(luò)世界;2006年

2 本報(bào)記者謝文硯;i系列：展望十年[N];網(wǎng)絡(luò)世界;2005年

3 本報(bào)記者張群英;關(guān)于多內(nèi)核的提速問(wèn)題[N];網(wǎng)絡(luò)世界;2005年

4 代;戴爾為頂級(jí)游戲玩家打造專用PC[N];消費(fèi)日?qǐng)?bào);2007年

相關(guān)博士學(xué)位論文前1條

1 彭亞瓊;面向多核競(jìng)爭(zhēng)環(huán)境的多線程應(yīng)用優(yōu)化方法研究[D];華中科技大學(xué);2016年

相關(guān)碩士學(xué)位論文前2條

1 趙俊濤;嵌入式aCoral多線程調(diào)試器的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

2 譚柯;多線程環(huán)境下的軟件事務(wù)內(nèi)存模型研究[D];重慶大學(xué);2009年

本文編號(hào)：2571537

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/shoufeilunwen/xxkjbs/2571537.html

上一篇：集中式MIMO雷達(dá)陣列配置與參數(shù)估計(jì)研究
下一篇：基于LTE的地空無(wú)線寬帶通信系統(tǒng)的頻偏和時(shí)偏估計(jì)研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向多核競(jìng)爭(zhēng)環(huán)境的多線程應(yīng)用優(yōu)化方法研究