NUMA架構(gòu)內(nèi)多個節(jié)點間訪存延時平衡的內(nèi)存分配策略
本文選題:NUMA架構(gòu) 切入點:內(nèi)存分配策略 出處:《計算機(jī)學(xué)報》2017年09期 論文類型:期刊論文
【摘要】:隨著多核架構(gòu)的發(fā)展和普及,NUMA多核架構(gòu)憑借其本地訪存低延時的優(yōu)勢,被各大商業(yè)數(shù)據(jù)中心以及科學(xué)計算集群廣泛采用.NUMA架構(gòu)通過增加多個內(nèi)存控制器,緩解了多核架構(gòu)下對同一個內(nèi)存控制器的爭用問題,但同時也增加了內(nèi)存管理的負(fù)擔(dān).Linux的系統(tǒng)開發(fā)者為了實現(xiàn)充分利用NUMA本地訪存低延時的特點,在為進(jìn)程分配內(nèi)存時,選擇進(jìn)程當(dāng)前正在運行的NUMA節(jié)點作為分配內(nèi)存的目標(biāo)節(jié)點.這種分配會導(dǎo)致進(jìn)/線程之間共享內(nèi)存的不公平.例如,一個在當(dāng)前本地節(jié)點被分配很多內(nèi)存的進(jìn)程,可能被調(diào)度到遠(yuǎn)端節(jié)點運行,這樣會導(dǎo)致進(jìn)程的性能波動.針對這一問題,該文設(shè)計了一種保證NUMA架構(gòu)內(nèi)各內(nèi)存節(jié)點間訪存延時平衡的內(nèi)存分配策略,并在Linux系統(tǒng)中實現(xiàn)和驗證.延時的獲取方法依賴平臺,但是系統(tǒng)內(nèi)核的策略是通用的.實驗結(jié)果表明,與Linux默認(rèn)的內(nèi)存分配策略相比,進(jìn)/線程間的不公平性平均降低了16%(最多34%),并且各進(jìn)/線程的性能沒有較大抖動.
[Abstract]:With the development of multi-core architecture and the popularization of Numa multi-core architecture, with the advantage of local access and low latency, it has been widely used in various commercial data centers and scientific computing clusters by adding multiple memory controllers. It alleviates the contention for the same memory controller under the multi-core architecture, but also increases the burden of memory management. In order to make full use of the low latency of local memory access of NUMA, the system developer allocates memory for the process. Select the NUMA node currently running by the process as the target node for allocating memory. This allocation can result in an unfair sharing of memory between threads. For example, a process where a large amount of memory is allocated at the current local node, This paper proposes a memory allocation strategy to ensure the balance of memory access delay between memory nodes in NUMA architecture. It is implemented and verified in Linux system. The method of obtaining delay depends on platform, but the strategy of system kernel is universal. The experimental results show that compared with the default memory allocation strategy of Linux, the method of obtaining delay depends on the platform. On average, the inequity between feed / thread reduces 16% (up to 34%), and the performance of each entry / thread has no significant jitter.
【作者單位】: 北京航空航天大學(xué)計算機(jī)學(xué)院中德聯(lián)合軟件研究所;
【基金】:國家“八六三”高技術(shù)研究發(fā)展計劃項目基金(2012AA01A302) 國家自然科學(xué)基金(61133004,61361126011,61502019,91530324)資助~~
【分類號】:TP333.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 肖濟(jì)楷;386/486微機(jī)在系統(tǒng)優(yōu)化中的內(nèi)存處理技術(shù)[J];武漢鋼鐵學(xué)院學(xué)報;1995年02期
2 周賓;章勇;;嵌入式Web訪問時的內(nèi)存丟失問題[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2009年10期
3 邵剛;使自己的應(yīng)用程序有“用不完”的內(nèi)存(二)[J];電子與電腦;1996年02期
4 盧春鵬;一種嵌入式系統(tǒng)的內(nèi)存分配方案[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2002年12期
5 靳廣斌,曹煥林;內(nèi)存的利用和優(yōu)化以及系統(tǒng)的典型配置[J];電力學(xué)報;1995年03期
6 謝曉恒,李衛(wèi)華;利用擴(kuò)充內(nèi)存實現(xiàn)多幅圖象的快速存儲[J];計算機(jī)應(yīng)用研究;1997年02期
7 王路群;;微機(jī)內(nèi)存的綜合管理[J];成才;1997年01期
8 程小輝;何軍權(quán);梁啟亮;黃佳歡;顧俊杰;;基于預(yù)測原理的嵌入式內(nèi)存分配算法設(shè)計[J];計算機(jī)工程與設(shè)計;2014年09期
9 薛靜鋒;胡昌振;郭曉靜;冷冰p,
本文編號:1597545
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1597545.html