基于多線程應(yīng)用特性的多/眾核系統(tǒng)片上互連與緩存一致性整體優(yōu)化方法
發(fā)布時(shí)間:2021-08-12 15:54
當(dāng)高性能處理器集成核數(shù)達(dá)到16-64個(gè)核及以上時(shí),其本質(zhì)上已是一個(gè)TFlops的高性能并行計(jì)算機(jī)系統(tǒng)。芯片除了單獨(dú)工作,又有連成更大的計(jì)算機(jī)系統(tǒng)的需求。一般在互連通信研究上重視處理器間的連接,但實(shí)際系統(tǒng)設(shè)計(jì)中其突出的問(wèn)題是如何協(xié)同處理多核互連和運(yùn)行時(shí)存儲(chǔ)一致性。處理器核的連接需要協(xié)同分布式共享存儲(chǔ)器的訪問(wèn)。在訪問(wèn)存儲(chǔ)器時(shí),保證多核存儲(chǔ)層次的一致性和效率占用了互連通信相當(dāng)多的軟硬件資源,增加了運(yùn)行中的延遲開(kāi)銷,降低了并行計(jì)算的效率和系統(tǒng)的可擴(kuò)展性。因此必須要把數(shù)據(jù)傳輸和存儲(chǔ)層次統(tǒng)一考慮,合理地處理好高速緩存的一致性。本文多角度分析應(yīng)用程序數(shù)據(jù)相關(guān)特性,明確多/眾核系統(tǒng)的性能瓶頸和優(yōu)化方向,對(duì)存儲(chǔ)子系統(tǒng)和互連子系統(tǒng)整體優(yōu)化,提高數(shù)據(jù)存儲(chǔ)、維護(hù)和通信的效率,降低硬件、時(shí)延和能耗開(kāi)銷,提高系統(tǒng)效能。首先,本文對(duì)具有代表性的多線程應(yīng)用程序進(jìn)行實(shí)驗(yàn)分析,跟蹤統(tǒng)計(jì)多個(gè)維度的各項(xiàng)性能參數(shù),包括工作集大小、數(shù)據(jù)共享特性、數(shù)據(jù)局部性、數(shù)據(jù)線程親緣性、片上通信量、一致性維護(hù)等。通過(guò)分析各項(xiàng)性能參數(shù),應(yīng)用統(tǒng)計(jì)學(xué)方法分析特定性能參數(shù)的分布規(guī)律,理解各應(yīng)用程序?qū)Υ鎯?chǔ)資源的需求、一致性維護(hù)的需求、通信需求,剖析不同...
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:146 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1典型片上多核系統(tǒng)示意圖??從片外存儲(chǔ)器取得的數(shù)據(jù)依照某種算法確定存儲(chǔ)在哪個(gè)節(jié)點(diǎn)的共享緩存中
表修改(Modified,簡(jiǎn)寫(xiě)為M)、獨(dú)占(Exclusive,簡(jiǎn)寫(xiě)為巧、共享巧hared,簡(jiǎn)寫(xiě)為??S)和無(wú)效(Invalid,簡(jiǎn)寫(xiě)為1)4種一致性狀態(tài)。數(shù)據(jù)的毎一份私有拷貝中化記錄著??這些狀態(tài)。目錄中的一致性狀怒轉(zhuǎn)換如圖1.3。數(shù)據(jù)第一次被訪問(wèn)時(shí)從無(wú)效態(tài)轉(zhuǎn)??入獨(dú)占態(tài),任何時(shí)候如果被修改都進(jìn)入修改態(tài)。數(shù)據(jù)在獨(dú)占或修改態(tài)下只存在一??個(gè)私有拷貝,從而可。迊V在本地進(jìn)行修改,不存在與其它私有數(shù)據(jù)拷貝不一致的問(wèn)??題。兩種狀態(tài)的區(qū)別在于獨(dú)占態(tài)數(shù)據(jù)是干凈的,被替換之后不需要將數(shù)據(jù)寫(xiě)回到??外存。如果有其它核訪問(wèn)獨(dú)占或修改態(tài)的數(shù)據(jù),訪問(wèn)者被加入共享者列表,同時(shí)??數(shù)據(jù)進(jìn)入共享態(tài)。此時(shí)需要通知原本唯一的擁有者數(shù)據(jù)狀態(tài)發(fā)生了轉(zhuǎn)變,避免該??共享者在本地直接修改數(shù)據(jù),造成不同私有數(shù)據(jù)拷貝不一致。共享患的數(shù)據(jù)被讀??取時(shí)無(wú)需再通知其它共享者
2.2.研究?jī)?nèi)容??研究針對(duì)的片上多核系統(tǒng)如圖2.1所示。該片上多核結(jié)構(gòu)包含多個(gè)節(jié)點(diǎn),毎??個(gè)包含一個(gè)或多個(gè)核、私有高速緩存、最后一級(jí)高速緩存、W及片上互連接口等。??片上多核系統(tǒng)通常需要較大的片上存儲(chǔ)空間W保證足夠的內(nèi)存訪問(wèn)帶寬。般來(lái)??說(shuō)最后一級(jí)高速緩存采用地址輪轉(zhuǎn)的方式存波數(shù)據(jù),于是發(fā)生本地私有緩沖缺失??時(shí)高速緩存控制器會(huì)發(fā)出數(shù)據(jù)請(qǐng)求消息到該數(shù)據(jù)的宿主節(jié)點(diǎn)最后一級(jí)高速緩存??獲取數(shù)據(jù)。這種地址輪轉(zhuǎn)的映射方式實(shí)現(xiàn)簡(jiǎn)單,是常用的做法,可L乂保證數(shù)據(jù)均??衡分布。在片上多核系統(tǒng)運(yùn)行多線程程序時(shí),要將并行執(zhí)行的線程分配到不同的??核上運(yùn)行。一般來(lái)說(shuō),操作系統(tǒng)會(huì)采用簡(jiǎn)單的順序映射方式分配線程,即0?n??號(hào)線程分別順序分配到0?n號(hào)核。當(dāng)某個(gè)核上運(yùn)行的線程需要使用存儲(chǔ)在其它節(jié)??點(diǎn)的數(shù)據(jù)時(shí),就需要進(jìn)行通信。????——^?刊。Tile?1^^^^?Tile?1^^^^?Tile??11—I?[?1?i\i?0?n?^?n?I?n??i?CPU?d,rectory?|?玄韋王??I?I??i??.?Tile?L?Jl\\e?、?Tile??i?4?5?6?7??I円可?口?I圧去t去??j?*?'??i?!?Tile?Tile?L?l?Tile?、?Tile??i??___j|i?Y?n?三。^門。??I?swhxh?1/?X?X?I?X??I?I?h!?T1lel_^K?刊?e?Tile??L?—?—一;?U?13?14?15??圖2.1化路片上多核系統(tǒng)框圖??本章主要分析不同應(yīng)用程序數(shù)據(jù)相關(guān)的特征
【參考文獻(xiàn)】:
期刊論文
[1]多核處理器目錄緩存結(jié)構(gòu)設(shè)計(jì)[J]. 王恩東,唐士斌,陳繼承,王洪偉,倪璠,趙雅倩. 計(jì)算機(jī)研究與發(fā)展. 2015(06)
[2]2014年中國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫? 科研信息化技術(shù)與應(yīng)用. 2015(01)
[3]數(shù)據(jù)密集型科學(xué)與工程:需求和挑戰(zhàn)[J]. 宮學(xué)慶,金澈清,王曉玲,張蓉,周傲英. 計(jì)算機(jī)學(xué)報(bào). 2012(08)
[4]多核處理器的關(guān)鍵技術(shù)及其發(fā)展趨勢(shì)[J]. 黃國(guó)睿,張平,魏廣博. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(10)
[5]多核處理器及其對(duì)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)的影響[J]. 謝向輝,胡蘇太,李宏亮. 高性能計(jì)算技術(shù). 2007 (04)
博士論文
[1]片上多處理器關(guān)鍵技術(shù)研究[D]. 顧雄禮.浙江大學(xué) 2011
本文編號(hào):3338614
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:146 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1典型片上多核系統(tǒng)示意圖??從片外存儲(chǔ)器取得的數(shù)據(jù)依照某種算法確定存儲(chǔ)在哪個(gè)節(jié)點(diǎn)的共享緩存中
表修改(Modified,簡(jiǎn)寫(xiě)為M)、獨(dú)占(Exclusive,簡(jiǎn)寫(xiě)為巧、共享巧hared,簡(jiǎn)寫(xiě)為??S)和無(wú)效(Invalid,簡(jiǎn)寫(xiě)為1)4種一致性狀態(tài)。數(shù)據(jù)的毎一份私有拷貝中化記錄著??這些狀態(tài)。目錄中的一致性狀怒轉(zhuǎn)換如圖1.3。數(shù)據(jù)第一次被訪問(wèn)時(shí)從無(wú)效態(tài)轉(zhuǎn)??入獨(dú)占態(tài),任何時(shí)候如果被修改都進(jìn)入修改態(tài)。數(shù)據(jù)在獨(dú)占或修改態(tài)下只存在一??個(gè)私有拷貝,從而可。迊V在本地進(jìn)行修改,不存在與其它私有數(shù)據(jù)拷貝不一致的問(wèn)??題。兩種狀態(tài)的區(qū)別在于獨(dú)占態(tài)數(shù)據(jù)是干凈的,被替換之后不需要將數(shù)據(jù)寫(xiě)回到??外存。如果有其它核訪問(wèn)獨(dú)占或修改態(tài)的數(shù)據(jù),訪問(wèn)者被加入共享者列表,同時(shí)??數(shù)據(jù)進(jìn)入共享態(tài)。此時(shí)需要通知原本唯一的擁有者數(shù)據(jù)狀態(tài)發(fā)生了轉(zhuǎn)變,避免該??共享者在本地直接修改數(shù)據(jù),造成不同私有數(shù)據(jù)拷貝不一致。共享患的數(shù)據(jù)被讀??取時(shí)無(wú)需再通知其它共享者
2.2.研究?jī)?nèi)容??研究針對(duì)的片上多核系統(tǒng)如圖2.1所示。該片上多核結(jié)構(gòu)包含多個(gè)節(jié)點(diǎn),毎??個(gè)包含一個(gè)或多個(gè)核、私有高速緩存、最后一級(jí)高速緩存、W及片上互連接口等。??片上多核系統(tǒng)通常需要較大的片上存儲(chǔ)空間W保證足夠的內(nèi)存訪問(wèn)帶寬。般來(lái)??說(shuō)最后一級(jí)高速緩存采用地址輪轉(zhuǎn)的方式存波數(shù)據(jù),于是發(fā)生本地私有緩沖缺失??時(shí)高速緩存控制器會(huì)發(fā)出數(shù)據(jù)請(qǐng)求消息到該數(shù)據(jù)的宿主節(jié)點(diǎn)最后一級(jí)高速緩存??獲取數(shù)據(jù)。這種地址輪轉(zhuǎn)的映射方式實(shí)現(xiàn)簡(jiǎn)單,是常用的做法,可L乂保證數(shù)據(jù)均??衡分布。在片上多核系統(tǒng)運(yùn)行多線程程序時(shí),要將并行執(zhí)行的線程分配到不同的??核上運(yùn)行。一般來(lái)說(shuō),操作系統(tǒng)會(huì)采用簡(jiǎn)單的順序映射方式分配線程,即0?n??號(hào)線程分別順序分配到0?n號(hào)核。當(dāng)某個(gè)核上運(yùn)行的線程需要使用存儲(chǔ)在其它節(jié)??點(diǎn)的數(shù)據(jù)時(shí),就需要進(jìn)行通信。????——^?刊。Tile?1^^^^?Tile?1^^^^?Tile??11—I?[?1?i\i?0?n?^?n?I?n??i?CPU?d,rectory?|?玄韋王??I?I??i??.?Tile?L?Jl\\e?、?Tile??i?4?5?6?7??I円可?口?I圧去t去??j?*?'??i?!?Tile?Tile?L?l?Tile?、?Tile??i??___j|i?Y?n?三。^門。??I?swhxh?1/?X?X?I?X??I?I?h!?T1lel_^K?刊?e?Tile??L?—?—一;?U?13?14?15??圖2.1化路片上多核系統(tǒng)框圖??本章主要分析不同應(yīng)用程序數(shù)據(jù)相關(guān)的特征
【參考文獻(xiàn)】:
期刊論文
[1]多核處理器目錄緩存結(jié)構(gòu)設(shè)計(jì)[J]. 王恩東,唐士斌,陳繼承,王洪偉,倪璠,趙雅倩. 計(jì)算機(jī)研究與發(fā)展. 2015(06)
[2]2014年中國(guó)高性能計(jì)算機(jī)發(fā)展現(xiàn)狀分析與展望[J]. 張?jiān)迫? 科研信息化技術(shù)與應(yīng)用. 2015(01)
[3]數(shù)據(jù)密集型科學(xué)與工程:需求和挑戰(zhàn)[J]. 宮學(xué)慶,金澈清,王曉玲,張蓉,周傲英. 計(jì)算機(jī)學(xué)報(bào). 2012(08)
[4]多核處理器的關(guān)鍵技術(shù)及其發(fā)展趨勢(shì)[J]. 黃國(guó)睿,張平,魏廣博. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(10)
[5]多核處理器及其對(duì)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)的影響[J]. 謝向輝,胡蘇太,李宏亮. 高性能計(jì)算技術(shù). 2007 (04)
博士論文
[1]片上多處理器關(guān)鍵技術(shù)研究[D]. 顧雄禮.浙江大學(xué) 2011
本文編號(hào):3338614
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3338614.html
最近更新
教材專著