天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

多核結(jié)構(gòu)上高效的線程級(jí)推測(cè)及事務(wù)執(zhí)行模型研究

發(fā)布時(shí)間:2020-06-15 03:23
【摘要】: 片上多核作為當(dāng)今處理器設(shè)計(jì)的主流技術(shù),需要運(yùn)行多線程應(yīng)用才能充分發(fā)揮性能。推測(cè)多線程方法能夠簡(jiǎn)化并行編程,允許程序員或者編譯器在不完全保證正確性的情況下,嘗試激進(jìn)的優(yōu)化方式來開發(fā)和利用更多的程序并行性。實(shí)現(xiàn)這種方法的難點(diǎn)在于訪存操作的局部緩存,已提出的一些推測(cè)多線程方案都使用了非常復(fù)雜的緩存機(jī)制,不光增加了硬件設(shè)計(jì)復(fù)雜度,也在一定程度上影響了應(yīng)用開發(fā)的效率。實(shí)現(xiàn)這種技術(shù)的另一個(gè)難點(diǎn)是如何有效地減少誤推測(cè)對(duì)并行性能的不確定性影響。為此,本文嘗試采用事務(wù)存儲(chǔ)和動(dòng)態(tài)剖析技術(shù)來解決這兩大難題,為多核平臺(tái)尋找一種能夠高效地推測(cè)并行化應(yīng)用程序的軟硬件協(xié)同的解決方案。 本文圍繞基于事務(wù)存儲(chǔ)的線程級(jí)推測(cè)技術(shù)開展了深入系統(tǒng)的研究,涉及結(jié)構(gòu)模型、編程和執(zhí)行模型、動(dòng)態(tài)優(yōu)化方法等方面的內(nèi)容。主要研究成果包括:(1)本文首先提出了一個(gè)基于事務(wù)存儲(chǔ)的推測(cè)多線程體系結(jié)構(gòu)模型SPoTM(Speculatire Parallelization on Transactional Memory)。SPoTM利用事務(wù)存儲(chǔ)來實(shí)現(xiàn)線程間的讀寫操作隔離,提供了線程亂序執(zhí)行、順序提交、沖突檢測(cè)以及推測(cè)失敗后回退等功能。(2)本文還為SPoTM結(jié)構(gòu)設(shè)計(jì)了一個(gè)基于循環(huán)并行的推測(cè)多線程編程模型,提供了實(shí)現(xiàn)該編程模型所需的推測(cè)線程系統(tǒng)庫以及指令集擴(kuò)展等。SPoTM編程模型實(shí)現(xiàn)簡(jiǎn)單,并行化需要的代碼調(diào)整很少,對(duì)多線程并行程序設(shè)計(jì)的簡(jiǎn)化非常明顯。(3)本文選取SPEC CPU 2000中的若干典型程序,在為SPoTM結(jié)構(gòu)開發(fā)的模擬執(zhí)行平臺(tái)fastTM和sim-SPoTM上進(jìn)行了詳細(xì)的評(píng)測(cè),量化分析了各種硬件機(jī)制對(duì)推測(cè)執(zhí)行性能的影響,以尋找性價(jià)比較好的實(shí)現(xiàn)方案。本文還全面分析了在推測(cè)執(zhí)行條件下Cache局部性的變化,并提出和驗(yàn)證了幾個(gè)改善局部性的方法。(4)針對(duì)當(dāng)前推測(cè)多線程優(yōu)化中普遍使用的離線剖析方式受到培訓(xùn)輸入集限制的問題,本文提出并實(shí)現(xiàn)了一種在運(yùn)行時(shí)根據(jù)在線剖析結(jié)果自動(dòng)變換推測(cè)多線程程序的動(dòng)態(tài)優(yōu)化方法。該方法在運(yùn)行時(shí)執(zhí)行剖析和優(yōu)化工作,不需要單獨(dú)的剖析過程以及通用的測(cè)試輸入集,同時(shí)也適用于那些運(yùn)行時(shí)行為特征呈階段性變化的程序。實(shí)驗(yàn)表明,在指導(dǎo)事務(wù)劃分和選擇并行循環(huán)方面,動(dòng)態(tài)優(yōu)化方法能夠達(dá)到和離線優(yōu)化方法相近的效果。 在設(shè)計(jì)評(píng)測(cè)SPoTM結(jié)構(gòu)模型,開發(fā)動(dòng)態(tài)軟件優(yōu)化系統(tǒng)的過程中,我們得到了一些關(guān)于如何有效利用推測(cè)多線程技術(shù)的定性結(jié)論。首先,為了提升推測(cè)執(zhí)行性能,我們認(rèn)為更多的努力應(yīng)當(dāng)投入到軟件優(yōu)化方面,而不是激進(jìn)地調(diào)整硬件結(jié)構(gòu)和執(zhí)行機(jī)制。其次,推測(cè)多線程技術(shù)并不能使自動(dòng)并行完全取代手工并行,這種技術(shù)可以作為手工并行的輔助工具來使用。最后,不論是手工并行還是自動(dòng)并行,一個(gè)漸進(jìn)的并行代碼變換過程都是需要的,而在此過程中,剖析指導(dǎo)的優(yōu)化技術(shù)起著非常關(guān)鍵的作用。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2007
【分類號(hào)】:TP332
【圖文】:

行狀態(tài)


第2章相關(guān)研究工作結(jié)構(gòu)擴(kuò)展實(shí)現(xiàn)的關(guān)鍵在于運(yùn)行時(shí)推測(cè)讀寫的緩存和依賴一級(jí)Cache狀態(tài)位,加入二級(jí)Cache寫緩沖來提一級(jí)數(shù)據(jù)Cache記錄推測(cè)訪問的數(shù)據(jù),圖2.2顯的擴(kuò)展,其中粗體的rea妙y一ord、write一ysewo新增加的狀態(tài)。為了描述方便,我們將在下文中的邏輯順序,線程在原串行程序中的邏輯序越推測(cè)級(jí)為0,依次類推。

體系結(jié)構(gòu)圖,體系結(jié)構(gòu),事務(wù)執(zhí)行,線程


先線程按照事務(wù)的方式執(zhí)行代碼,每個(gè)事務(wù)帶有自己的sequencenumber和Phase皿mber。在事務(wù)執(zhí)行完畢后,線程會(huì)根據(jù)自己記錄的當(dāng)前其他線程的序號(hào)決定自己是否可以申請(qǐng)?zhí)峤,這是等待仲裁階段。當(dāng)發(fā)出提交請(qǐng)求后,進(jìn)入仲裁階段。當(dāng)仲裁結(jié)果允許提交后,線程進(jìn)入提交階段,直到完成。TCC的結(jié)構(gòu)如圖2.7所示。為實(shí)現(xiàn)事務(wù)存儲(chǔ),一個(gè)處理器核的私有Cache增加的硬件資源包括:推測(cè)讀標(biāo)志:為私有Cache行內(nèi)每個(gè)字都提供一位,在事務(wù)執(zhí)行讀操作的時(shí)候置位;推測(cè)修改狀態(tài)位:屬于整個(gè)Cache行,當(dāng)事務(wù)執(zhí)行寫操作的時(shí)候置位;重命名狀態(tài)位:為行內(nèi)每個(gè)字都提供,這個(gè)狀態(tài)位可選,在對(duì)應(yīng)字被推測(cè)寫時(shí)置位,使用的目的是為了避免數(shù)據(jù)訪問的輸出依賴沖突(認(rèn)叭W);推測(cè)緩沖(WriteBuffer):記錄事務(wù)執(zhí)行的寫結(jié)果;提交控制表(CommitControlTable):記錄其他處理器上事務(wù)的序號(hào),以判斷自己是否可以發(fā)出提交申請(qǐng)。

【引證文獻(xiàn)】

相關(guān)博士學(xué)位論文 前2條

1 王耀彬;多核平臺(tái)上支持推測(cè)并行化的事務(wù)存儲(chǔ)體系結(jié)構(gòu)性能優(yōu)化[D];中國科學(xué)技術(shù)大學(xué);2010年

2 李頎;基于FPGA的片上多處理器建模方法[D];中國科學(xué)技術(shù)大學(xué);2012年

相關(guān)碩士學(xué)位論文 前1條

1 曹婷婷;基于多核的并行遺傳算法的研究與實(shí)現(xiàn)[D];東北大學(xué);2010年



本文編號(hào):2713818

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2713818.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0a16c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com