多核系統(tǒng)上可伸縮的讀寫同步
本文選題:多核系統(tǒng) 切入點:性能 出處:《復旦大學》2014年碩士論文 論文類型:學位論文
【摘要】:隨著計算機硬件技術的飛速發(fā)展,單個處理器性能的增長已經(jīng)遇到了瓶頸,處理器個數(shù)的增長成為了提高單個計算機性能的主要發(fā)展方向。處理器個數(shù)的增長給應用程序的性能提升帶來了新的機遇,也帶來了性能和正確性上的挑戰(zhàn)。為了充分的利用這些處理器資源,操作系統(tǒng)和計算密集型的應用正在向并行化的模型演進。在一個并行的系統(tǒng)中,多個任務之間往往需要共享一些信息以進行協(xié)同工作。為了使得多個任務可以正確有序的訪問這些共享信息,并行程序采用同步的方法對不同任務的訪問進行控制和限制,使得對每一個單獨的任務來說,這些共享信息都維持著某種一致性。錯誤的使用同步可能會導致并行程序的錯誤或者影響其執(zhí)行的性能,設計一個易于正確使用,而又具有良好性能的同步原語是一個十分重要的問題。一個理想的同步原語應該具有定義清晰的較強的語義保證,同時又盡量不影響應用在多核系統(tǒng)上的可伸縮性。讀寫鎖是一種在語義上非常清晰的同步機制,它將對共享狀態(tài)的訪問者分為讀者和寫者兩個類別,在同一時刻,僅允許一個寫者進入臨界區(qū)更新共享狀態(tài),或允許多個讀者同時進入臨界區(qū)讀取共享狀態(tài)。因為其易于理解的語義,讀寫鎖在操作系統(tǒng)內核以及并行應用程序中得到了廣泛的應用。理論上說,因為讀寫鎖中的不同的讀者并沒有邏輯上的依賴,多個讀者在沒有寫者的情況下應該可以快速的進入和離開臨界區(qū),并且不需要相互通信。事實上,現(xiàn)有的讀寫鎖設計中,往往讀者獲取鎖時要產(chǎn)生相互通信,或者使用昂貴的內存屏障指令確保同步的正確性。這些設計限制了使用讀寫鎖的并行系統(tǒng)中讀者的可伸縮性和吞吐量。針對讀寫鎖的潛在性能問題,我們設計了一個高可伸縮的讀寫鎖算法PRWLock,這一算法巧妙利用了現(xiàn)代多核系統(tǒng)較短的內存寫可見時間以及較小的核間中斷開銷,在滿足TSO內存一致性模型的系統(tǒng)上實現(xiàn)了不需要共享信息以及內存屏障的讀者鎖,同時保證了寫者鎖可接受的性能。我們進一步發(fā)現(xiàn),在現(xiàn)代主流操作系統(tǒng)中的睡眠,喚醒機制會對同步機制的可伸縮性造成限制。當多個因為某一條件而進入睡眠的任務的喚醒條件達到時,喚醒操作是由單一任務串行完成的。針對這一問題,我們設計了操作系統(tǒng)中可以并發(fā)的喚醒睡眠任務的機制PWake,并將其與PRWLock相結合實現(xiàn)了可伸縮性更好的讀寫同步機制。為了驗證這兩種機制的有效性,我們在Linux的內核和用戶態(tài)分別實現(xiàn)了PRWLock,并結合了PWake喚醒機制。我們將PRWLock應用在了Linux內核的地址空間管理機制上和一個用戶態(tài)的內存數(shù)據(jù)庫中,多項實驗表明PRWLock具有同前人研究成果相似或更好的性能特性,并且更加易于部署到現(xiàn)有并行系統(tǒng)中。
[Abstract]:With the rapid development of computer hardware technology, the performance of a single processor has met with a bottleneck. The increase in the number of processors has become the main development direction for improving the performance of a single computer, and the increase in the number of processors has brought new opportunities for improving the performance of applications. It also presents performance and correctness challenges. In order to take full advantage of these processor resources, operating systems and computationally intensive applications are evolving to parallel models. In order to enable multiple tasks to access the shared information correctly and orderly, parallel programs use synchronous methods to control and restrict access to different tasks. For each individual task, this shared information maintains some consistency. The wrong use of synchronization can lead to errors in parallel programs or affect their performance, and design a design that is easy to use correctly. The synchronization primitive with good performance is a very important problem. An ideal synchronization primitive should have clear definition and strong semantic guarantee. Read and write locks are a semantically clear synchronization mechanism that classifies shared state visitors into two categories, reader and writer, at the same time. Only one writer is allowed to enter the critical area to update the shared state, or multiple readers are allowed to enter the critical section at the same time to read the shared state. Read-write locks are widely used in operating system kernels and parallel applications. In theory, because different readers in read-write locks do not have logical dependencies, Multiple readers should be able to quickly enter and leave the critical area without a writer and do not need to communicate with each other. Or use expensive memory barrier instructions to ensure the correctness of synchronization. These designs limit reader scalability and throughput in parallel systems using read-write locks. We design a highly scalable read-write lock algorithm, PRWLock. this algorithm makes good use of the shorter memory write visible time and the lower inter-core interrupt cost of modern multi-core system. Reader locks that do not require a shared information and memory barrier are implemented on systems that satisfy the TSO memory consistency model, while ensuring the acceptable performance of the writer lock. The wake-up mechanism limits the scalability of the synchronization mechanism. When the wake-up conditions for multiple tasks entering sleep due to a given condition are met, the wakeup operation is done serially by a single task. In order to verify the effectiveness of the two mechanisms, we have designed a mechanism for concurrent wake-up of sleep tasks in the operating system, PWake. and combined it with PRWLock to achieve a more scalable read / write synchronization mechanism. We have implemented PRW locklock in Linux kernel and user state, and combined with PWake wake-up mechanism. We have applied PRWLock to address space management mechanism of Linux kernel and a memory database in user state. Many experiments show that PRWLock has similar or better performance characteristics than previous studies, and it is easier to deploy to existing parallel systems.
【學位授予單位】:復旦大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP332
【相似文獻】
相關期刊論文 前10條
1 徐超;何炎祥;陳勇;劉健博;吳偉;李清安;;一種多核系統(tǒng)可靠性加強的任務調度方法[J];電子學報;2013年05期
2 劉磊;;對片上多核系統(tǒng)的系統(tǒng)結構的研究[J];電腦知識與技術;2008年29期
3 劉彩霞;石峰;謝小怡;薛建平;宋紅;;面向嵌入式多核系統(tǒng)的可共享多通道便簽存儲器設計與實現(xiàn)[J];小型微型計算機系統(tǒng);2010年07期
4 劉聰林;陳迎春;;簇型多核系統(tǒng)原型設計與驗證[J];中國集成電路;2011年05期
5 Frank Ko;;渦輪增壓多核系統(tǒng)[J];世界電子元器件;2006年11期
6 蔡德霞;鐘誠;韋興柳;林孔升;;多核系統(tǒng)上任意2序列公共元素的并行查找[J];合肥工業(yè)大學學報(自然科學版);2012年02期
7 謝炯;潘紅芳;程金宏;王文閣;額爾敦;;多核系統(tǒng)性能檢測及調優(yōu)策略研究[J];電力信息與通信技術;2014年01期
8 虞保忠;張燈;徐曉光;胡寧;;嵌入式多核系統(tǒng)中斷負載均衡研究[J];電子技術;2014年03期
9 胡哲琨;陳杰;;消息傳遞型片上多核系統(tǒng)的設計[J];湖南大學學報(自然科學版);2013年08期
10 李東生;高明倫;;高密度集成與單芯片多核系統(tǒng)及其研究進展[J];半導體技術;2012年02期
相關會議論文 前1條
1 蔡德霞;鐘誠;韋興柳;林孔升;;多核系統(tǒng)上任意兩序列公共元素的并行查找[A];全國第22屆計算機技術與應用學術會議(CACIS·2011)暨全國第3屆安全關鍵技術與應用(SCA·2011)學術會議論文摘要集[C];2011年
相關博士學位論文 前4條
1 張琦;多核系統(tǒng)中的程序性能優(yōu)化研究[D];中國科學技術大學;2010年
2 傅琛;面向多核系統(tǒng)的高性能硬件事務存儲的優(yōu)化研究[D];哈爾濱工業(yè)大學;2011年
3 劉彩霞;基三片上多核系統(tǒng)TriBA存儲體系關鍵技術研究[D];北京理工大學;2010年
4 劉志強;面向多核的系統(tǒng)級MPI通信優(yōu)化關鍵技術研究[D];國防科學技術大學;2011年
相關碩士學位論文 前10條
1 劉然;多核系統(tǒng)上可伸縮的讀寫同步[D];復旦大學;2014年
2 尹凱;基于總線架構的多核系統(tǒng)編程模型及數(shù)據(jù)安全性研究[D];合肥工業(yè)大學;2009年
3 王軼群;多資源單處理器及多核系統(tǒng)上節(jié)能調度問題的研究[D];東北大學;2010年
4 邢慧敏;面向塊處理的多核系統(tǒng)互連及存儲機制的研究[D];上海交通大學;2011年
5 任懿;適合多核系統(tǒng)的分布式溫度探測網(wǎng)絡的設計[D];哈爾濱工業(yè)大學;2010年
6 農俊康;基于虛擬機的多核系統(tǒng)確定執(zhí)行技術研究[D];國防科學技術大學;2011年
7 史成偉;多核系統(tǒng)中的內存管理系統(tǒng)優(yōu)化研究[D];電子科技大學;2009年
8 鄭龍;多核系統(tǒng)的高效機器視覺處理研究[D];廣東工業(yè)大學;2015年
9 李筱;面向異構多核系統(tǒng)的并行計算模型和調度算法研究[D];湖南大學;2012年
10 周會嬌;異構多核系統(tǒng)多媒體流計算實時任務調度策略研究[D];華中科技大學;2013年
,本文編號:1606329
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1606329.html