龍芯多核處理器多線程故障恢復(fù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2017-03-16 19:07
本文關(guān)鍵詞:龍芯多核處理器多線程故障恢復(fù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
【摘要】:目前,大數(shù)據(jù)和物聯(lián)網(wǎng)進(jìn)入了高速發(fā)展時(shí)代,離不開(kāi)的一個(gè)背景就是多核處理器與多線程技術(shù)的越發(fā)成熟。這也對(duì)多核處理器環(huán)境下多線程程序運(yùn)行的穩(wěn)定性和健壯性提出越來(lái)越高的要求。但在實(shí)際應(yīng)用環(huán)境中,設(shè)備程序在運(yùn)行階段不可避免的總會(huì)遇見(jiàn)設(shè)計(jì)之初不曾考慮到的故障。其中,瞬態(tài)故障是導(dǎo)致程序不能正常運(yùn)行的最常見(jiàn)原因。由于實(shí)際環(huán)境的復(fù)雜性,要完全避免瞬態(tài)故障的出現(xiàn)需要及其高昂的成本代價(jià)。因此,在目前技術(shù)基礎(chǔ)之上,及時(shí)的故障恢復(fù)技術(shù)變得極具研究?jī)r(jià)值。本文針對(duì)多核處理器多線程故障恢復(fù)技術(shù)展開(kāi)研究。首先對(duì)現(xiàn)存的故障恢復(fù)技術(shù)進(jìn)行了介紹以及分析,接著對(duì)內(nèi)核進(jìn)程的實(shí)現(xiàn)以及多線程的實(shí)現(xiàn)機(jī)制進(jìn)行了分析,確定了為實(shí)現(xiàn)完整的故障恢復(fù)功能需要對(duì)多線程程序進(jìn)行保存的信息,包括寄存器、內(nèi)存、信號(hào)、文件等。通過(guò)以上研究分析,本文設(shè)計(jì)了一種基于檢查點(diǎn)的操作體統(tǒng)級(jí)的故障恢復(fù)系統(tǒng),即在正常運(yùn)行階段對(duì)多線程程序設(shè)定檢查點(diǎn)文件,一旦故障出現(xiàn)就可以根據(jù)檢查點(diǎn)文件對(duì)多線程程序進(jìn)行恢復(fù)。該系統(tǒng)在對(duì)程序信息進(jìn)行保存與恢復(fù)過(guò)程中對(duì)應(yīng)用層程序透明。關(guān)于檢查點(diǎn)設(shè)置,寄存器、內(nèi)存地址、當(dāng)前工作目錄、文件等數(shù)據(jù)可直接保存到設(shè)定的數(shù)據(jù)結(jié)構(gòu)中,然后以頁(yè)為單位寫(xiě)入內(nèi)核緩沖區(qū)中。而對(duì)于內(nèi)存中的數(shù)據(jù),則需要拷貝物理內(nèi)存頁(yè)框中的數(shù)據(jù)。內(nèi)核緩沖區(qū)中的數(shù)據(jù)由內(nèi)核線程負(fù)責(zé)寫(xiě)入非易失磁盤(pán)中。另外,針對(duì)檢查點(diǎn)設(shè)置的時(shí)間,本文提出了一種新的思路,即通過(guò)對(duì)包含數(shù)據(jù)傳輸?shù)南到y(tǒng)調(diào)用進(jìn)行計(jì)數(shù)來(lái)決定檢查點(diǎn)設(shè)置的時(shí)間,而不再采取時(shí)間間隔的方式。在進(jìn)行故障恢復(fù)的時(shí)候,對(duì)于文件、內(nèi)存等共享信息只需在一個(gè)線程中進(jìn)行恢復(fù),而線程寄存器、信號(hào)等私有信息則需要在所有線程中進(jìn)行恢復(fù)。最后,對(duì)實(shí)驗(yàn)環(huán)境和編譯方法進(jìn)行了說(shuō)明,對(duì)系統(tǒng)的基本功能進(jìn)行了測(cè)試,并在線程數(shù)量、數(shù)據(jù)規(guī)模和時(shí)間間隔三個(gè)方面選擇不同的測(cè)試程序?qū)ο到y(tǒng)性能進(jìn)行了測(cè)試,實(shí)驗(yàn)結(jié)果表明線程數(shù)量和時(shí)間間隔更能引起性能損失的變化,而數(shù)據(jù)規(guī)模對(duì)性能損失的變化影響較小。
【關(guān)鍵詞】:故障恢復(fù) 多線程 檢查點(diǎn) 操作系統(tǒng)級(jí) 內(nèi)核
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP332
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-14
- 1.1 課題來(lái)源及研究的背景和意義8-9
- 1.1.1 課題來(lái)源8
- 1.1.2 課題研究的背景和意義8-9
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀9-13
- 1.2.1 檢查點(diǎn)系統(tǒng)研究現(xiàn)狀10-12
- 1.2.2 故障恢復(fù)關(guān)鍵技術(shù)研究現(xiàn)狀12-13
- 1.3 本文的主要研究?jī)?nèi)容13-14
- 第2章 多線程及檢查點(diǎn)相關(guān)技術(shù)14-26
- 2.1 進(jìn)程機(jī)制14-19
- 2.1.1 進(jìn)程描述符14-15
- 2.1.2 進(jìn)程狀態(tài)15-16
- 2.1.3 進(jìn)程上下文16-17
- 2.1.4 進(jìn)程地址空間17-18
- 2.1.5 信號(hào)處理機(jī)制18-19
- 2.2 多線程機(jī)制19-21
- 2.3 虛擬地址到物理地址的轉(zhuǎn)換21-22
- 2.4 內(nèi)核空間與用戶空間信息交互方式22-23
- 2.5 內(nèi)核模塊與字符設(shè)備驅(qū)動(dòng)23-25
- 2.6 本章小結(jié)25-26
- 第3章 多線程故障恢復(fù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)26-45
- 3.1 系統(tǒng)特點(diǎn)與總體結(jié)構(gòu)26-27
- 3.2 服務(wù)守護(hù)進(jìn)程27-28
- 3.3 虛擬字符設(shè)備實(shí)現(xiàn)信息交互28-30
- 3.4 檢查點(diǎn)設(shè)置30-39
- 3.4.1 檢查點(diǎn)頭信息32-33
- 3.4.2 寄存器信息33
- 3.4.3 進(jìn)程內(nèi)存映像信息33-35
- 3.4.4 信號(hào)相關(guān)信息35-36
- 3.4.5 文件相關(guān)信息36-37
- 3.4.6 內(nèi)核緩沖區(qū)設(shè)計(jì)37-39
- 3.5 基于系統(tǒng)調(diào)用的檢查點(diǎn)間隔控制39-41
- 3.6 故障恢復(fù)41-43
- 3.7 本章小結(jié)43-45
- 第4章 系統(tǒng)測(cè)試與結(jié)果分析45-55
- 4.1 實(shí)驗(yàn)環(huán)境45
- 4.2 內(nèi)核模塊編譯45
- 4.3 故障恢復(fù)功能測(cè)試45-49
- 4.4 性能測(cè)試與結(jié)果分析49-54
- 4.4.1 線程數(shù)量50-51
- 4.4.2 數(shù)據(jù)規(guī)模51-52
- 4.4.3 時(shí)間間隔52-54
- 4.5 本章小結(jié)54-55
- 結(jié)論55-57
- 參考文獻(xiàn)57-61
- 攻讀碩士學(xué)位期間發(fā)表的論文及其它成果61-63
- 致謝63
本文關(guān)鍵詞:龍芯多核處理器多線程故障恢復(fù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):252202
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/252202.html
最近更新
教材專著