云存儲系統(tǒng)的數(shù)據(jù)副本放置算法研究
發(fā)布時間:2020-07-07 06:50
【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,各種類型的應(yīng)用對于數(shù)據(jù)存儲的要求在不斷提高,互聯(lián)網(wǎng)中的數(shù)據(jù)存儲更是成指數(shù)形式的增長。云存儲作為一種新興的存儲模式,能夠為用戶提供低成本、高可用性的數(shù)據(jù)在線存儲服務(wù),近年來得到了廣泛的發(fā)展。對于云存儲系統(tǒng),需要首先保證數(shù)據(jù)的高可用性,因此一種普遍采用的方式是同時存儲數(shù)據(jù)的副本,以此提高數(shù)據(jù)的冗余度。 數(shù)據(jù)副本的放置算法是云存儲系統(tǒng)的一個重要組成部分。如何在既保證系統(tǒng)的高可用性的同時又使得數(shù)據(jù)訪問的效率以及對讀寫性能不受到數(shù)據(jù)冗余度的過度影響,是值得研究的一個問題。目前,對于云存儲系統(tǒng)中數(shù)據(jù)副本的放置算法問題的研究仍處于初級階段,還有許多問題需要進(jìn)一步的研究。合理的數(shù)據(jù)副本數(shù)量以及副本的放置策略不僅能夠提供良好的數(shù)據(jù)可用性,同時能夠提升用戶訪問遠(yuǎn)程數(shù)據(jù)的讀寫性能以及存儲系統(tǒng)的負(fù)載均衡,提升云存儲服務(wù)的服務(wù)質(zhì)量。 針對上述問題,本文分別對數(shù)據(jù)副本的放置策略以及數(shù)據(jù)副本數(shù)量的控制問題展開研究,主要的工作如下: (1)在數(shù)據(jù)副本放置策略的研究上,提出了基于評價值的考慮數(shù)據(jù)讀寫以及負(fù)載均衡的副本放置策略,綜合考慮各個因素對于系統(tǒng)的性能影響,提出數(shù)據(jù)副本放置的評價算法,通過仿真實驗對副本放置的均衡程度以及網(wǎng)絡(luò)距離消耗等評價因素在不同策略下的實驗結(jié)果進(jìn)行對比分析。 (2)提出了基于訪問趨勢的數(shù)據(jù)副本數(shù)決策算法,給出判斷熱點(diǎn)數(shù)據(jù)的特征函數(shù),在對仿真實驗工具進(jìn)行簡要介紹后,將算法應(yīng)用于實驗環(huán)境中,在平均作業(yè)執(zhí)行時間以及網(wǎng)絡(luò)帶寬消耗率等方面與現(xiàn)有算法進(jìn)行對比分析。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP333
【圖文】:
中E 為評價值,l為數(shù)據(jù)機(jī)架的負(fù)載系數(shù),反比于該機(jī)架存放的數(shù)據(jù)離系數(shù),反比于當(dāng)前機(jī)架與目標(biāo)機(jī)架的網(wǎng)絡(luò)距離, [0,1],為平衡統(tǒng)管理員調(diào)節(jié)設(shè)定,用于調(diào)節(jié)數(shù)據(jù)負(fù)載和網(wǎng)絡(luò)距離參數(shù)在評價中所然文中綜合考慮了放置數(shù)據(jù)網(wǎng)絡(luò)距離消耗以及負(fù)載均衡對于數(shù)據(jù)副,并且對于不同 值時,數(shù)據(jù)副本放置的分布情況與 Hadoop 默認(rèn)策了對比,能夠從網(wǎng)絡(luò)距離消耗和負(fù)載均衡上體現(xiàn)其相比默認(rèn)策略的優(yōu)中建模與結(jié)點(diǎn)評價值的計算等方面依然存在以下不足之處:、沒有預(yù)先考慮副本放置對于數(shù)據(jù)讀取時網(wǎng)絡(luò)距離消耗的影響。雖然寫入數(shù)據(jù)的網(wǎng)絡(luò)距離因素已經(jīng)得到了考慮,然而在讀取數(shù)據(jù)時,與的客戶端都有進(jìn)行數(shù)據(jù)讀取需求的可能性,這就要求在數(shù)據(jù)存儲時據(jù)讀取的可能性考慮在內(nèi),否則就有可能造成數(shù)據(jù)副本寫入時的成,但在數(shù)據(jù)讀取時卻增加了網(wǎng)絡(luò)距離,造成網(wǎng)絡(luò)資源以及成本開銷的
這樣一來就可以在機(jī)架 3 中的數(shù)據(jù)結(jié)點(diǎn)進(jìn)行直接讀取,網(wǎng)可忽略不計,那么即使剩下 20%的請求都從沒有此數(shù)據(jù)塊副本的機(jī)架其消耗的網(wǎng)絡(luò)距離僅為 2*20%,為 0.4 個網(wǎng)絡(luò)距離,讀取消耗大大減 3-4 的數(shù)據(jù)塊放置方式在副本的寫入放置時消耗的網(wǎng)絡(luò)距離大于圖 3一次放置,長期讀取以及數(shù)據(jù)讀取請求較為頻繁的應(yīng)用來講,讀取也是一個值得在副本放置時考慮在內(nèi)的因素。
介紹了 OptorSim 的特點(diǎn)和作為仿真實驗工具的原因,描環(huán)境配置的過程,最后通過加入本文 RAT 算法到副本復(fù)制的驗,并對實驗數(shù)據(jù)進(jìn)行分析對比。.1 OptorSim 模擬器OptorSim 通過模擬歐洲云存儲數(shù)據(jù)網(wǎng)絡(luò)中的各個結(jié)點(diǎn)以及部程,達(dá)到評價不同的副本管理策略和優(yōu)化算法性能的目的[38本管理機(jī)制的模擬上。使用者可以通過對模擬器的不同調(diào)度、網(wǎng)絡(luò)擁塞程度以及副本管理方法進(jìn)行參數(shù)和算法配置,開統(tǒng)計數(shù)據(jù)結(jié)果。
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP333
【圖文】:
中E 為評價值,l為數(shù)據(jù)機(jī)架的負(fù)載系數(shù),反比于該機(jī)架存放的數(shù)據(jù)離系數(shù),反比于當(dāng)前機(jī)架與目標(biāo)機(jī)架的網(wǎng)絡(luò)距離, [0,1],為平衡統(tǒng)管理員調(diào)節(jié)設(shè)定,用于調(diào)節(jié)數(shù)據(jù)負(fù)載和網(wǎng)絡(luò)距離參數(shù)在評價中所然文中綜合考慮了放置數(shù)據(jù)網(wǎng)絡(luò)距離消耗以及負(fù)載均衡對于數(shù)據(jù)副,并且對于不同 值時,數(shù)據(jù)副本放置的分布情況與 Hadoop 默認(rèn)策了對比,能夠從網(wǎng)絡(luò)距離消耗和負(fù)載均衡上體現(xiàn)其相比默認(rèn)策略的優(yōu)中建模與結(jié)點(diǎn)評價值的計算等方面依然存在以下不足之處:、沒有預(yù)先考慮副本放置對于數(shù)據(jù)讀取時網(wǎng)絡(luò)距離消耗的影響。雖然寫入數(shù)據(jù)的網(wǎng)絡(luò)距離因素已經(jīng)得到了考慮,然而在讀取數(shù)據(jù)時,與的客戶端都有進(jìn)行數(shù)據(jù)讀取需求的可能性,這就要求在數(shù)據(jù)存儲時據(jù)讀取的可能性考慮在內(nèi),否則就有可能造成數(shù)據(jù)副本寫入時的成,但在數(shù)據(jù)讀取時卻增加了網(wǎng)絡(luò)距離,造成網(wǎng)絡(luò)資源以及成本開銷的
這樣一來就可以在機(jī)架 3 中的數(shù)據(jù)結(jié)點(diǎn)進(jìn)行直接讀取,網(wǎng)可忽略不計,那么即使剩下 20%的請求都從沒有此數(shù)據(jù)塊副本的機(jī)架其消耗的網(wǎng)絡(luò)距離僅為 2*20%,為 0.4 個網(wǎng)絡(luò)距離,讀取消耗大大減 3-4 的數(shù)據(jù)塊放置方式在副本的寫入放置時消耗的網(wǎng)絡(luò)距離大于圖 3一次放置,長期讀取以及數(shù)據(jù)讀取請求較為頻繁的應(yīng)用來講,讀取也是一個值得在副本放置時考慮在內(nèi)的因素。
介紹了 OptorSim 的特點(diǎn)和作為仿真實驗工具的原因,描環(huán)境配置的過程,最后通過加入本文 RAT 算法到副本復(fù)制的驗,并對實驗數(shù)據(jù)進(jìn)行分析對比。.1 OptorSim 模擬器OptorSim 通過模擬歐洲云存儲數(shù)據(jù)網(wǎng)絡(luò)中的各個結(jié)點(diǎn)以及部程,達(dá)到評價不同的副本管理策略和優(yōu)化算法性能的目的[38本管理機(jī)制的模擬上。使用者可以通過對模擬器的不同調(diào)度、網(wǎng)絡(luò)擁塞程度以及副本管理方法進(jìn)行參數(shù)和算法配置,開統(tǒng)計數(shù)據(jù)結(jié)果。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 唐箭;;云存儲系統(tǒng)的分析與應(yīng)用研究[J];電腦知識與技術(shù);2009年20期
2 林偉偉;;一種改進(jìn)的Hadoop數(shù)據(jù)放置策略[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2012年01期
3 李東升,李春江,肖儂,王意潔,盧錫城;數(shù)據(jù)網(wǎng)格環(huán)境下一種動態(tài)自適應(yīng)的副本定位方法[J];計算機(jī)研究與發(fā)展;2003年12期
4 王鶴群;;云存儲的應(yīng)用[J];記錄媒體技術(shù);2008年05期
5 欒亞建;黃爛
本文編號:2744790
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/2744790.html
最近更新
教材專著