云環(huán)境下中間數(shù)據(jù)集存儲問題優(yōu)化算法研究
發(fā)布時間:2020-06-01 14:54
【摘要】:隨著科學(xué)研究過程越來越復(fù)雜,科學(xué)計算的步驟越來越繁多,因此云計算平臺上運行科學(xué)工作流越來越受歡迎。然而,科學(xué)工作流在云計算平臺上運行伴隨著云環(huán)境下中間數(shù)據(jù)集存儲問題,該問題本質(zhì)是代價最小化?茖W(xué)工作流運行過程中會產(chǎn)生大量含有對于科學(xué)家們來說至關(guān)重要信息的中間數(shù)據(jù)集,因此,如何處理這些中間數(shù)據(jù)集變得尤為重要。云計算平臺提供了處理這些中間數(shù)據(jù)集所需的存儲資源、計算資源和寬帶資源。然而,用戶在享受這些云服務(wù)的同時,還需付出存儲代價、計算代價和傳遞代價,因此,怎樣讓用戶高效享受云服務(wù)的同時付出較小代價顯得尤為重要。目前,云環(huán)境下中間數(shù)據(jù)集存儲問題的研究主要集中在以下三個方面:第一、云環(huán)境下中間數(shù)據(jù)集存儲問題代價模型優(yōu)化;第二、單云環(huán)境下線性數(shù)據(jù)流和非線性數(shù)據(jù)流存儲問題算法研究;第三、多云條件下線性數(shù)據(jù)流和非線性數(shù)據(jù)流存儲問題算法研究。本文研究的主要內(nèi)容是云環(huán)境下線性數(shù)據(jù)流存儲問題代價最小化算法時間效率優(yōu)化和云環(huán)境下非線性數(shù)據(jù)流中間數(shù)據(jù)集存儲問題代價模型優(yōu)化,具體如下:(1)闡述云環(huán)境下中間數(shù)據(jù)集存儲問題優(yōu)化算法的理論基礎(chǔ),包括問題定義、代價模型以及對應(yīng)的中間數(shù)據(jù)集存儲算法,并指出算法存在的問題和研究重點;(2)采用動態(tài)規(guī)劃思想優(yōu)化多云條件下線性數(shù)據(jù)流存儲問題算法,將時間復(fù)雜度由O(m~4n~3)改進(jìn)為O(m~3n~3);(3)針對多云條件下中間數(shù)據(jù)集存儲問題存在代價模型表達(dá)不夠全面的問題,通過研讀大量參考資料,將數(shù)據(jù)集的使用頻率、用戶數(shù)據(jù)訪問延遲容忍度、傳遞代價有效組合,得出該問題新代價模型,新模型定義數(shù)據(jù)集的使用頻率為更能反映用戶的實際需求的高峰期數(shù)據(jù)集使用頻率;(4)在新代價模型條件下,使用貪心策略,提出一個新算法并通過實驗?zāi)M結(jié)果對算法進(jìn)行分析,實驗結(jié)果表明貪心策略對新的代價模型是可行的。論文最后總結(jié)本文的主要工作,并且對下一階段云環(huán)境下中間數(shù)據(jù)集存儲問題算法的研究重點進(jìn)行展望。
【圖文】:
依賴圖
圖 2.3 代價傳遞構(gòu)造圖定義 2.3-1:計算狀態(tài)的中間數(shù)據(jù)集直接存儲前驅(qū)集合是由離該數(shù)據(jù)集最近存儲數(shù)據(jù)集組成,用 S-prior 集合表示。如圖 2.1,d5的直接存儲前驅(qū)集合為 S-prior(d5)={d1, d2}。定義 2.3-2:計算狀態(tài)的中間數(shù)據(jù)集計算路徑是由該數(shù)據(jù)集存儲前驅(qū)集合中的數(shù)直接后繼到該數(shù)據(jù)集的所有路徑,,用 C-path(di)集合表示。如圖 2.1,d5的計算路徑有兩條,即 C-path(d5)={{d3, d5}, {d4, d5}}。定義 2.3-3:通過數(shù)據(jù)集的計算路徑,根據(jù)公式(2.2)計算該數(shù)據(jù)集的計算代價:( ) ( )ixdjαCpathdidαddxdjcomputatio n_costd + ∈ ∈∧≠ = (其中,x(d)表示數(shù)據(jù)集 d 的計算代價,α表示 di的某個計算路徑。則根據(jù)公式(2.2)可計算出 d5的計算代價,即:Computation_cost(d5)=x(d3)+x(d4)+x(d5)定義 2.3-4:單云條件下代價模型,如公式(2.3)所示:
【學(xué)位授予單位】:中南民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.09
本文編號:2691646
【圖文】:
依賴圖
圖 2.3 代價傳遞構(gòu)造圖定義 2.3-1:計算狀態(tài)的中間數(shù)據(jù)集直接存儲前驅(qū)集合是由離該數(shù)據(jù)集最近存儲數(shù)據(jù)集組成,用 S-prior 集合表示。如圖 2.1,d5的直接存儲前驅(qū)集合為 S-prior(d5)={d1, d2}。定義 2.3-2:計算狀態(tài)的中間數(shù)據(jù)集計算路徑是由該數(shù)據(jù)集存儲前驅(qū)集合中的數(shù)直接后繼到該數(shù)據(jù)集的所有路徑,,用 C-path(di)集合表示。如圖 2.1,d5的計算路徑有兩條,即 C-path(d5)={{d3, d5}, {d4, d5}}。定義 2.3-3:通過數(shù)據(jù)集的計算路徑,根據(jù)公式(2.2)計算該數(shù)據(jù)集的計算代價:( ) ( )ixdjαCpathdidαddxdjcomputatio n_costd + ∈ ∈∧≠ = (其中,x(d)表示數(shù)據(jù)集 d 的計算代價,α表示 di的某個計算路徑。則根據(jù)公式(2.2)可計算出 d5的計算代價,即:Computation_cost(d5)=x(d3)+x(d4)+x(d5)定義 2.3-4:單云條件下代價模型,如公式(2.3)所示:
【學(xué)位授予單位】:中南民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP393.09
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 鄭湃;崔立真;王海洋;徐猛;;云計算環(huán)境下面向數(shù)據(jù)密集型應(yīng)用的數(shù)據(jù)布局策略與方法[J];計算機學(xué)報;2010年08期
本文編號:2691646
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2691646.html
最近更新
教材專著