基于寬表的多租戶數(shù)據(jù)存儲模式研究
發(fā)布時間:2017-07-18 03:15
本文關鍵詞:基于寬表的多租戶數(shù)據(jù)存儲模式研究
更多相關文章: 多租戶 數(shù)據(jù)存儲模式 擴展表 關系代數(shù) I/O代價
【摘要】:多租戶數(shù)據(jù)存儲是軟件及服務(SaaS,Software as a Service)中一個重要的研究內(nèi)容。針對SaaS應用“單實例多租賃”的特點,人們提出了很多解決多租戶數(shù)據(jù)存儲問題的方法,其中基于關系型數(shù)據(jù)庫模式映射的寬表存儲是一種常用、有效的SaaS多租戶數(shù)據(jù)存儲的解決方法。但為了保證租戶的定制需求,寬表存儲往往需要預留足夠的列,導致數(shù)據(jù)具有很大的稀疏性,同時模式映射較為復雜,影響數(shù)據(jù)空間利用率和查詢效率。 本文針對多租戶數(shù)據(jù)寬表存儲方法在數(shù)據(jù)空間利用率和查詢效率方面的不足,提出一種基于寬表的多擴展表數(shù)據(jù)存儲機制,并且在此基礎上提出一種通用的多租戶數(shù)據(jù)存儲模式的數(shù)據(jù)查詢效率評估方法,,以此評估多擴展表數(shù)據(jù)存儲模式與其他存儲模式的數(shù)據(jù)查詢效率。本文的主要工作如下: (1)提出多擴展表數(shù)據(jù)存儲結構。在寬表數(shù)據(jù)存儲模式的基礎之上加以改進,采用基本表與擴展表結合方式代替原有的單一寬表解決多租戶數(shù)據(jù)存儲問題。擴展表采用多個列數(shù)不同的表滿足租戶不同的定制需求,將租戶的定制數(shù)據(jù)分配到合適的擴展表中,以最大限度的減少空值,提高數(shù)據(jù)存儲的空間利用率。通過計算數(shù)據(jù)稀疏度,該模式有效的降低了數(shù)據(jù)的稀疏性。 (2)提出多擴展表方法中的模式映射機制。該機制包括基于業(yè)務數(shù)據(jù)的正態(tài)分布多擴展表劃分方法和基于預留列的多擴展表選擇方法,對多租戶的數(shù)據(jù)進行合理的存儲,以及租戶邏輯數(shù)據(jù)到物理存儲位置的映射。 (3)提出一種基于關系代數(shù)的多租戶存儲模式查詢性能評估方法。通過建立租戶私有表數(shù)據(jù)與物理存儲數(shù)據(jù)的SQL定義,將SQL轉換為關系代數(shù),利用關系代數(shù)估計查詢操作的I/O代價。將多租戶存儲模式的查詢性能轉化為I/O查詢代價的比較,從而評估多租戶數(shù)據(jù)存儲模式的查詢性能。該方法將多租戶數(shù)據(jù)模式的查詢性能評估從實驗設計和硬件環(huán)境中分離,從本質上比較存儲模式的優(yōu)劣。實驗表明,該方法雖然不能精確計算數(shù)據(jù)模式的查詢成本,但是對于數(shù)據(jù)模式之間的查詢性能對比有著顯著的效果。
【關鍵詞】:多租戶 數(shù)據(jù)存儲模式 擴展表 關系代數(shù) I/O代價
【學位授予單位】:鄭州大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP333
【目錄】:
- 摘要4-5
- Abstract5-7
- 目錄7-10
- 圖的目錄10-11
- 1 引言11-16
- 1.1. 研究背景11-12
- 1.2. 國內(nèi)外研究現(xiàn)狀分析12-14
- 1.2.1 SaaS 模式的研究現(xiàn)狀12-13
- 1.2.2 多租戶數(shù)據(jù)存儲模式研究現(xiàn)狀13-14
- 1.3. 研究內(nèi)容14-15
- 1.4. 論文結構15-16
- 2 相關技術16-25
- 2.1 SaaS 簡介16-17
- 2.1.1 SaaS 概念16
- 2.1.2 SaaS 與 SOA16-17
- 2.1.3 多租戶簡介17
- 2.2 多租戶數(shù)據(jù)模式17-23
- 2.2.1 私有表方法17-18
- 2.2.2 擴展表方法18
- 2.2.3 Key-value 方法18
- 2.2.4 寬表方法18-21
- 2.2.5 多寬表方法21-23
- 2.3 關系代數(shù)的性能評估方法23
- 2.4 空間利用率的評估方法23-24
- 2.5 本章小結24-25
- 3 基于寬表的數(shù)據(jù)存儲機制25-45
- 3.1 多擴展表數(shù)據(jù)存儲模式25-29
- 3.2 多擴展表存儲機制的模式映射29-34
- 3.2.1 多擴展表的劃分29-31
- 3.2.2 租戶數(shù)據(jù)信息持久化31-34
- 3.3 多擴展表模式的查詢重寫34-37
- 3.3.1 私有表 SQL 定義的生成35-36
- 3.3.2 私有表 SQL 定義緩存管理器36-37
- 3.3.3 查詢重寫37
- 3.4 多擴展表模式的 Basic 緩存管理37-41
- 3.5 實驗分析41-44
- 3.5.1 數(shù)據(jù)存儲空間利用率分析41-42
- 3.5.2 查詢效率分析42-44
- 3.6 本章小結44-45
- 4 基于關系代數(shù)的多租戶數(shù)據(jù)存儲模式性能評估方法45-53
- 4.1 視圖定義45-47
- 4.2 SQL 到關系代數(shù)的轉化算法47-48
- 4.3 關系代數(shù)評估方法48-50
- 4.4 評估驗證及實驗分析50-52
- 4.4.1 實驗平臺50-52
- 4.5 本章小結52-53
- 5 總結與展望53-56
- 5.1 總結53-54
- 5.2 展望54-56
- 參考文獻56-59
- 致謝59-60
- 個人簡歷60
- 在讀期間發(fā)表的論文及參與的項目60
- 發(fā)表論文60
- 參與項目60
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 劉玉葆;黃志蘭;傅慰慈;印鑒;;基于有損分解的數(shù)據(jù)隱私保護方法[J];計算機研究與發(fā)展;2009年07期
2 孔蘭菊;李慶忠;史玉良;王學;;面向SaaS應用基于鍵值對模式的多租戶索引研究[J];計算機學報;2010年12期
3 姚金成;張世棟;史玉良;李慶忠;;基于Chunk Folding的多租戶數(shù)據(jù)庫緩存管理機制[J];計算機學報;2011年12期
4 汪德帥;張一川;張斌;劉瑩;;面向多租約SaaS應用的負載均衡機制研究與實現(xiàn)[J];小型微型計算機系統(tǒng);2012年01期
本文編號:555812
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/555812.html
最近更新
教材專著