基于寬表的多租戶數(shù)據(jù)存儲模式研究
發(fā)布時間:2017-07-18 03:15
本文關(guān)鍵詞:基于寬表的多租戶數(shù)據(jù)存儲模式研究
更多相關(guān)文章: 多租戶 數(shù)據(jù)存儲模式 擴(kuò)展表 關(guān)系代數(shù) I/O代價
【摘要】:多租戶數(shù)據(jù)存儲是軟件及服務(wù)(SaaS,Software as a Service)中一個重要的研究內(nèi)容。針對SaaS應(yīng)用“單實例多租賃”的特點,人們提出了很多解決多租戶數(shù)據(jù)存儲問題的方法,其中基于關(guān)系型數(shù)據(jù)庫模式映射的寬表存儲是一種常用、有效的SaaS多租戶數(shù)據(jù)存儲的解決方法。但為了保證租戶的定制需求,寬表存儲往往需要預(yù)留足夠的列,導(dǎo)致數(shù)據(jù)具有很大的稀疏性,同時模式映射較為復(fù)雜,影響數(shù)據(jù)空間利用率和查詢效率。 本文針對多租戶數(shù)據(jù)寬表存儲方法在數(shù)據(jù)空間利用率和查詢效率方面的不足,提出一種基于寬表的多擴(kuò)展表數(shù)據(jù)存儲機(jī)制,并且在此基礎(chǔ)上提出一種通用的多租戶數(shù)據(jù)存儲模式的數(shù)據(jù)查詢效率評估方法,,以此評估多擴(kuò)展表數(shù)據(jù)存儲模式與其他存儲模式的數(shù)據(jù)查詢效率。本文的主要工作如下: (1)提出多擴(kuò)展表數(shù)據(jù)存儲結(jié)構(gòu)。在寬表數(shù)據(jù)存儲模式的基礎(chǔ)之上加以改進(jìn),采用基本表與擴(kuò)展表結(jié)合方式代替原有的單一寬表解決多租戶數(shù)據(jù)存儲問題。擴(kuò)展表采用多個列數(shù)不同的表滿足租戶不同的定制需求,將租戶的定制數(shù)據(jù)分配到合適的擴(kuò)展表中,以最大限度的減少空值,提高數(shù)據(jù)存儲的空間利用率。通過計算數(shù)據(jù)稀疏度,該模式有效的降低了數(shù)據(jù)的稀疏性。 (2)提出多擴(kuò)展表方法中的模式映射機(jī)制。該機(jī)制包括基于業(yè)務(wù)數(shù)據(jù)的正態(tài)分布多擴(kuò)展表劃分方法和基于預(yù)留列的多擴(kuò)展表選擇方法,對多租戶的數(shù)據(jù)進(jìn)行合理的存儲,以及租戶邏輯數(shù)據(jù)到物理存儲位置的映射。 (3)提出一種基于關(guān)系代數(shù)的多租戶存儲模式查詢性能評估方法。通過建立租戶私有表數(shù)據(jù)與物理存儲數(shù)據(jù)的SQL定義,將SQL轉(zhuǎn)換為關(guān)系代數(shù),利用關(guān)系代數(shù)估計查詢操作的I/O代價。將多租戶存儲模式的查詢性能轉(zhuǎn)化為I/O查詢代價的比較,從而評估多租戶數(shù)據(jù)存儲模式的查詢性能。該方法將多租戶數(shù)據(jù)模式的查詢性能評估從實驗設(shè)計和硬件環(huán)境中分離,從本質(zhì)上比較存儲模式的優(yōu)劣。實驗表明,該方法雖然不能精確計算數(shù)據(jù)模式的查詢成本,但是對于數(shù)據(jù)模式之間的查詢性能對比有著顯著的效果。
【關(guān)鍵詞】:多租戶 數(shù)據(jù)存儲模式 擴(kuò)展表 關(guān)系代數(shù) I/O代價
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP333
【目錄】:
- 摘要4-5
- Abstract5-7
- 目錄7-10
- 圖的目錄10-11
- 1 引言11-16
- 1.1. 研究背景11-12
- 1.2. 國內(nèi)外研究現(xiàn)狀分析12-14
- 1.2.1 SaaS 模式的研究現(xiàn)狀12-13
- 1.2.2 多租戶數(shù)據(jù)存儲模式研究現(xiàn)狀13-14
- 1.3. 研究內(nèi)容14-15
- 1.4. 論文結(jié)構(gòu)15-16
- 2 相關(guān)技術(shù)16-25
- 2.1 SaaS 簡介16-17
- 2.1.1 SaaS 概念16
- 2.1.2 SaaS 與 SOA16-17
- 2.1.3 多租戶簡介17
- 2.2 多租戶數(shù)據(jù)模式17-23
- 2.2.1 私有表方法17-18
- 2.2.2 擴(kuò)展表方法18
- 2.2.3 Key-value 方法18
- 2.2.4 寬表方法18-21
- 2.2.5 多寬表方法21-23
- 2.3 關(guān)系代數(shù)的性能評估方法23
- 2.4 空間利用率的評估方法23-24
- 2.5 本章小結(jié)24-25
- 3 基于寬表的數(shù)據(jù)存儲機(jī)制25-45
- 3.1 多擴(kuò)展表數(shù)據(jù)存儲模式25-29
- 3.2 多擴(kuò)展表存儲機(jī)制的模式映射29-34
- 3.2.1 多擴(kuò)展表的劃分29-31
- 3.2.2 租戶數(shù)據(jù)信息持久化31-34
- 3.3 多擴(kuò)展表模式的查詢重寫34-37
- 3.3.1 私有表 SQL 定義的生成35-36
- 3.3.2 私有表 SQL 定義緩存管理器36-37
- 3.3.3 查詢重寫37
- 3.4 多擴(kuò)展表模式的 Basic 緩存管理37-41
- 3.5 實驗分析41-44
- 3.5.1 數(shù)據(jù)存儲空間利用率分析41-42
- 3.5.2 查詢效率分析42-44
- 3.6 本章小結(jié)44-45
- 4 基于關(guān)系代數(shù)的多租戶數(shù)據(jù)存儲模式性能評估方法45-53
- 4.1 視圖定義45-47
- 4.2 SQL 到關(guān)系代數(shù)的轉(zhuǎn)化算法47-48
- 4.3 關(guān)系代數(shù)評估方法48-50
- 4.4 評估驗證及實驗分析50-52
- 4.4.1 實驗平臺50-52
- 4.5 本章小結(jié)52-53
- 5 總結(jié)與展望53-56
- 5.1 總結(jié)53-54
- 5.2 展望54-56
- 參考文獻(xiàn)56-59
- 致謝59-60
- 個人簡歷60
- 在讀期間發(fā)表的論文及參與的項目60
- 發(fā)表論文60
- 參與項目60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 劉玉葆;黃志蘭;傅慰慈;印鑒;;基于有損分解的數(shù)據(jù)隱私保護(hù)方法[J];計算機(jī)研究與發(fā)展;2009年07期
2 孔蘭菊;李慶忠;史玉良;王學(xué);;面向SaaS應(yīng)用基于鍵值對模式的多租戶索引研究[J];計算機(jī)學(xué)報;2010年12期
3 姚金成;張世棟;史玉良;李慶忠;;基于Chunk Folding的多租戶數(shù)據(jù)庫緩存管理機(jī)制[J];計算機(jī)學(xué)報;2011年12期
4 汪德帥;張一川;張斌;劉瑩;;面向多租約SaaS應(yīng)用的負(fù)載均衡機(jī)制研究與實現(xiàn)[J];小型微型計算機(jī)系統(tǒng);2012年01期
本文編號:555812
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/555812.html
最近更新
教材專著