分布式存儲系統(tǒng)HBase性能調(diào)優(yōu)方法的研究與實(shí)現(xiàn)
發(fā)布時間:2021-01-05 20:22
隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)庫中數(shù)據(jù)量急劇增長,同時數(shù)據(jù)訪問量也逐漸增大,導(dǎo)致系統(tǒng)功能的響應(yīng)時間越來越慢。在實(shí)際系統(tǒng)中,一些功能的響應(yīng)時間隨著數(shù)據(jù)規(guī)模的增大而變大,數(shù)據(jù)插入、檢索的響應(yīng)時間也越來越大。因此如何通過優(yōu)化HBase的性能降低系統(tǒng)功能的響應(yīng)時間成為該系統(tǒng)的一個重要問題,同時也是工業(yè)界以及學(xué)術(shù)界亟待解決的一個重要問題。針對上述提出的數(shù)據(jù)庫性能優(yōu)化問題,本文通過調(diào)研并總結(jié)與非關(guān)系型數(shù)據(jù)庫性能優(yōu)化相關(guān)的國內(nèi)外研究現(xiàn)狀,選擇當(dāng)前主流的分布式存儲系統(tǒng)HBase作為研究對象,實(shí)現(xiàn)了一種HBase性能調(diào)優(yōu)方法。在大量實(shí)驗(yàn)樣本數(shù)據(jù)的基礎(chǔ)上,采用隨機(jī)森林算法分析HBase性能與參數(shù)之間的關(guān)系,從而構(gòu)建HBase吞吐量和延遲預(yù)測模型;陬A(yù)測模型,提出改進(jìn)的遺傳算法對HBase性能進(jìn)行優(yōu)化,最終實(shí)現(xiàn)HBase性能調(diào)優(yōu)方法。本文的研究內(nèi)容主要包含以下幾個方面:(1)特征篩選與訓(xùn)練樣本生成。根據(jù)HBase官方文檔中的描述,對HBase特征進(jìn)行兩次篩選,得到影響HBase性能的參數(shù)集合。接著進(jìn)行訓(xùn)練樣本的生成,采用正交試驗(yàn)設(shè)計方法來選擇具有代表性的特征樣本進(jìn)行實(shí)驗(yàn),獲取吞吐量和延遲的實(shí)驗(yàn)值。(2)預(yù)測模...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
UH工作負(fù)載實(shí)驗(yàn)運(yùn)行結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]隨機(jī)森林理論淺析[J]. 董師師,黃哲學(xué). 集成技術(shù). 2013(01)
博士論文
[1]分布式文件系統(tǒng)性能建模及應(yīng)用研究[D]. 趙鐵柱.華南理工大學(xué) 2011
碩士論文
[1]分布式系統(tǒng)性能測試與分析方法研究[D]. 劉瑋.大連理工大學(xué) 2011
本文編號:2959244
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
UH工作負(fù)載實(shí)驗(yàn)運(yùn)行結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]隨機(jī)森林理論淺析[J]. 董師師,黃哲學(xué). 集成技術(shù). 2013(01)
博士論文
[1]分布式文件系統(tǒng)性能建模及應(yīng)用研究[D]. 趙鐵柱.華南理工大學(xué) 2011
碩士論文
[1]分布式系統(tǒng)性能測試與分析方法研究[D]. 劉瑋.大連理工大學(xué) 2011
本文編號:2959244
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2959244.html
最近更新
教材專著