天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于大數(shù)據(jù)的Hadoop并行計算優(yōu)化處理性能分析

發(fā)布時間:2019-03-28 12:24
【摘要】:隨著近年來新一代移動通信、物聯(lián)網(wǎng)、云計算等新興技術(shù)的發(fā)展和普及,數(shù)據(jù)流量呈現(xiàn)爆發(fā)式增長,原有通信系統(tǒng)中的數(shù)據(jù)處理壓力增大。而分布式計算Hadoop中的MapReduce編程架構(gòu)憑借其強大的數(shù)據(jù)處理能力已經(jīng)在文本分析、自然語言處理、商業(yè)數(shù)據(jù)處理等領(lǐng)域內(nèi)成為比較成熟的解決方案,,能夠滿足現(xiàn)階段通信領(lǐng)域的數(shù)據(jù)處理需求。但隨著數(shù)據(jù)量的進一步增大、涉及的配置參數(shù)進一步增加,配置參數(shù)優(yōu)化成為目前限制MapReduce性能的主要瓶頸。Hadoop配置涉及了200多個參數(shù),其中有約13左右會對運行的作業(yè)產(chǎn)生較大的影響,這些參數(shù)恰恰決定了集群整體的性能表現(xiàn)。圍繞上述問題,本文以性能調(diào)優(yōu)為基礎(chǔ),設(shè)計一種新型的參數(shù)配置分析系統(tǒng),能夠針對每一個作業(yè)得到相應(yīng)的最優(yōu)化的參數(shù)配置。 本文在原有MapReduce框架的基礎(chǔ)上提出了三個新的邏輯部件:參數(shù)分析器、參數(shù)判決引擎、基于代價的優(yōu)化模型。其中,參數(shù)分析器會在未修改的MapReduce程序中收集相關(guān)統(tǒng)計信息;參數(shù)判決引擎會對各個參數(shù)域進行細(xì)化的預(yù)測;基于代價的優(yōu)化模型則是在前兩者的基礎(chǔ)上將參數(shù)配置簡單化,給出最優(yōu)化參數(shù)。上述三個部件綜合使用下,可以針對每一個作業(yè)給出最優(yōu)化的參數(shù)配置。 通過對MapReduce主要領(lǐng)域內(nèi)的典型應(yīng)用:詞頻統(tǒng)計、詞共現(xiàn)統(tǒng)計、排序進行優(yōu)化后參數(shù)的綜合評估來驗證本文提出的三個邏輯部件的有效性。經(jīng)過測試和驗證,經(jīng)過本文所設(shè)計的三個邏輯部件得出的最優(yōu)化參數(shù)相比較經(jīng)驗法則與默認(rèn)參數(shù)在解決Hadoop服務(wù)器集群的性能瓶頸問題上具有優(yōu)越性和有效性。新的優(yōu)化模型將參數(shù)配置簡單化,且具有創(chuàng)新性和實用性。
[Abstract]:With the development and popularization of new generation mobile communication, Internet of things, cloud computing and other new technologies in recent years, the data flow increases explosively, and the pressure of data processing in the original communication system increases. The MapReduce programming architecture in distributed computing Hadoop has become a mature solution in the fields of text analysis, natural language processing, business data processing and so on with its powerful data processing ability. It can meet the requirement of data processing in the field of communication. However, as the amount of data increases, the configuration parameters involved further increase, configuration parameters optimization has become the main bottleneck limiting the performance of MapReduce. Hadoop configuration involves more than 200 parameters, About 13 of them will have a great impact on the running jobs, and these parameters determine the performance of the cluster as a whole. Based on performance tuning, a new type of parameter configuration analysis system is designed in this paper, which can optimize the configuration of parameters for each job. In this paper, based on the original MapReduce framework, three new logical components are proposed: parameter analyzer, parameter decision engine and cost-based optimization model. Among them, the parameter analyzer will collect the relevant statistics in the unmodified MapReduce program, and the parameter decision engine will refine the prediction of each parameter domain. The cost-based optimization model simplifies the configuration of parameters on the basis of the first two and gives the optimal parameters. Under the combined use of the above three components, the optimal parameter configuration can be given for each job. The validity of the three logic components proposed in this paper is verified by the comprehensive evaluation of the optimized parameters of the typical applications in the main fields of MapReduce: word frequency statistics, word co-occurrence statistics and ordering. After testing and verification, compared with the optimal parameters obtained by the three logical components designed in this paper, the rule of thumb and the default parameters are superior and effective in solving the bottleneck problem of Hadoop server cluster performance. The new optimization model simplifies the configuration of parameters and is innovative and practical.
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP274.2;TN92

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 謝曉蘭,韓可軼,王林;提高Java程序性能的若干方法[J];計算機與現(xiàn)代化;2005年08期

2 鄭小蓉;;高職學(xué)院學(xué)生信息管理系統(tǒng)性能優(yōu)化問題分析[J];中國新技術(shù)新產(chǎn)品;2009年22期

3 王曉東;;淺談計算機性能優(yōu)化技術(shù)中的問題及對策[J];計算機光盤軟件與應(yīng)用;2014年03期

4 王玉蘭;“九七”計算機系統(tǒng)的性能優(yōu)化[J];電信技術(shù);2002年02期

5 馬晶;;信息系統(tǒng)中數(shù)據(jù)庫的性能優(yōu)化[J];科技信息;2010年14期

6 張淑坤;;工藝流程改進在告警采集系統(tǒng)性能優(yōu)化中的應(yīng)用[J];計算機光盤軟件與應(yīng)用;2013年02期

7 劉軍,楊衛(wèi)春;九七系統(tǒng)性能優(yōu)化技術(shù)(二)[J];江西通信科技;2001年04期

8 陳蘇蓉;朱曉輝;;SQL Server 2008性能優(yōu)化研究[J];電腦知識與技術(shù);2009年34期

9 靳春霞;;計算機系統(tǒng)性能優(yōu)化研究[J];河南科技;2010年15期

10 徐躍偉;;網(wǎng)上購物系統(tǒng)的實現(xiàn)及性能優(yōu)化[J];計算機時代;2012年01期

相關(guān)會議論文 前10條

1 姚杰;;寶鋼不銹鋼系統(tǒng)數(shù)據(jù)庫性能優(yōu)化方案[A];中國計量協(xié)會冶金分會2007年會論文集[C];2007年

2 代桂平;殷保群;奚宏生;周亞平;;受控M/G/1排隊系統(tǒng)的性能優(yōu)化[A];第二十二屆中國控制會議論文集(下)[C];2003年

3 李彥;王屹;徐繼明;;ERP系統(tǒng)的性能優(yōu)化[A];全國煉鋼連鑄過程自動化技術(shù)交流會論文集[C];2006年

4 趙海波;楊昭;方箏;徐振軍;;燃?xì)鈮嚎s式熱泵系統(tǒng)全年季節(jié)性能優(yōu)化[A];中國制冷學(xué)會2007學(xué)術(shù)年會論文集[C];2007年

5 高明星;;DB2數(shù)據(jù)庫應(yīng)用性能優(yōu)化問題淺談[A];科技、工程與經(jīng)濟社會協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學(xué)術(shù)年會論文集[C];2004年

6 奚宏生;唐昊;殷保群;周亞平;;Markov控制過程在緊致行動集上的性能優(yōu)化[A];第二十一屆中國控制會議論文集[C];2002年

7 高明星;;DB2數(shù)據(jù)庫應(yīng)用性能優(yōu)化問題淺談[A];鐵道部信息技術(shù)中心成立30周年暨鐵路運輸管理信息系統(tǒng)(TMIS)工程全面竣工投產(chǎn)TMIS工程建設(shè)論文專輯(二)[C];2005年

8 高明星;;DB2數(shù)據(jù)庫應(yīng)用性能優(yōu)化問題淺談[A];中國鐵道學(xué)會——2004年度學(xué)術(shù)活動優(yōu)秀論文評獎?wù)撐募痆C];2005年

9 杜勁松;李強;包勁松;;國產(chǎn)600MW機組循環(huán)效率試驗及性能優(yōu)化分析[A];2008中國可持續(xù)發(fā)展論壇論文集(3)[C];2008年

10 杜勁松;李強;包勁松;;國產(chǎn)600MW機組循環(huán)效率試驗及性能優(yōu)化分析[A];全國火電大機組(600MW級)競賽第十二屆年會論文集(上冊)[C];2008年

相關(guān)重要報紙文章 前5條

1 陳翔;性能優(yōu)化只能救火[N];中國計算機報;2007年

2 本報記者 郭平;EMC簡單高效實現(xiàn)私有云[N];計算機世界;2010年

3 ;安圖特引入新型數(shù)據(jù)加速解決方案[N];人民郵電;2008年

4 陳洪康 郭寶群 李雪梅;淺談VLDB性能優(yōu)化與維護[N];人民郵電;2001年

5 驅(qū)動之家;加點“催化劑”引爆你的“鐳”[N];中國計算機報;2002年

相關(guān)博士學(xué)位論文 前6條

1 陳偉鋒;大規(guī)模復(fù)雜過程系統(tǒng)的高性能優(yōu)化理論與方法研究[D];浙江大學(xué);2011年

2 李磊;分布式系統(tǒng)中容錯機制性能優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2007年

3 賈海鵬;面向GPU計算平臺的若干并行優(yōu)化關(guān)鍵技術(shù)研究[D];中國海洋大學(xué);2012年

4 魏丫丫;Web傳輸?shù)男阅軆?yōu)化[D];清華大學(xué);2006年

5 何倩;P2P系統(tǒng)性能優(yōu)化若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2010年

6 毛宏燕;基于部分計值的服務(wù)性能優(yōu)化研究[D];上海交通大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 唐沙;工程信息管理系統(tǒng)的性能優(yōu)化研究[D];西南交通大學(xué);2007年

2 曹珂;教育管理軟件互操作應(yīng)用系統(tǒng)及其性能優(yōu)化[D];浙江大學(xué);2005年

3 劉

本文編號:2448861


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2448861.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶43a84***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
草草视频福利在线观看| 99日韩在线视频精品免费| 成人国产激情福利久久| 国产欧美日韩精品一区二| 五月激情综合在线视频| 超碰在线免费公开中国黄片| 绝望的校花花间淫事2| 欧美区一区二在线播放| 国产在线日韩精品欧美| 日本一区二区三区黄色| 日韩欧美国产亚洲一区| 99精品国产一区二区青青| 香蕉久久夜色精品国产尤物| 国产日韩欧美综合视频| 永久福利盒子日韩日韩| 五月情婷婷综合激情综合狠狠 | 欧美熟妇一区二区在线| 日韩精品综合免费视频| 日韩在线精品视频观看| 伊人天堂午夜精品草草网| 日本精品免费在线观看| 日韩国产传媒在线精品| 99秋霞在线观看视频| 国产精品第一香蕉视频| 午夜资源在线观看免费高清| 国产精品午夜小视频观看| 久久91精品国产亚洲| 成人午夜在线视频观看| 国产午夜福利不卡片在线观看| 91亚洲精品综合久久| 99国产高清不卡视频| 午夜视频免费观看成人| 日韩精品一区二区三区av在线| 欧美一区二区口爆吞精| 日韩欧美91在线视频| 婷婷九月在线中文字幕| 欧美日韩一级黄片免费观看| 日韩人妻毛片中文字幕| 欧美大粗爽一区二区三区| 精品少妇人妻av一区二区蜜桃| 日韩欧美中文字幕av|