天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Compatible Study of Hadoop for Efficient Analyzing and Proce

發(fā)布時(shí)間:2021-01-02 04:02
  在利用計(jì)算機(jī)的同時(shí),數(shù)據(jù)不斷產(chǎn)生和積累。導(dǎo)致的問題是在哪里保存這些數(shù)據(jù)?過去解決此問題,存儲(chǔ)成本過大。然而,由于近來技術(shù)的發(fā)展,存儲(chǔ)費(fèi)用已減少。大數(shù)據(jù)是數(shù)據(jù)集的集合,而數(shù)據(jù)集的規(guī)模更大且涉及面更廣,使用傳統(tǒng)的數(shù)據(jù)庫(kù)管理工具很難處理。同時(shí),使用傳統(tǒng)方法處理大量數(shù)據(jù)集非常耗時(shí),因此,比傳統(tǒng)方法更快,效率更高的Hadoop框架被廣泛使用。主要目標(biāo)是對(duì)不斷產(chǎn)生的數(shù)據(jù)進(jìn)行處理,效率更高,耗時(shí)更少,并且不用存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)主要分為三類:結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。為了處理這些巨大的數(shù)據(jù)集,Hadoop中提供了不同類型的框架。我們主要關(guān)注Pig、Hive和Impala這三個(gè)不同的框架,圍繞如何有效分析結(jié)構(gòu)化數(shù)據(jù)集并減少結(jié)構(gòu)化數(shù)據(jù)集的時(shí)間消耗展開系統(tǒng)研究。我們通過將三種Hadoop框架應(yīng)用于兩個(gè)不同的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)比較,檢查數(shù)據(jù)處理效率。具體來說,我們?cè)贖ive,Pig和Impala上執(zhí)行類似的任務(wù)并完成實(shí)驗(yàn)結(jié)果評(píng)測(cè)。結(jié)果表明,Impala比Hive和Pig效率更高,因?yàn)閳?zhí)行任務(wù)所需的時(shí)間更少。 

【文章來源】:西南科技大學(xué)四川省

【文章頁(yè)數(shù)】:59 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
CHAPTER1 INTRODUCTION
    1.1 Introduction
    1.2 Big Data Definitions
    1.3 Research Background
        1.3.1 Big Data Applications
        1.3.2 Challenges of Big Data
        1.3.3 Apache Hadoop
        1.3.4 Hadoop Environment
        1.3.5 Hadoop Architecture and Design
        1.3.6 Hadoop Distributed File System(HDFS)
        1.3.7 MapReduce
        1.3.8 Hadoop Ecosystem
    1.4 Objective of Research
    1.5 Contributions and Significance of Research
CHAPTER2 Related Work/Review of Literature
    2.1 INTRODUCTION
    2.2 Review of Literature
Chapter3 Methodology
    3.1 Completely Unstructured Data
    3.2 Semi-Structured Data
    3.3 Structured Data
    3.4 Estimation Technique
    3.5 Apache PIG-based Calculating
    3.6 Apache HIVE-based Data Storage
    3.7 Apache IMPALA-based Data Management
Chapter4 Experiment and Results
    4.1 Dataset
    4.2 System Requirements
    4.3 Apache Pig
        4.3.1 Contents of our Input File
        4.3.2 Copying the Input File
        4.3.3 Executing the Pig commands on File
        4.3.4 Mapper and Reducer Running Job
        4.3.5 Output
    4.4 Apache Hive
        4.4.1 Create Table and Loading the Data
        4.4.2 Query Execution
        4.4.3 Mapper and Reducer Running Job
    4.5 Apache Impala
        4.5.1 Contents of Input File
        4.5.2 Create Table and Loading the Data
        4.5.3 Query Execution
        4.5.4 Output
    4.6 Comparison of Results(Pig,Hive Impala)
Chapter5 Conclusion and Future Work
    5.1 Conclusion
    5.2 Future Work
Reference
ACKNOWLEDGEMENTS
Academic Achievements
DEDICATION



本文編號(hào):2952612

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2952612.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶42bc8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产欧美亚洲精品自拍| 久久精品国产亚洲熟女| 青青操视频在线播放免费| 亚洲国产成人精品福利| 成人精品网一区二区三区| 国产又爽又猛又粗又色对黄| 激情图日韩精品中文字幕| 日韩人妻毛片中文字幕| 日韩不卡一区二区三区色图| 日本深夜福利在线播放| 日韩高清中文字幕亚洲| 日韩精品一区二区三区av在线| 亚洲综合日韩精品欧美综合区| 精品国产品国语在线不卡| 亚洲香艳网久久五月婷婷| 国产精品免费视频专区| 五月激情综合在线视频| 加勒比人妻精品一区二区| 99久久精品视频一区二区| 加勒比系列一区二区在线观看| 日本一区不卡在线观看| 国产精品欧美在线观看| 丰满人妻熟妇乱又伦精另类视频| 国产精品久久久久久久久久久痴汉| 欧美同性视频免费观看| av国产熟妇露脸在线观看| 天堂网中文字幕在线观看| 色一情一乱一区二区三区码| 欧美日韩一级黄片免费观看| 日韩女优视频国产一区| 开心五月激情综合婷婷色| 久久精品国产亚洲av久按摩| 在线亚洲成人中文字幕高清| 久久精品一区二区少妇| 成人精品日韩专区在线观看 | 小草少妇视频免费看视频| 国产欧美日韩在线精品一二区| 日韩午夜老司机免费视频| 91爽人人爽人人插人人爽| 深夜视频在线观看免费你懂| 亚洲男人的天堂就去爱|