0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

未来大数据时代,Hadoop会被Spark取代?

倩倩 来源:IT168 2020-03-20 14:12 次阅读

由雅虎为工程师和数据科学家打造的Apache Hadoop曾因巨大的潜力而备受称赞,但如今它却受到了更快的产品的影响,而这些产品往往来自于它本身的生态系统——Spark就是其中之一。今年早些,H20.ai的创始人Sri Ambati对Datanami 曾说:“Spark将会使Hadoop处于绝地”。

但在过去的几年中,Hadoop似乎并没有出现过任何衰退的迹象。在2015年Atscale的调查报告中显示:“在未来3个月内,已经有超过 76%的人使用Hadoop来做更多的工作。”这些受访者中大约有一半声称他们利用Hadoop工作中获得了一定的价值。Hadoop作为一个十多年的老品牌,在产品的采用方面并没有减缓下降的趋势,Spark也并没有做到真正取代Hadoop。空口无凭,下面我们从以下几个方面来分析一下Spark在未来的几年之内到底能不能真正的取代Hadoop。

按行业划分的市场渗透率

毫无疑问,为专家设计的产品一般都会停留在原来的轨道上,在其他方面不会有所涉及。但Spark在各个行业都存在一些有意义的分布,这可能要归功于各种市场上的大数据的泛滥。所以,虽然Spark可能有更广泛的应用,但Hadoop仍然支配着原本预期的用户群。

主要地理市场

在全球范围内,我们可以看到Informatica处于中心位置——在欧洲和美洲整体市场份额占比达32%。在两年半的时间里,我们跟踪了Informatica在云市场和工业领域的增长,结果显示达到了50%的增长,而且在高等教育领域也处于领先地位。上周, Informatica被Gartner评为主数据管理解决方案2017年魔力象限的领导者。而Hadoop仍然停留于过去成功的地理市场中。

公司规模的采用趋势

在企业客户中Spark也没有大范围的涉及。我们注意到世界上大多数公司规模较小,一般都为1-50名员工,所以Spark似乎并不是任何规模公司的唯一选择。对于那些已经使用Hadoop的人来说,这个产品也对企业和公司起到了一定的作用,而且 Hadoop并不仅限于一种用户。而Hadoop无论在何种规模的公司中,使用率相对于Spark还是非常高的。

写在最后

此外,在调查的过程中,传统的科技公司像eBay、Verizon、惠普和亚马逊等主流厂商已经开始使用Spark,但是Hadoop还没有被大规模的抛弃。相反,用户使用Spark作为系统的介绍,利用这个程序来突破Hadoop的障碍,两者的结合,使得工作更高效的完成。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Hadoop
    +关注

    关注

    1

    文章

    90

    浏览量

    15956
  • 大数据
    +关注

    关注

    64

    文章

    8862

    浏览量

    137278
收藏 人收藏

    评论

    相关推荐

    耳机座连接器:未来是否会被全部取代

    耳机座连接器作为音频设备的重要组成部分,长期以来在手机、电脑和音响等设备中占据着不可或缺的地位。随着科技的进步,耳机座连接器的未来似乎面临着许多挑战。本文将分析耳机座连接器是否会被全部取代的可能性,探讨其优缺点、市场趋势以及用户
    的头像 发表于 10-11 15:16 392次阅读
    耳机座连接器:<b class='flag-5'>未来</b>是否<b class='flag-5'>会被</b>全部<b class='flag-5'>取代</b>?

    耳机座接口会被TYPE-C取代吗?

    耳机座接口,即传统的3.5mm耳机插孔,一直以来都是音频设备的标准配置。然而,随着科技的发展和用户需求的变化,TYPE-C接口逐渐崭露头角,成为许多设备的主流选择。这一趋势引发了一个重要问题:耳机座接口会被TYPE-C取代吗?
    的头像 发表于 10-11 14:24 246次阅读

    基于Kepware的Hadoop大数据应用构建-提升数据价值利用效能

    处理超大数据集。 Hadoop的生态系统非常丰富,包括许多相关工具和技术,如Hive、Pig、HBase等,这些工具可以方便地构建复杂的大数据应用。Hadoop广泛应用于各种场景,包括
    的头像 发表于 10-08 15:12 119次阅读
    基于Kepware的<b class='flag-5'>Hadoop</b><b class='flag-5'>大数据</b>应用构建-提升<b class='flag-5'>数据</b>价值利用效能

    spark为什么比mapreduce快?

    减少的是磁盘I/O次数(相比于mapreduce计算模型而言),而不是shuffle次数,因为shuffle是根据数据重组的次数而定,所以shuffle次数不能减少   所以总结spark
    的头像 发表于 09-06 09:45 213次阅读

    spark运行的基本流程

    前言: 由于最近对spark的运行流程非常感兴趣,所以阅读了《Spark大数据处理:技术、应用与性能优化》一书。通过这本书的学习,了解了spark的核心技术、实际应用场景以及性能优化的
    的头像 发表于 07-02 10:31 359次阅读
    <b class='flag-5'>spark</b>运行的基本流程

    Spark基于DPU的Native引擎算子卸载方案

     和 R 等多种高级编程语言,这使得Spark可以应对各种复杂的大数据应用场景,例如金融、电商、社交媒体等。 Spark 经过多年发展,作为基础的计算框架,不管是在
    的头像 发表于 06-28 17:12 499次阅读
    <b class='flag-5'>Spark</b>基于DPU的Native引擎算子卸载方案

    如何利用DPU加速Spark大数据处理? | 总结篇

    SSD速度通过NVMe接口得到了大幅提升,并且网络传输速率也进入了新的高度,但CPU主频发展并未保持同等步调,3GHz左右的核心频率已成为常态。 在当前背景下Apache Spark大数据处理工具中,尽管存储和网络性能的提升极大地减少了
    的头像 发表于 04-02 13:45 993次阅读
    如何利用DPU加速<b class='flag-5'>Spark</b><b class='flag-5'>大数据</b>处理? | 总结篇

    Spark基于DPU Snappy压缩算法的异构加速方案

    一、总体介绍 1.1 背景介绍 Apache Spark是专为大规模数据计算而设计的快速通用的计算引擎,是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些不同之处使
    的头像 发表于 03-26 17:06 733次阅读
    <b class='flag-5'>Spark</b>基于DPU Snappy压缩算法的异构加速方案

    RDMA技术在Apache Spark中的应用

    背景介绍 在当今数据驱动的时代,Apache Spark已经成为了处理大规模数据集的首选框架。作为一个开源的分布式计算系统,Spark因其高
    的头像 发表于 03-25 18:13 1461次阅读
    RDMA技术在Apache <b class='flag-5'>Spark</b>中的应用

    基于DPU和HADOS-RACE加速Spark 3.x

    、Python、Java、Scala、R)等特性在大数据计算领域被广泛使用。其中,Spark SQL 是 Spark 生态系统中的一个重要组件,它允许用户以结构化数据的方式进行
    的头像 发表于 03-25 18:12 1275次阅读
    基于DPU和HADOS-RACE加速<b class='flag-5'>Spark</b> 3.x

    解锁电梯大数据平台的商业价值与未来展望

    在智能建筑领域,电梯大数据平台作为关键技术之一,正逐渐成为行业的焦点。本文深圳梯云物联科技有限公司小编将深入探讨电梯大数据平台的商业价值以及未来展望,为您揭示这一领域的无限可能。
    的头像 发表于 03-25 10:51 365次阅读
    解锁电梯<b class='flag-5'>大数据</b>平台的商业价值与<b class='flag-5'>未来</b>展望

    浅析大数据时代下的数据中心运维管理

    浅析大数据时代下的数据中心运维管理 张颖姣 安科瑞电气股份有限公司 上海嘉定201801 摘要:本文将从数据中心运维管理的角度,联系现实情况,对运维管理进行研究,期望通过本项目的研究,
    的头像 发表于 02-22 14:40 336次阅读
    浅析<b class='flag-5'>大数据</b><b class='flag-5'>时代</b>下的<b class='flag-5'>数据</b>中心运维管理

    铜缆会被光纤完全取代吗?为什么光纤目前取代不了铜缆?

    铜缆会被光纤完全取代吗?为什么光纤目前取代不了铜缆? 随着科技的进步和互联网的迅猛发展,数字通信技术也取得了巨大的突破。铜缆作为传统的网络连接媒介,在过去几十年里扮演了重要的角色,但随着光纤技术
    的头像 发表于 02-04 10:25 1063次阅读

    米哈游大数据云原生实践

    近年来,容器、微服务、Kubernetes 等各项云原生技术的日渐成熟,越来越多的公司开始选择拥抱云原生,并开始将 AI、大数据等类型的企业应用部署运行在云原生之上。以 Spark 为例,在云上运行
    的头像 发表于 01-09 10:41 558次阅读
    米哈游<b class='flag-5'>大数据</b>云原生实践

    GPU:大数据时代的强力引擎

    现如今,我们正身处于数据爆炸的时代,大规模的数据正在重新定义着科技和商业的规则。GPU(GraphicsProcessingUnit,图形处理单元)技术已经成为科技创新的关键利器,极大地提高了系统
    的头像 发表于 01-04 08:27 658次阅读
    GPU:<b class='flag-5'>大数据</b><b class='flag-5'>时代</b>的强力引擎