0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Snowflake上市预示大数据分析时代到来?

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-10-30 09:50 次阅读

1956 年,福特公司上市,成为有史以来最大的 IPO。由于融资规模巨大,这次公开募股,几乎囊括了华尔街的每一家公司,其中就包括巴菲特的伯克希尔哈撒韦。 64 年后的 2020 年 9 月,SNOWFLAKE 上市,成为有史以来软件行业最大的 IPO 案例。

同时,巴菲特继参与福特 IPO 之后再次出手,投资 SNOWFLAKE,这对于常年回避科技股的巴菲特来说,极为罕见。 虽然相隔 64 年,但由于巴菲特仅参与过这两次 IPO,于是,两件事被联系起来。某种意义上说,SNOWFLAKE 和当年的福特汽车颇有相似之处。

因流水线生产获得巨大成功,福特汽车真正地将汽车变成了工人阶级也能够买得起的快消品,这是对当时 “美国制造业翻天覆地的改革与创新”。 而 SNOWFLAKE,在数据分析领域做到了这一点。基于公有云和弹性计算,SNOWFLAKE 将数据分析工具变成了快消品。对下游企业用户来说,存储、处理和分析海量数据,成为了 “绑定一张企业信用卡,就能马上开始” 的快捷消费。 图|SNOWFLAKE 公司 (来源:企业) 国内新型分布式数据库公司 PingCAP 在海外与 SNOWFLAKE 有相似业务。

在与 DeepTech 谈到 SNOWFLAKE 模式成功的意义时,PingCAP 的 CTO 黄东旭打了一个比方,“SNOWFLAKE 出现之前,我出差只能在当地买房才能住,现在可以住酒店了,按时间算钱”。 通俗的讲,SNOWFLAKE 是一家提供数据分析工具的公司,这在投资领域,被称为 “卖铲子的人”。卖铲子是最好的商业模式之一,因为无论下游竞争如何激烈,总是要来买铲子挖矿的。这里的 “矿”,就是数据。 如今,数据已经成为 21 世纪最有价值的资产之一。根据世界经济论坛披露的资料显示,到 2020 年,全世界总的数据量达到 44 个泽字节(ZB),这意味着其数据量是可观测宇宙中星星数量的 40 倍。

而每天,互联网上产生 50 亿次搜索、发送 2940 亿封邮件、5 亿条推特被发出。 海量数据中,蕴藏着大量的商业机会。 图|人类已经进入大数据时代 (来源:pixabay) 根据麦肯锡全球研究院(MGI)的研究,几乎所有的行业都可以从充分利用大数据中获益。大数据的正确使用能够让零售商的营业利润率提升 60%;在美国,医疗保健行业创造性地使用大数据提升效率和质量,每年能多创造出 3000 亿美元的产值;美国的医疗支出也能因此降低 8%。 通过对海量数据的挖掘,从中获得有效洞察,对企业业务进行反馈调节,目前已经成为传统行业、互联网行业、新兴行业的刚需。

最强有力的证明来自于数据人才短缺的现状,在美国,对深度分析师需求的缺口达到 14 万 - 19 万人。麦肯锡预测,针对当前的数据量,需要 150 万名经理和数据分析师,才能有效地利用大数据。 这种 “从数据中获取洞察” 的商业逻辑,从本世纪第二个十年开始,在中美两个巨大的市场几乎同时取得了共识。2011 年,麦肯锡发布了《大数据:创新、竞争和生产力的下一个前沿》,给出定论:大数据的应用将会影响诸多行业,某些行业会得到更多的增益。在中国,分别于 2012 和 2014 年,涂子沛的《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》与《数据之巅:大数据革命、历史、现实和未来》两部书引发了中国社会对大数据的广泛讨论,作者提出,“除了上帝,每个人都要用数据说话”。

图|传统行业正在被大数据赋能 (来源:麦肯锡)

从此,数据驱动业务的模式逐渐形成并得到广泛认可。深谙此道的阿里巴巴在公开讨论中直接表示,使用数据决策的公司排名比较靠前,大多数基于直觉或经验(70%)的企业是落后者 大数据浪潮之下,隐藏在数据中的金矿足够诱人,挖矿的人足够多,卖铲子几乎是绝好的生意。2012 年,三位数据仓库专家秘密成立 SNOWFLAKE,2014 年,公司走出 “秘密模式”,今年,SNOWFLAKE 上市,以当日收盘价计,市值 704 亿美元。从零走到现在,SNOWFLAKE 只用了 8 年。 SNOWFLAKE 胜在何处?

SNOWFLAKE 的成功,源于一系列工程技术问题的解决和创新性的商业模式。用更准确的话讲,它解决了数据仓库的遗留痛点,利用云原生的技术性优势,采取计算、存储分离架构,为客户提供了灵活、按需付费的方案。

要充分理解 SNOWFLAKE 产品的革命性之处,就要知道在此前通用的数据处理工具是怎样的。对于一家有数据处理需求的企业,如果使用 Hadoop 技术自行搭建数据处理平台,首先要有若干台能存储这些海量信息的计算机。

黄东旭说,有时候需要采购几十台,甚至上百台电脑,存储公司上百 T 字节的数据,然后再购买数据分析软件,下载到电脑上,交给数据分析师使用。 这种模式非常 “笨重”—— 企业要一次性支出大量资金,购买设备(计算机、服务器)和软件,但是每天至少一半时间(夜间)是不使用它们的。这就好比买了一辆私家车,每天只有上下班使用,大部分时间躺在车库里,但是维护、保养费用一点也不会少。 对于那些资金实力有限、但是一样想涉足数据分析的小公司来说,这种模式更加不友好。小公司成长迅速,产生的数据也会迅速增长,一年前搭建起来的系统,可能一年后就无法承载海量数据运行,只能再次添加设备。久而久之,整个系统会越来越臃肿。而对于初创公司而言,它们可能连支付这些设备的钱也拿不出来。

SNOWFLAKE 采用了一种新模式。 SNOWFLAKE 是一个提供数据分析仓储服务的 SaaS 软件,SaaS 是 Software-as-a-Service 的缩写,意思是软件即服务。使用 SaaS 软件可以克服使用 Hadoop 自建系统的弊端,但 SNOWFLAKE 没有止步于此,而是超越了 SaaS 软件的旧有模式。 从 SNOWFLAKE 官方文档来看,这种 “超越” 至少体现在 3 个方面:一是使用 SNOWFLAKE 的用户不需要安装、配置任何硬件;二是软件也无需安装,系统在云端运行;三是整个系统的维护、管理和优化都由 SNOWFLAKE 负责,用户不需要亲力亲为。 为了能实现这种便捷、高效、简洁的设计,SNOWFLAKE 在产品架构上进行了优化。

首先是通过与微软、谷歌、亚马逊等主流云存储企业合作,SNOWFLAKE 实现了提供 “跨云” 服务,这意味着,不论用户的数据是存储在哪一家公司的云端,都能接入 SNOWFLAKE 进行数据分析。这在从前,用户需要从云端下载到本地再分析,如今一切都发生在云端。 再者,SNOWFLAKE 采用了解耦结构,允许各个组件彼此保留完全自治且无意识的复杂工作框架,这种架构使得数据存续和计算能够在任何一个云平台分开、独立运行。在这种架构下,SNOWFLAKE 实现了一种和传统 SaaS 与 Hadoop 自建系统完全不同的收费模式—— 真正的 Pay as you go(量入为出)。

这种收费模式的意义在于,用户在云端使用 SNOWFLAKE 的数据分析工具,存储、算力都可以由其提供,用户需要支付的费用,是根据分析的数据量和运算时间给出的。这意味着下游用户完全抛弃了自建服务器、购买计算机、订阅数据分析软件的模式。量入为出,现收现付,“吃多少就掏多少钱”,并且是先看到效果,再付费,付费后置,效果前置。 传统 SaaS 按照订阅模式,提前支付月费或年费,先付钱,再使用,付费前置而效果后置,导致成本无法量化。 二者对比,高下立判。SNOWFLAKE 用户不再需要提前支付一笔固定年费,平台会根据实际使用中的计算和存储用量结算 —— 成本可测。

图|SNOWFLAKE 产品架构图 (来源:公司网站)

用一个更恰当的比喻,就是买车和打车。在 SNOWFLAKE 模式出现之前,用户想要出行(海量数据分析),要么买车(自建系统),要么一次性租一年车(SaaS 年费订阅)。现在,可以打车(SNOWFLAKE 模式),收费是根据里程数(数据量)和乘车时间(计算时间)共同算出的。

打车,几乎能涵盖所有的高、中、低端客户。这便是 “Pay as you go” 的精髓所在,也是 SNOWFLAKE 短短几年,疯狂收获客户的根本原因 —— 它把降本增效做到了极致。 中金资本也曾经表示:“Snowflake 背后的价值体现绝不仅仅来自于云原生技术。SNOWFLAKE 的创始团队来自于 IBM、Oracle 等传统数据库的创始团队,天生具备企业级软件基因。同时,其营收大量来自于包括全球 500 强在内的大型企业,并呈现平稳的、持续的增长,契合企业级服务能力的商业价值。

从技术上看,Snowflake 通过跨云的分布式能力,协助客户摆脱单一云平台的锁定。 2015 年,公司发布第一款产品,到 2018 年,公司经过一个为期 3 年的冷启动期。时任首席执行官 Bob Muglia 将公司从最初的 80 个客户发展到 1000 个客户。而在过去的 12 个月里,SNOWFLAKE 迎来了爆发式增长,公司客户从 1547 个增加到 3117 个,其中就包括财富 10 强中的 7 家和财富 500 强中的 146 家。 与此对应的,是公司高端客户的增长。为 SNOWFLAKE 营收贡献超过 100 万美元的客户,占比从 2019 财年的 14% 增长到本财年的 41%。

根据黄东旭的说法,SNOWFLAKE 的优势体现在技术架构层面上。整合各家云存储厂商,将其封装后,SNOWFLAKE 成为最上端面向客户的一层,听起来很容易,但是在实际操作过程中会有很多问题,比如如何保证运行稳定性、提高运行效率、保障数据安全性等等。 原理易懂,做起来还是要费些周折,中国公司想学 SNOWFLAKE,并非不能做。但为何在国内,没有看到一家像 SNOWFLAKE 一样,估值上百亿、爆发式增长的公司呢? 黎明前的宁静 SNOWFLAKE 这个互联网创新的好榜样,之所以没有被复制到中国,是由中美两个市场商业发展进程和从业人员观念不同导致的。

黄东旭告诉 DeepTech,在国内一些大企业,采购制度成为企业无法使用 “Pay as you go” 服务的障碍。这些企业需要在前一年制定好下一年的预算,每一块钱怎么花是确定的,僵硬的规定下,企业很难接受 “先使用,后付费” 的模式。 此外,“重硬轻软” 的落后思想作祟,让一些中国企业不认为软件是资产。传统的海量数据分析模式,即采购一批计算机、服务器,这些看得见摸得着的东西让企业心里更踏实。 即便有上述障碍,未来 “中国版 SNOWFLAKE” 的诞生也具有必然性。

黄东旭对此有信心,“采购模式与重硬轻软” 会随着商业的发展而改变,最终企业会接受性价比更高、驱动业务创新更快的方式。他说,“当前很多互联网企业已经摆脱了老旧采购模式的桎梏,他们是未来潜在的 SNOWFLAKE 类似服务的用户”。 现在,更大的瓶颈是企业数据上云。DeepTech 提出这样一个问题:“到什么时候,中国初创公司可以开始做 SNOWFLAKE 这样的业务?”黄东旭认为,当中国的企业,它们的数据开始大规模上云的时候,时机就到了。 在美国,企业数据上云已经成为普遍选择。而反观国内,还处在初级阶段,企业由于对安全性的担心、政策法规的要求等诸多原因,不愿或不能上云。

而 SNOWFLAKE 的服务,就是建立在云原生基础上的。 黄东旭认为,未来一定会有一家创业公司,把国内各大云存储企业整合起来,提供类似的服务,“这只是时间问题”。2020 年 8 月,财富 500 强中,中国企业数量(124 家)首次超过美国(121 家),考虑中美两个市场体量的对比,SNOWFLAKE 上市市值 704 亿美元,那未来中国的 “SNOWFLAKE” 价值几何呢?

原文标题:巴菲特罕见出手科技股,Snowflake上市预示大数据分析“快消品“时代到来?

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    11108

    浏览量

    103021
  • 数据分析
    +关注

    关注

    2

    文章

    1429

    浏览量

    34019
  • 大数据
    +关注

    关注

    64

    文章

    8864

    浏览量

    137307

原文标题:巴菲特罕见出手科技股,Snowflake上市预示大数据分析“快消品“时代到来?

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LLM在数据分析中的作用

    随着大数据时代到来数据分析已经成为企业和组织决策的关键工具。数据科学家和分析师需要从海量
    的头像 发表于 11-19 15:35 147次阅读

    RNN在实时数据分析中的应用

    随着大数据时代到来,实时数据分析变得越来越重要。在众多的机器学习模型中,递归神经网络(Recurrent Neural Networks,简称RNN)因其在处理序列
    的头像 发表于 11-15 10:11 197次阅读

    raid 在大数据分析中的应用

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)在大数据分析中的应用主要体现在提高存储系统的性能、可靠性和容量上。以下是RAID在大数据分析
    的头像 发表于 11-12 09:44 162次阅读

    emc技术在大数据分析中的角色

    在当今这个数据驱动的世界中,大数据分析已经成为企业获取洞察力、优化业务流程和提高竞争力的关键工具。随着数据量的爆炸性增长,企业面临着如何有效存储、处理和分析这些
    的头像 发表于 11-01 15:22 219次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量数据 云计算提供了强大的存储和计算能力
    的头像 发表于 10-24 09:18 323次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析 大数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量数据
    的头像 发表于 10-09 15:32 187次阅读
    IP 地址<b class='flag-5'>大数据分析</b>如何进行网络优化?

    数据分析除了spss还有什么

    数据分析是当今世界中一个非常重要的领域,它涉及到从大量数据中提取有用信息、发现模式和趋势,并为决策提供支持。SPSS(Statistical Package for the Social
    的头像 发表于 07-05 15:01 547次阅读

    数据分析的工具有哪些

    数据分析是一个涉及收集、处理、分析和解释数据以得出有意义见解的过程。在这个过程中,使用正确的工具至关重要。以下是一些主要的数据分析工具,以及它们的功能和用途的介绍。 Excel Exc
    的头像 发表于 07-05 14:54 775次阅读

    数据分析有哪些分析方法

    数据分析是一种重要的技能,它可以帮助我们从大量的数据中提取有价值的信息,从而做出更明智的决策。在这篇文章中,我们将介绍数据分析的各种方法,包括描述性分析、诊断性
    的头像 发表于 07-05 14:51 533次阅读

    机器学习在数据分析中的应用

    随着大数据时代到来数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从
    的头像 发表于 07-02 11:22 546次阅读

    大数据分析平台网站

    大数据分析平台是一种用于处理和分析大规模数据集的系统,旨在从海量数据中提取有价值的信息和洞察。以下是大数据分析平台的主要功能和应用场景: 主
    的头像 发表于 06-28 15:46 599次阅读

    求助,关于AD采集到的数据分析问题

    问题描述:使用AD采集一个10Hz到2MHz的脉冲,脉冲底部可能大于零,由采集到的数据分析出该脉冲的上升时间,幅值和占空比。 备注:在分析的时候已经知道脉冲的频率,精度为2X10^-5. 在分析
    发表于 05-09 07:40

    企业如何使用SNP Glue将SAP与Snowflake集成?

    客户非常感兴趣的数据目标之一是SnowflakeSnowflake是一个基于云的数据仓库平台,旨在处理和分析大量
    的头像 发表于 04-17 11:34 287次阅读

    广告投放公司运用大数据分析,实现精准投放

    广告投放公司运用大数据分析,实现精准投放 随着大数据技术的不断发展,广告投放行业正经历着一场深刻的变革。传统的广告投放方式已经难以满足市场需求,而大数据分析则为广告投放带来了精准、高效的解决方案
    的头像 发表于 04-11 11:23 820次阅读

    Get职场新知识:做分析,用大数据分析工具

    综合分析。但现在有了大数据分析工具,一切问题都可迎刃而解。 大数据分析工具,顾名思义就是专门为分析海量数据而开发的一类工具。这类工具具有极强
    发表于 12-05 09:36