0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI搭台,Data+Analytics唱戏: Snowflake、Databricks 2023年度大会前瞻

jf_WZTOguxH 来源:AI前线 2023-06-26 14:36 次阅读

编者按:

每年仲夏之际,全球两大数据平台巨头 Snowflake、Databricks 均会召开各自的年度大会,成为数据圈的“超级碗”。随着竞争的加剧,Snowflake、Databricks 把 2023 年度重磅市场大会放在相同日期(6.26-6.29),充满着火药味。大会召开在即,云器科技作为专注数据领域的创业公司,策划一系列文章,从主题演讲、重点发布、客户案例等方面对比和解读这两个年度大会。本文是第一篇,对两个大会做前瞻对比,并预测最值得听的场。

发布会 Snowflake 抢到最重磅嘉宾, 但 Databricks 在生成式 AI 方向布局更早

Snowflake 和 Databricks 的 2023 年度市场大会都是在 6 月 26 日至 29 日举行,但地点不同,前者在拉斯维加斯,后者在旧金山。为了紧扣热点更吸引眼球,两家公司的大会主题都与 AI 和大模型有关,并邀请了重量级的嘉宾,Snowflake 请到了英伟达 CEO 黄仁勋,Databricks 请到了微软 CEO 萨蒂亚·纳德拉。

布局方面,主打 Data+AI 口号的 Databricks 显然更面向 AI,也布局更早。主推的 Lakehouse 湖仓一体架构天然更支持 AI 存储和计算,之后收购了由前 Google LLC 和 Dropbox Inc. 工程师创立的 AI 存储公司 Rubicon Inc. 近期推出自己的大语言开源模型 Dolly 和 Dolly 2.0。Databricks 将 Data+AI 的口号走的很彻底。而 Snowflake 去年年度大会的最重磅发布是收购 Streamlit 并面向数据应用构建生态,直到大语言模型火爆之后,才收购了 Neeva.ai(智能搜索公司),开始其在这个领域的布局。

展示各自的优势和差异化: Snowflake 和 Databricks 在产品和技术上并不尽相同。

Snowflake 更专注于围绕数据分析的数据仓库和查询处理,而 Databricks 更专注于数据科学和机器学习,本次大会两方在努力突出他们在 Lakehouse 市场的优势和差异化。据 Enterprise Technology Research 调研,36% 的 Snowflake 客户同时也是 Databricks 的客户,客户也在同时使用获得两者最大化组合优势(从 Snowflake 获得分析的优势,从 Databricks 获得 AI 的优势)。

从会议安排看,数据平台是核心,AI 是噱头

从会议的主题演讲看,Snowflake 会继续强调和推动DataCloud为核心的数据一体化和共享能力,基于Streamlit的一体化应用开发,以及生成式 AI 的可能性。特别值得一提的是,开源的Iceberg成为发布会介绍的关键字。在此,我们给出今年大会的一个合理猜测:Snowflake 会支持基于 iceberge 的开放数据架构,向湖仓一体迈进!

2a937752-13e3-11ee-962d-dac502259ad0.png

而反观 Databricks 的主题演讲,主线就非常明确且有持续性,重点强调三方面:LLM、Lakehouse Platform、OpenSource 软件。LLM 是今年新增的热点,也非常贴合 Data+AI 的定位。Lakehouse 经过 3 年持续推进,已经成为数据平台的新标准。OpenSource 作为老牌领域,今年新增大量的生态话题,包括一度看作竞对的 Presto/Trino 等。面对 Snowflake SaaS 化服务极致简单的竞争压力,Databricks 选择联合开源生态的力量。

2abe8d02-13e3-11ee-962d-dac502259ad0.png

两会的主题演讲都不约而同的强调生成式 AI,但如果看具体 session 组织,就会发现 AI 是噱头,真正的主线依然在高速增长的数据平台领域。(两家今年均声明 60% 的年化营收增长,在经济整体下行的今天,数据平台增长速度相当亮眼)。

Snowflake 年度发布会一共有 400 场 Session 之多,DataPlatform、DataApplication、DataAnalytics 是三个最大的主题,占据了一半的场次。ML/AI 相关的领域话题仅占 15%。考虑到 Snowflake 当前数据平台“一哥”的位置,这种“守正 + 出奇”的会议安排就不让人意外。

2ad76c3c-13e3-11ee-962d-dac502259ad0.png

而 Databricks 的议题安排略显不同。DataEngineering 作为主线占据 1/4 的议题,之后是 ML/DataScience 部分,要注意这里面的 ML/DataScience 并不仅仅是生成式 AI,而是包含了大量“传统”的机器学习和算法部分(例如 SparkML)。特别的,在这些 session 的介绍中,Databricks 最重点强调的是 Lakehouse 架构对 AI 的支持,以及 Data+AI 的各种最佳实践。Databricks 自己的大语言模型 dolly 并不是重点,真正宣传 Dolly 的 session 仅有 3 个。

2af2a9de-13e3-11ee-962d-dac502259ad0.png

综合起来看,尽管生成式 AI 是话题上的亮点,两家不约而同的重点强调“自己的数据平台能力本身和可扩展性,可以容易的集成生成式 AI 在内的多种计算模型”。

前瞻,两个发布会最大看点在哪里?

结合笔者的经验和发布会的内容,笔者大胆预测如下可能的方向演进和重磅发布:

Snowflake 的重点方向和重磅发布:

方向从数仓进一步转型湖仓一体,改变封闭数仓的缺陷,发布支持基于 Iceberg 的开放数据格式。

发布内置的 AI 模型部署和推理能力,会更多的结合 LLM,通过 Snowflake 释放 LLM 大型语言模型的力量。

Data + Application 一体化,推进 Operational Analytics。

Databricks 的重点方向和重磅发布:

借生成式 AI 的东风,继续大力推进 Data+AI 的概念。同时借力对 AI 的支持,竞争 Snowflake(会有实际客户案例比较 Databricks 和 Snowflake)

全链路实时化和增量化会成为重点方向(每天 40% 的 topic 与全链路实时增量化相关)

大幅增加企业级数据平台能力的建设和宣传(包括数据质量,数据加密这些 Databricks 的传统弱项,这些 topic 占每天主题的 20%)

未来 AI 时代需要什么样的数据平台支撑?

看过上述对比和前瞻分析,读者应该能感受到浓浓的火药味,可见两家的技术竞争已经是数据平台全面或一体化综合能力的竞争。

笔者认为,AI 大火的今天,我们更应该关注的焦点,还是应该回归到支撑 AI 的基础数据平台能力,回归到“支点”上。从两方大会的日程安排上,也可以得到充分印证。

Snowflake 大会的支点由数据仓库 + 数据安全 + 数据应用三个方向共计 400 多个 session 组成。数据仓库强相关的话题是 Snowflake 的基本盘,而数据应用主题延续了 Snowflake 在 2022 年秋季 Build 大会上通过 Streamlit 构建应用的热点,并增强了数据科学和机器学习的主题方向。

Databricks 大会的支点由 300 多个 session 构成,涵盖了数据工程,数据科学,机器学习,深度学习,自然语言处理,计算机视觉,数据分析,数据治理,数据伦理等和 ETL/ELT 数据处理、数据科学等数据湖上场景更为密切的支点型主题方向。很明显,Databricks 在泛 AI 领域对主题做了更多细分,包括机器学习、数据科学、深度学习、自然语言处理、计算机视觉。特别的一点是 Databricks 在数据伦理方面开辟了新的主题。

站在国内视角,也会激发我们思考数据平台演进的脉络。这里推荐这篇文章《从 Hadoop 到 Snowflake,2023 年数据平台路在何方?_InfoQ 精选文章》的梳理。

尽管两方大会的共同主旋律“通过 Data + 生成式 AI 重塑企业”,但笔者这里可以大胆预先总结一下两个峰会的内容套路:“生成式 AI 搭台,Data+Analytics 唱戏”。

我们会持续关注会议的进展,并同步报道最新情况,看上述预测是否准确,请大家持续关注。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    28875

    浏览量

    266216
  • 语言模型
    +关注

    关注

    0

    文章

    487

    浏览量

    10201
  • 机器学习
    +关注

    关注

    66

    文章

    8306

    浏览量

    131841
  • 生成式AI
    +关注

    关注

    0

    文章

    463

    浏览量

    410

原文标题:生成式AI搭台,Data+Analytics唱戏: Snowflake、Databricks 2023年度大会前瞻

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Databricks利用NVIDIA全栈解决方案加速生成AI应用

    NVIDIA 创始人兼首席执行官黄仁勋在 2024 Databricks Data + AI 峰会上与 Databricks 联合创始人
    的头像 发表于 09-09 09:40 311次阅读

    Snowflake洽谈收购Reka AI,进军生成AI领域

    软件巨头Snowflake近日传出消息,正在与初创公司Reka AI洽谈收购事宜,预计收购金额将超过10亿美元。此举标志着Snowflake正积极布局生成
    的头像 发表于 05-20 09:29 526次阅读

    振华科技2023年度股东大会在贵阳召开

    5月17日,中国振华(集团)科技股份有限公司2023年度股东大会在贵阳召开,会议由振华科技董事长杨立明主持。公
    的头像 发表于 05-20 09:14 222次阅读

    利尔达荣膺“2023年度中国物联网企业100强”!

    //4月23日,备受瞩目的IOTE2024中国智联网生态大会暨“2023物联之星”年度榜单颁奖典礼在上海隆重召开。利尔达受邀出席,荣膺“2023年度
    的头像 发表于 04-26 08:13 655次阅读
    利尔达荣膺“<b class='flag-5'>2023</b><b class='flag-5'>年度</b>中国物联网企业100强”!

    广东电信携手华为斩获“2023年度SDN、NFV、网络AI最佳实践案例”

    在北京举办的2024云网智联大会上,广东电信与华为联手打造的《基于数字孪生技术打造云网预知系统实现网络配置变更在线仿真与精准评估》项目,一举斩获“2023年度SDN、NFV、网络
    的头像 发表于 04-14 10:23 631次阅读
    广东电信携手华为斩获“<b class='flag-5'>2023</b><b class='flag-5'>年度</b>SDN、NFV、网络<b class='flag-5'>AI</b>最佳实践案例”

    广东移动携手华为斩获“2023年度SDN、NFV、网络AI最佳实践案例”

    4月10日,在北京举办的2024云网智联大会上,广东移动携手华为共同申报的《基于通信大模型的IP网络运维“数字专家”创新实践》项目,斩获SNAI“2023年度SDN、NFV、网络
    的头像 发表于 04-11 09:03 457次阅读
    广东移动携手华为斩获“<b class='flag-5'>2023</b><b class='flag-5'>年度</b>SDN、NFV、网络<b class='flag-5'>AI</b>最佳实践案例”

    迅镭激光2023年度表彰暨2024年度誓师大会顺利召开!

    3月9日,迅镭激光2023年度表彰大会暨2024年度誓师大会在苏州相城白金汉爵酒店隆重召开,迅镭激光全体管理层干部、优秀员工近200人参加会
    的头像 发表于 03-12 16:31 506次阅读

    华秋2023年度大事记~~

    2023复杂多变的外部环境下,华秋紧随时代步伐,以为企业减负、高质量发展为核心目标,助力企业“增效降本”。这一,华秋投入大量研发资源,聚焦产品质量提升、提升数字化能力,赋能硬件创新。同时
    发表于 01-05 10:59

    飞凌嵌入2023年度盘点——步履不停,向上而行

    凡是过往,皆为序章。让我们站在2024的开端,一起回顾飞凌嵌入2023年度大事。
    的头像 发表于 01-05 08:01 283次阅读
    飞凌嵌入<b class='flag-5'>式</b><b class='flag-5'>2023</b><b class='flag-5'>年度</b>盘点——步履不停,向上而行

    新年惊喜!盖楼有奖~一起来见证华秋2023年度高光时刻吧

    、第六届蓝点奖“十佳分销商”、创想三维2022年度供应商大会“优秀质量奖”、2023中国创投金鹰奖暨中国创业企业新苗榜-年度高成长企业、2023
    发表于 01-04 16:33

    2023年度十大科技名词

    12月26日,“2023年度十大科技名词”在京发布。“大语言模型、生成人工智能、量子计算、脑机接口、数据要素、智慧城市、碳足迹、柔性制造、再生稻、可控核聚变”入选。十个最具影响力和代
    的头像 发表于 01-03 08:27 504次阅读
    <b class='flag-5'>2023</b><b class='flag-5'>年度</b>十大科技名词

    【社区人物】2023年度电子发烧友社区获奖名单公布

    )颁奖仪式 2023年度优秀合作伙伴 深圳市米尔电子有限公司、保定飞凌嵌入技术有限公司、上海斯丹麦德电子有限公司、广州创龙电子科技有限公司、深圳市优博终端科技有限公司、广州市星翼电子科技有限公司、深圳市
    发表于 11-24 15:16

    小华斩获“2023年度最佳芯片”奖

    10月30日,第五届硬核中国芯生态大会在深圳召开,会上揭晓了“2023年度硬核中国芯评选”获奖名单,小华凭借主力MCU微控制器芯片产品HC32F460 、HC32F4A0斩获“2023
    的头像 发表于 11-02 15:36 859次阅读

    2023电子工程师大会暨第三届社区年度颁奖

    2023电子工程师大会暨第三届社区年度颁奖活动。活动将邀请高校教授、企业高管、行业专家、电子工程师们,共同聚焦“开源硬件”、“OpenHarmony + RISC-V”、“工程师职业
    发表于 10-26 16:21

    2023科创大会 | 商汤CEO徐立:生成AI跳出思维定势,激发更多可能性

    10 月 11 日 -12 日,由中央广播电视总台与上海市人民政府联合举办的“ 2023 科创大会”在上海召开。 “商汤日日新SenseNova”大模型体系下生成
    的头像 发表于 10-13 12:10 735次阅读
    <b class='flag-5'>2023</b>科创<b class='flag-5'>大会</b> | 商汤CEO徐立:<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>跳出思维定势,激发更多可能性