0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据不可估量,亚马逊云科技开启云原生数仓新篇章

华夏大视野 来源:华夏大视野 作者:华夏大视野 2023-01-13 09:49 次阅读

2022年12月,在拉斯维加斯举办的2022亚马逊科技re:Invent全球大会完美落幕,这一标志性的技术盛宴再一次给人们留下了无限的想象空间,等待大家在新的一年去持续探索和发掘。近日,亚马逊云科技中国巡演——广州、深圳站也如期举行,其间对re:Invent全球大会的很多项目进行解读,为中国企业提供更多的可能。

简化数据摄入工作

最好是没有

要想数据分析到位,首先要保证有稳定、可靠的数据摄入通道,来实现端到端的第一环(其实还有第零环,是业务在数据源侧的规划),而这一块也是大部分数据工程中遇到最头疼的问题之一。首先,数据源就包含很多种,最常见的数据源包括关系型数据库、数据湖和实时的流数据。其次,不管是手动还是自动的ETL流水线,都需要专业的数据工程团队来构建和维护,并且经常要处理或介入数据结构的变更等情况。这次,Redshift连发多个功能特性来帮助客户解决或者消除这类问题。

pYYBAGPAuMWAGTjzAAHgs-K_hI8026.png

首先是最常见的关系型数据库,也就是经典的OLTP向OLAP的数据传递。如果是为了更快或者更实时地获取线上业务的事务数据来做分析,通常可以通过开启数据库的binlog来捕捉CDC变更,然后再使用解析CDC的工具如Amazon DMS、Debezium等来实现,这些都需要客户进行不断的监控、配置和优化。此外,不同的数据库和数据表可能会有不同的需求,这样就再加倍了数量级的维护成本。

相信大家对Redshift印象最深的一个功能就是Zero ETL,帮助客户完成从1到0的过程!Redshift通过与Amazon Aurora数据库深度集成,在事务型数据写入Aurora后,数据在底层被持续地复制到Redshift,完成行式数据存储到列式数据存储的转换,彻底消除了自己构建和维护复杂数据管道的工作。没有Hybrid OLTP和OLAP,仍然是熟悉的Amazon Purpose-Build(Aurora还是 Aurora,Redshift还是Redshift)各司其职解决最实际的问题。同时,客户的应用程序架构保持不变,读写端点指向Aurora,分析端点指向Redshift,但是底层已经不再是一大串接一大串的数据抽取、转换和加载,直接无缝衔接并且达到近实时的效果。

然后是数据湖S3,Redshift开始支持从S3数据湖中自动复制,手动挡升级自动挡。之前,如果想要拷贝数据都需要手动或者定时执行COPY命令,现在Redshift新添加了COPY JOB命令自动检测指定路径的新文件,跳过已经加载完毕的旧文件。以前编写的定时任务脚本可以退役了,而且再也不用担心手抖重复执行,生活变得更美好了。

如果业务需求是实时的,那么通过S3作为Staging存储再COPY的方式就跟不上节奏了,所以,流数据也要拿下。re:Invent之前,Redshift流式摄入已经开始支持Amazon Kinesis Data Streams,这次发布更是添加了Amazon Managed Streaming for Apache Kafka(MSK),同时流式摄入也正式推出,告别预览。从上面的图中可以看出,流式摄入合并了数据消费的过程,直接在Redshift中实现并持续加载到数据仓库。在Redshift中,流式摄入是通过物化视图的方式实现的(查找官方文档是在物化视图章节),用户还可以在这个物化视图基础上再配合其他数据叠加物化视图提高查询效率。另外,别忘了还可以给流式摄入开启自动刷新功能。从此,客户可以更简单地完成实时数据分析,包括IoT物联网设备、点击流、应用程序监控、欺诈检测和游戏实时排行榜等。

以上,Redshift简化了各种最经典的数据源ETL方式,数据坐等分析。

更多数据分析的利器

来点火花

数据已经妥妥地进到了数据仓库的碗里来,接下来就请开始它的表演了。此时,数据工程师表示Redshift SQL很好,但是还有些更复杂业务数据逻辑更适合通过代码的方式进行操作和处理(而不是通过UDF)。开源大数据生态体系下有非常丰富的软件供组织采用了,其中功能完善、发展稳定的Apache Spark往往是一个优先的选择。在亚马逊云科技平台上使用Spark并不复杂,有托管服务EMR和Glue保驾护航,还有新发布的Amazon Athena for Apache Spark可以极速启动交互。但是,说到Spark和Redshift之间进行数据分析还是需要折腾一下的,或者是通过将Redshift中的数据导出到S3中,或者是使用各种第三方的Spark连接器,前者需要多走一步浪费时间和资源,后者没有多少人维护不说,性能和安全性都令人堪忧。因此,Amazon Redshift integration for Apache Spark应运而生。

poYBAGPAuMaAFeYeAAEKc7lY0kk657.png

这个内置集成模式基于一个之前的开源项目,提升了性能和安全性,相信后续亚马逊云科技仍将继续跟进这个开源项目,并将各种升级改造的好东西贡献给社区。目前,EMR、EMR on EKS、EMR Serverless和Glue(限定版本)都预置了打包好的连接器和JDBC驱动程序,客户完全可以直接开始编写代码(有爱好者迫不及待连夜在EMR Studio中使用EMR on EKS完成了对Redshift Serverless和集群模式的交互式读写测试,体验极佳),对Redshift中的数据进行处理。如果客户的数据分析工作负载以Spark为主,也可以通过Spark统一对各种数据源的分析。

审核编辑hhy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3799

    浏览量

    64385
  • 开源
    +关注

    关注

    3

    文章

    3348

    浏览量

    42494
收藏 人收藏

    评论

    相关推荐

    什么是云原生MLOps平台

    云原生MLOps平台,是指利用计算的基础设施和开发工具,来构建、部署和管理机器学习模型的全生命周期的平台。以下,是对云原生MLOps平台的介绍,由AI部落小编整理。
    的头像 发表于 12-12 13:13 103次阅读

    比亚迪与华工科技开启战略合作新篇章

    近日,比亚迪半导体事业部与华工科技高理公司、激光公司开展座谈交流,开启战略合作新篇章
    的头像 发表于 12-10 14:45 211次阅读

    AMS-SC159:开启LED视频处理与拼接的新篇章

    业界领先的13通道视频处理器与拼接器,凭借其卓越的性能和丰富的功能,正在开启LED视频处理与拼接的新篇章
    的头像 发表于 11-28 09:08 230次阅读

    魏德米勒开启产业智转型新篇章

    随着制造业向高端、智能、绿色方向不断迈进,以科技创新提质增效,贴近客户挖掘深度需求,成为助力产业发展的重要锚点。11月,工业联接专家魏德米勒的脚步加“”出发 ,与客户及合作伙伴共同开启产业智转型
    的头像 发表于 11-22 15:00 252次阅读

    IOT物联网中台:开启智慧生活新篇章 物联网平台系统

    IOT物联网中台:开启智慧生活新篇章 物联网平台系统
    的头像 发表于 11-19 09:14 263次阅读

    IOT物联网中台:开启智慧生活新篇章 物联网平台系统,构建智慧城市数据生态 智慧城镇、物联网、数据中台

    IOT物联网中台:开启智慧生活新篇章 物联网平台系统,构建智慧城市数据生态 智慧城镇、物联网、数据中台、智慧城市、数据生态
    的头像 发表于 11-18 14:49 262次阅读

    扬帆出海!稳石氢能AEM电解槽出货智利,开启全球商业化新篇章

    继国内商业化获得突破之后,此次海外订单的交付,标志着稳石氢能正式开启了AEM制氢设备全球商业化的新篇章
    的头像 发表于 11-01 10:31 238次阅读
    扬帆出海!稳石氢能AEM电解槽出货智利,<b class='flag-5'>开启</b>全球商业化<b class='flag-5'>新篇章</b>!

    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”新篇章

    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”新篇章
    的头像 发表于 10-14 15:36 308次阅读
    重庆市第五人民医院引领医疗电能质量革命,点亮“健康”<b class='flag-5'>新篇章</b>

    复合机器人:开启智能仓储新篇章

    随着工业4.0时代的到来,智能制造和智能仓储已经成为企业发展的重要驱动力。近日,一种全新的复合机器人仓库搬运方案亮相,该方案以复合机器人AMR为核心,通过与搬运机器人AGV的紧密配合,开启了智能仓储的新篇章
    的头像 发表于 10-12 16:58 269次阅读
    复合机器人:<b class='flag-5'>开启</b>智能仓储<b class='flag-5'>新篇章</b>

    高校嵌入式教学实验箱,开启智慧教学新篇章

    高校嵌入式教学实验箱,开启智慧教学新篇章
    的头像 发表于 05-23 08:32 516次阅读
    高校嵌入式教学实验箱,<b class='flag-5'>开启</b>智慧教学<b class='flag-5'>新篇章</b>

    深开鸿与哈工大重庆研究院合作共同开启智能机器人与协同技术的新篇章

    近日,深开鸿与哈尔滨工业大学重庆研究院(以下简称“哈工大重庆研究院”)正式举行合作启动仪式,共同开启智能机器人与协同技术的新篇章
    的头像 发表于 05-13 09:43 726次阅读
    深开鸿与哈工大重庆研究院合作共同<b class='flag-5'>开启</b>智能机器人与协同技术的<b class='flag-5'>新篇章</b>

    华盛昌与易达成功签署战略协议,共同开启合作新篇章

    2024年5月7日下午,华盛昌与易达建供应链科技(西安)有限公司成功签署战略合作协议,共同开启全方面战略合作新篇章
    的头像 发表于 05-11 17:43 515次阅读
    华盛昌与易达<b class='flag-5'>云</b>成功签署战略协议,共同<b class='flag-5'>开启</b>合作<b class='flag-5'>新篇章</b>

    首个鸿蒙生态创新中心在深揭幕,开启鸿蒙产业新篇章共绘鸿蒙原生应用开发新篇章

    首个鸿蒙生态创新中心在深揭幕 开启鸿蒙产业新篇章 2024年3月19日,鸿蒙生态创新中心揭幕仪式在深圳举行,标志着鸿蒙产业发展迈出新的坚实步伐。深圳市人民政府副秘书长黄强,华为终端BG首席运营官何刚
    发表于 03-20 09:55

    比亚迪匈牙利首批乘用车正式交付 成功开启中东欧市场崭新篇章

    2月23日,在匈牙利外交部部长西雅尔多·彼得与比亚迪集团董事长兼总裁王传福的共同见证下,比亚迪向匈牙利首批车主成功交付了BYD ATTO 3(元PLUS),标志着比亚迪成功开启了中东欧市场的崭新篇章
    的头像 发表于 02-25 09:32 811次阅读

    联想AI PC新品与Agent个人助理“小乐同学”亮相,品牌营销新篇章开启

    2024年是AI PC元年,犹如一幅时代画卷,描绘着生成式AI等尖端人工智能技术与个人电脑的深刻融合,勾勒出一场前所未有的技术革命。联想一直以来不断突破自我,致力于技术创新,推动科技进步,2024年将继续携手人工智能,开启新篇章
    的头像 发表于 01-20 11:41 1270次阅读