0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊云科技提出“智能湖仓”方案,有力解决数据移动困难问题

科讯视点 2021-08-04 09:36 次阅读

什么是数据湖?智能湖仓又是什么?亚马逊科技中国峰会北京站一一为你解答!

通过将不同结构、不同类型、不同来源的相关数据汇总起来并加以分析,用户能够得出更深刻、更丰富的洞察见解。为此,用户需要从不同孤岛中获取所有数据、将其聚合至统一位置(也就是人们常说的「数据湖」),再以此为基础执行分析与机器学习

但在其他用例中,用户也会将数据放置在其他专用存储体系之内,例如存储在数据仓库内以针对结构化数据执行复杂查询并快速获得结果;或者存储在搜索服务中以快速搜索/分析日志数据,进而监控生产系统的运行状况。无论如何,要想从这些数据中获取最佳洞见,用户必须有能力轻松在数据湖与专用存储系统之间移动数据。

但随着系统中数据规模的持续增长,数据移动也变得越来越困难。为了解决这一挑战、进而从数据中获取最大收益,亚马逊云科技提出了Lake House“智能湖仓”方案。

作为一类现代化数据架构,智能湖仓方法不仅强调将数据湖与数据仓库集成起来,同时也涉及将数据湖、数据仓库以及所有其他专用服务接入统一且连续的整体。数据湖提供对主体数据的分析环境,而专用分析服务则负责以令人满意的速度为用户提供具体用例支持(例如实时仪表板与日志分析功能)。

pYYBAGEJ7ziAVmrwAACNrhcn4ik39.jpeg

如图所示,为真实客户数据与常见数据迁移需求(包括数据分析服务与数据存储间的数据迁移、由内向外、由外向内、周边移动等情况)共同建立的智能湖仓方案。

这样一套分层与组件化数据分析架构,使用户可以通过正确的工具完成正确的任务,同时提供以迭代及增量方式构建架构的良好敏捷性。在添加新数据源、发现新的用例/需求以及开发新的分析方法时,亚马逊云科技可以更灵活地调整智能湖仓中的相应组件,借此满足当前及未来的各类需求。

对于亚马逊云科技的这套智能湖仓架构,用户可以把它组织成一套五层逻辑堆栈,其中各个层对应着负责满足特定需求的专用组件。

poYBAGEJ7ziAVigRAACRo1VfKTg15.jpeg

为亚马逊云科技平台上的智能湖仓参考架构

亚马逊云科技的智能湖仓参考架构提供多种专用Amazon服务,能够让不同角色类型之间的数据消费方式互连互通,包括支持交互式SQL查询、商务智能与机器学习等多种分析用例。这些服务使用统一的智能湖仓接口访问存储在Amazon S3、Amazon Redshift以及Amazon Lake Formation目录中的所有数据与元数据。此外,各项服务还可以通过开放文件格式(例如JSON、Avro、Parquet以及ORC)使用Amazon Redshift表中存储的平面关系数据以及S3对象中存储的平面或复杂结构化或非结构化数据。

基于专用服务组合建立的智能湖仓架构将帮助用户从海量数据中快速获取面向所有用户的洞察见解,同时充分预留升级空间,供用户随后续发展随时引入新的分析方法与技术成果。

fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 亚马逊
    +关注

    关注

    8

    文章

    2669

    浏览量

    83433
收藏 人收藏

    评论

    相关推荐

    亚马逊科技AI Networking解决方案回顾

    前一段时间的2024 re:Invent 大会中,亚马逊科技可谓是重磅连连,发布了全套最新AI networking基础设施方案
    的头像 发表于 12-27 11:25 298次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>云</b>科技AI Networking解决<b class='flag-5'>方案</b>回顾

    亚马逊科技发布Amazon Bedrock新功能

    (AI)应用程序。 此次发布不仅展示了亚马逊科技在模型选择方面的坚定承诺,还进一步优化了大规模推理的执行方式,为客户从海量数据中挖掘更多价值提供了强有力的支持。通过Amazon Be
    的头像 发表于 12-25 15:52 130次阅读

    亚马逊科技与Adobe携手推出AEP解决方案

    赋能,助力其打造高度个性化的客户体验,进一步巩固客户关系。 AEP解决方案充分利用了亚马逊科技的强大计算能力和Adobe在数字体验领域的深厚积累。通过这一平台,品牌能够获取到客户在线上和线下渠道的全面互动
    的头像 发表于 12-25 15:44 161次阅读

    亚马逊科技与SAP推出GROW with SAP解决方案

    近日,亚马逊科技与SAP携手宣布了一项重要合作——在亚马逊科技平台上提供GROW with SAP解决方案。这一举措旨在帮助各种规模的企
    的头像 发表于 12-24 16:44 310次阅读

    亚马逊科技发布全新数据中心组件

    近日,亚马逊科技宣布了一项重大创新,推出了一系列全新的数据中心组件。这些组件旨在满足新一代人工智能(AI)创新的需求,并帮助客户应对日益复杂且多变的应用场景。
    的头像 发表于 12-24 15:05 212次阅读

    Grab选定亚马逊科技为首选服务商

    近日,在亚马逊科技2024年re:Invent全球大会上,一项重大合作宣布出炉。东南亚领先的超级应用程序Grab与亚马逊科技携手,宣布Grab已正式选定
    的头像 发表于 12-24 10:22 137次阅读

    戴尔数据助力企业数字化转型

    在数字化转型的浪潮下,企业正面临着前所未有的数据挑战。从传统的结构化数据到如今的非结构化数据、半结构化数据,每一种类型都对企业的存储和分析能力提出
    的头像 发表于 12-20 09:31 135次阅读

    基于亚马逊科技的GROW with SAP解决方案 助力企业简化云端ERP部署

    GROW with SAP解决方案将上架亚马逊科技Marketplace,助力企业快速应用ERP软件,并利用前沿生成式AI解决方案实现创
    的头像 发表于 12-09 15:11 203次阅读

    亚马逊科技推出Amazon Lambda SnapStart功能

    亚马逊科技推出Amazon Lambda SnapStart,大幅提升Java Lambda函数启动性能   北京,2024年10月29日 —— 亚马逊科技近日宣布,与光环新
    的头像 发表于 10-30 10:59 284次阅读

    亚马逊科技启动&quot;智能家居与智能产品创新加速计划&quot;

    的深度融合,加速创新方案落地,为智能家居与智能产品行业数智化升级注入新动力。此外,亚马逊科技还将持续推进
    的头像 发表于 08-01 09:56 404次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>云</b>科技启动&quot;<b class='flag-5'>智能</b>家居与<b class='flag-5'>智能</b>产品创新加速计划&quot;

    亚马逊科技启动“智能家居与智能产品创新加速计划”

    融合,加速创新方案落地,为智能家居与智能产品行业数智化升级注入新动力。此外,亚马逊科技还将持续推进智能
    发表于 07-31 16:56 2072次阅读
      <b class='flag-5'>亚马逊</b><b class='flag-5'>云</b>科技启动“<b class='flag-5'>智能</b>家居与<b class='flag-5'>智能</b>产品创新加速计划”

    浪潮信息携手天府数据科技推出了42kW智算风冷算力

    在当今数字化转型的浪潮中,算力作为推动数字经济高质量发展的核心引擎,正以前所未有的速度进化。近日,浪潮信息与四川省天府数据科技有限责任公司携手,在国内率先推出了42kW智算风冷算力,这一创新成果
    的头像 发表于 07-15 16:18 677次阅读

    店匠科技选择亚马逊科技为首选服务供应商

    ,应用亚马逊科技的生成式AI技术与服务,在"GenAI营销素材创作、AI建站Copilot、智能客服、智能推荐和搜索"四大关键场景创新跨境电商领域数字化解决
    的头像 发表于 06-11 16:40 348次阅读

    什么是数据数据数据仓库有什么区别?

    从本质上说,数据就是一个信息资源库。人们常常将数据数据仓库混为一谈,但两者在架构和满足的业务需求上都不一样。尤其是,随着社交媒体
    的头像 发表于 05-20 12:38 628次阅读
    什么是<b class='flag-5'>数据</b><b class='flag-5'>湖</b>?<b class='flag-5'>数据</b><b class='flag-5'>湖</b>和<b class='flag-5'>数据</b>仓库有什么区别?

    揭秘一体:大数据演进的未来趋势与影响

    一体架构下,数据要统一存储管理,一份数据作为 Single source of truth,避免导来导去,造成数据冗余,分析口径不一致
    的头像 发表于 01-29 14:17 1000次阅读
    揭秘<b class='flag-5'>湖</b><b class='flag-5'>仓</b>一体:大<b class='flag-5'>数据</b>演进的未来趋势与影响