0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

IBM Storage Ceph:现代数据湖仓的理想技术底座

全球TMT 来源:全球TMT 作者:全球TMT 2024-02-02 10:24 次阅读

作者:周立旸,IBM 大中华区科技事业部存储软件产品总监

北京2024年2月1日/美通社/ -- 一年前,IBM 将 Red Hat 存储产品的路线图及团队集成至 IBM存储业务(IBM Storage)。在此期间,企业在扩展 AI 时正面临前所未有的数据挑战:在多个位置、以多种形式存储的数据量飙升,但数据质量较差。为了帮助客户解决这一问题,我们需要领先的解决方案对客户的基础架构进行现代化改造,以支持其数字化转型。这主要涉及在本地和云环境中提供一致的应用和数据存储。此外,还需要帮助客户采用云原生架构,实现公有云在成本、速度和弹性等方面的优势。作为业界领先的开源软件定义存储平台,IBM Storage Ceph(前身为 Red Hat Ceph)正是实现这一目标所需的基石。

wKgaomW7rpaAGBOrAAEpanYOLGw648.jpg


周立旸,IBM 大中华区科技事业部存储软件产品总监

在数据管理方面,软件定义存储 (SDS) 已成为一股变革力量。与传统的传统存储阵列相比,它具有许多优势,包括极高的灵活性与可扩展性,这非常适用于处理生成式 AI 等最新用例。借助 IBM Storage Ceph,用户可从底层硬件中提取存储资源,实现数据存储的动态分配和高效利用。这种灵活性不仅可以简化管理流程,还有助于提高敏捷性,适应不断变化的业务需求,并将随着新工作负载的增加而扩展计算和容量。这一自我修复和自我管理的平台可在行业标准硬件上运行,并大规模地提供统一的文件存储、块存储和对象存储服务。[1]统一存储可以帮助客户将在独立文件或块存储上运行的传统应用,和包含单一设备对象存储的通用平台连接起来。

Ceph 针对大型单站点和多站点部署进行了优化,经过高效扩展可以支持数百 PB 级数据和数百亿个对象,[2]这对于传统工作负载和生成式 AI 工作负载至关重要。IBM Storage Ceph 可扩展、弹性且安全,支持更传统的工作负载,例如 Red Hat OpenShift 或 RedHat OpenStack 上的 MySQL 和 MongoDB,是支持数据湖仓和AI/ML 开源框架的理想之选。这也是 IBMwatsonx.data包含 IBM Storage Ceph 768 TiB 裸容量授权的原因之一;前者是 IBM推出的开放、可治理、定制化的数据湖仓架构,并针对数据、分析和 AI 工作负载进行了优化。

计算密集型和数据密集型工作负载的理想底座

非结构化数据的爆炸式增长和生成式 AI 相互影响,也相辅相成。Gartner 在其《2023 年企业数据存储的主要趋势》报告中指出:"到 2028 年,大型企业的本地、边缘和公有云上的非结构化数据将比 2023 年年中增加两倍。"[3]非结构化数据(如文本、图像和视频)的激增为训练生成式 AI 模型提供了广泛而多样的资源,而生成式 AI 可支持用户从非结构化数据中提前宝贵的洞察。这种协同作用形成了一个反馈循环,生成式 AI 在大量非结构化数据的基础上蓬勃发展,而 AI 持续生成的真实数据则进一步丰富和完善人们对非结构化数据集的理解,从而促进创新和进步。

根据上述报告[4],预计到 2028 年,将有 70% 的文件和对象数据部署在集成的非结构化数据存储平台上(高于 2023 年的 35%),组织需要能够加速数据提取、数据清理和分类、元数据管理和扩充、云规模容量管理和部署(如软件定义存储)的存储管理解决方案。IBM Storage Ceph 可实现无缝扩展,满足不断增长的数据需求;其自我管理功能确保系统适应不断变化的条件,轻松实现数据完整性。

为了在整个组织中加速和扩展数据和 AI,并最终改善业务成果,企业必须有意识地采用混合云设计(hybrid cloud by design)。这包括通过云原生运营模式在本地使用存储服务,以解决公有云上的部分企业级功能不可用、数据主权和成本等问题。IBM Storage Ceph 的"即插即用"架构简化了与现有基础架构的集成,包括各种平台、云环境、虚拟管理程序、开源数据存储库(如 Apache Iceberg 或 Apache Parquet)以及完整解决方案(如 watsonx.ai、watsonx.data 等)。新节点或设备可以无缝添加到集群中,而不会出现中断或服务停机。它为客户提供来一种简单高效的方式,来使用 watsonx.data 和其他新一代 AI 工作负载构建数据湖仓。

Snap Inc.相关负责人表示:"在 Snap,我们对数据存储的需求越来越大,需要一个能够快速扩展、满足性能 KPI 且具有成本效益的平台。IBM Storage Ceph 凭借其简单可扩展的架构、易于管理的界面和经济高效的软件定义部署,成为我们的首选平台。IBM Storage Ceph 还拥有 IBM 的世界级专长和支持,这也是我们决定将其引入关键业务的一个重要原因。"

利用NVMe over TCP 技术实现快速数据访问

去年,IBM 对 Ceph 进行了几项重要更新,包括最近的 IBM Storage Ceph 7.0。新一代Ceph 平台为 NVMe/TCP 功能做好了准备。它保留了传统 NVMe 的低延迟和高带宽特性,可以在存储设备、服务器和云平台之间实现更快的数据传输,因此适用于需要超快速存储访问的应用,例如数据库、分析和内容传输;并且兼容传统的网络技术投资,从而简化了基础架构。这些优势将帮助客户采用软件定义的方法,在速度、敏捷性和经济性方面享受云端体验。

NVMe/TCP 可以帮助 Ceph 通过扩展架构弥补传统块存储的不足。借助 NVMe/TCP,Ceph 将与 VMware 等平台集成,帮助企业在自己的数据中心复制云架构,摆脱昂贵且固定的 SAN 网络和单片存储阵列。

Ceph 7.0 的其他新功能:

SEC 和 FINRA 合规认证的"写一次读多次"(WORM) 对象锁定,确保对象存储符合WORM 合规要求

为非原生Ceph 客户端的 CephFS文件系统访问提供NFS 支持

如需了解该功能的更多信息,请点击此处访问IBM Storage 社区

借助IBM Storage Ceph 实现云规模经济

由于IBM Storage Ceph 将数据作为对象存储在逻辑存储池中,因此单个集群可以有多个存储池,每个存储池都将针对不同的性能或容量需求进行调整。这样一来,客户能够更轻松快速地访问各种经过分类的内容数据和上下文数据,存储容量仅受组织基础架构规模的限制;与传统存储阵列架构相比,IBM Storage Ceph可消除硬件限制,实现大规模成本降低。

加快价值实现的步伐

wKgaomW7rpeAbSwiAABEqpG3Ig0411.jpg


IBM Storage Ceph

IBM 更进一步简化了 Ceph 部署。借助IBM Storage Ready Nodesfor Ceph,该平台可部署为完整的软硬件解决方案,提供多种容量配置,针对运行 IBM Storage Ceph 工作负载进行了优化。我们消除了配置中的不确定因素,使其更易于理解、配置和管理。

IBM Storage Ceph 的发展是 IBM 存储的软硬件产品通过扩展的容量与性能,加速价值实现、优化客户成本的又一例证。


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • IBM
    IBM
    +关注

    关注

    3

    文章

    1755

    浏览量

    74679
  • AI
    AI
    +关注

    关注

    87

    文章

    30758

    浏览量

    268902
收藏 人收藏

    评论

    相关推荐

    戴尔数据助力企业数字化转型

    在数字化转型的浪潮下,企业正面临着前所未有的数据挑战。从传统的结构化数据到如今的非结构化数据、半结构化数据,每一种类型都对企业的存储和分析能力提出了更高的要求。面对这些变化,传统的
    的头像 发表于 12-20 09:31 87次阅读

    IBM 发布光学技术关键突破,生成式AI迎来"光速时代"

    新的光电共封装技术或取代数据中心中的电互连装置,大幅提高AI 和其他计算应用的速度与能效 北京2024年12月12日 /美通社/ -- 近日,IBM(纽约证券交易所代码:IBM)发布了
    的头像 发表于 12-12 15:53 155次阅读

    国产数据库企业“人大金”更名为“电科金

    朝阳区市场监督管理局核准,于2024年8月26日完成公司名称变更。 此次公告事项包括:公司名称由“北京人大金信息技术股份有限公司”变更为“中电科金(北京)科技股份有限公司”,简称“电科金
    的头像 发表于 09-04 19:42 450次阅读
    国产<b class='flag-5'>数据</b>库企业“人大金<b class='flag-5'>仓</b>”更名为“电科金<b class='flag-5'>仓</b>”

    电科金:数智未来,国产数据库大有可为

    几十年来积累的技术底蕴,加之在众多行业中的实践验证与落地,为金数据库的持续发展奠定了坚实的基础。同时,金还以其专业的服务体系、完善的生态构建以及对人才发展的不懈追求,构筑起了一道坚
    的头像 发表于 09-03 13:58 248次阅读
    电科金<b class='flag-5'>仓</b>:数智未来,国产<b class='flag-5'>数据</b>库大有可为

    基于DPU的Ceph存储解决方案

    和性能,只需添加新的存储节点即可,无需重新配置现有系统,非常适合云环境的动态需求; 自我修复: 通过副本或纠删码技术Ceph能够自动检测并修复数据损坏或丢失,保证数据的高可用性和持久
    的头像 发表于 07-15 13:44 1301次阅读
    基于DPU的<b class='flag-5'>Ceph</b>存储解决方案

    什么是数据数据数据仓库有什么区别?

    从本质上说,数据就是一个信息资源库。人们常常将数据数据仓库混为一谈,但两者在架构和满足的业务需求上都不一样。尤其是,随着社交媒体
    的头像 发表于 05-20 12:38 606次阅读
    什么是<b class='flag-5'>数据</b><b class='flag-5'>湖</b>?<b class='flag-5'>数据</b><b class='flag-5'>湖</b>和<b class='flag-5'>数据</b>仓库有什么区别?

    IBM推出全新IT生命周期管理模式

    IBM近日正式推出了IBM Storage Assurance,这是一项创新的IT生命周期管理方案。其设计初衷在于为客户提供数据中心管理的灵活性与控制权,以最大化系统性能。该方案融合了
    的头像 发表于 05-09 11:47 585次阅读

    IBM推出IBM Storage Assurance这一全新的IT生命周期管理模式

    近日,IBM 推出了 IBM Storage Assurance 这一全新的 IT 生命周期管理模式,旨在为客户的数据中心提供灵活的选择与控制,以最大程度提高性能。
    的头像 发表于 05-08 14:09 418次阅读

    IBM发布AI增强版FlashCore模块与新版Storage Defender软件

    IBM近日为其新一代IBM Storage FlashSystem产品系列带来了两大创新:AI增强版的IBM FlashCore模块技术,以
    的头像 发表于 03-06 10:05 719次阅读

    IBM推出AI增强的数据弹性功能,打造更安全存储解决方案

    在新一代 IBM Storage FlashSystem 产品中发布新的 AI 增强版 IBM FlashCore 模块技术,以及新版 IBM
    的头像 发表于 03-05 18:45 1058次阅读

    IBM积极推进Ceph扩展,以打造AI领域的底层数据存储基石

    BM正着手扩展Ceph的块和文件存储功能,希望将其定位为Storage Scale并行文件系统之下面向AI工作负载的后端数据存储。
    发表于 02-20 16:15 399次阅读

    揭秘一体:大数据演进的未来趋势与影响

    一体架构下,数据要统一存储管理,一份数据作为 Single source of truth,避免导来导去,造成数据冗余,分析口径不一致
    的头像 发表于 01-29 14:17 959次阅读
    揭秘<b class='flag-5'>湖</b><b class='flag-5'>仓</b>一体:大<b class='flag-5'>数据</b>演进的未来趋势与影响

    构建高效数据生态:数据库、数据仓库、数据、大数据平台与数据中台解析_光点科技

    在数字化的浪潮中,一套高效的数据管理系统是企业竞争力的核心。从传统的数据库到现代数据中台,每一种技术都在
    的头像 发表于 01-17 10:20 368次阅读

    请问怎样使用cephadm部署ceph集群呢?

    从红帽ceph5开始使用cephadm代替之前的ceph-ansible作为管理整个集群生命周期的工具,包括部署,管理,监控。
    的头像 发表于 01-16 09:32 1454次阅读
    请问怎样使用cephadm部署<b class='flag-5'>ceph</b>集群呢?

    IBM将从Software AG 收购 StreamSets 和 webMethods平台

    收购旨在加速 watsonx 数据摄取功能,创建领先的应用现代化和集成平台 21.3 亿欧元的收购表明 IBM 继续专注于战略并购,以创造价值并提振 AI 和混合云产品能力 IBM (
    的头像 发表于 12-28 09:15 490次阅读
    <b class='flag-5'>IBM</b>将从Software AG 收购 StreamSets 和 webMethods平台