0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

对象存储适合AI和机器学习工作负载的三个原因

如意 来源:51cto 作者:51cto 2020-07-06 09:27 次阅读

各种各样的企业在加快AI机器学习项目,但要真正发挥潜力,需要克服重大的技术障碍。虽然计算基础架构常常是关注的重点,但存储同样重要。这三个主要的原因表明了为什么对象存储(而不是文件存储或块存储)特别适合AI和机器学习工作负载:

1. 可扩展性——有庞大且多样的数据源可供学习时,AI和机器学习最有效。数据科学家利用这些丰富的数据来训练领域模型。在“大数据的五个V”(容量、种类、速度、准确性和价值)中,前两个(容量和种类)最重要。简而言之,AI和机器学习依赖大量多样化的数据(图像、文本、结构化和半结构化数据),构建有用的模型、提供准确的结果并最终提供业务价值。

对象存储是最具扩展性的存储架构,特别适合支持AI和机器学习所需的大量数据。对象存储旨在通过横向扩展方法支持无限增长,使企业组织能够通过随时随地添加节点来扩大部署范围。由于对象存储使用单个全局命名空间,也可以同时跨多个地方进行这种扩展。另一方面,文件和块系统通常采用纵向扩展方法。这意味着这种平台通过为单个节点添加更多计算资源实现纵向扩展,这种方法最终受到限制。它们无法通过部署额外节点来增加计算资源以高效地横向扩展。

2. API——健壮灵活的数据API对于AI和机器学习很重要,如前所述,AI和机器学习使用多种类型的数据。存储平台需要支持API以容纳各种数据。此外,AI和机器学习方面的创新日益在公共云上完成,但是仍有相当一部分的AI和机器学习在本地或私有云中进行,这取决于使用场合的具体情况(比如说,科学研究和医疗保健等领域的容量密集型工作负载往往最适合私有云)。这意味着企业需要在公共云和本地/私有云中都支持工作负载的存储API。

文件和块存储平台在它们支持的API方面受到限制,部分原因是它们是较旧的架构。相比之下,对象存储使用云端更高级的API,这种API旨在以应用程序为中心,并支持比文件和块存储更广泛的API,包括版本控制、生命周期管理、加密、对象锁定和元数据。此外,支持AI和机器学习使用场景的新对象存储API(比如支持流数据和海量数据集的查询)也有可能。

由于对象存储API围绕Amazon S3实现了标准化,更容易整合本地和公共云中的软件。企业可以轻松地将部署的AI和机器学习从本地/私有云环境扩展到公共云,或者将云原生的AI和机器学习工作负载迁移到本地环境,功能不会减损。这种双模式方法使企业能够以合作、可互换的方式利用本地/私有云和公共云上的资源。

由于S3 API已成为对象存储事实上的标准,许多软件工具和库都可以充分利用该API。这允许共享代码、软件和工具,促进AI/机器学习社区更快速的开发。例子包括流行的机器学习平台,比如拥有内置S3 API的TensorFlow和Apache Spark。

3.元数据——与API一样,使用AI和机器学习的企业利用无限制、可自定义的元数据显得至关重要。元数据就是关于数据的数据——从最基本的层面上讲,某个数据何时在何地创建、创建者是谁。但是元数据可以描述更多信息:用户可以创建任意的元数据标签来描述他们需要的任何属性。

数据科学家需要丰富的元数据来查找特定数据以构建和使用AI和机器学习模型。随着更多信息添加到数据中,元数据注释便于逐步积累知识。

文件和块存储仅支持有限的元数据,比如上述基本属性。这在很大程度上归结为可扩展性,因为文件和块系统无力支持快速无缝的增长,如果存储系统为依赖庞大数据集的AI和机器学习应用程序支持丰富的元数据,自然会出现这种情况。然而,对象存储支持无限制的、完全可自定义的元数据,从而更容易找到用于AI和机器学习算法的数据,并从中获得更准确的信息。

以一家医院针对X射线图像使用图像识别应用程序为例:有了元数据,可以使用TensorFlow模型来分析添加到对象存储系统的每个图像,然后为每个图像分配细化的元数据标签(比如,伤病类型、基于骨骼大小或生长情况来判断患者的年龄或性别)。然后可以针对该元数据训练TensorFlow模型,并加以分析,对患者获得新的宝贵信息(比如说,二三十岁的女性比五年前更容易患骨骼疾病)。

几乎每家《财富》 500强公司都在大张旗鼓地搞AI和机器学习,可以想象这些技术在可预见的将来将是最重要的企业IT项目。然而,AI/机器学习项目要获得回报,企业就要使用合适的存储基础架构。由于可扩展性、支持各种API(尤其是S3)和丰富的元数据,对象存储可谓是AI和机器学习的最佳支柱。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4296

    浏览量

    85799
收藏 人收藏

    评论

    相关推荐

    深度学习工作负载中GPU与LPU的主要差异

    ,一新的竞争力量——LPU(Language Processing Unit,语言处理单元)已悄然登场,LPU专注于解决自然语言处理(NLP)任务中的顺序性问题,是构建AI应用不可或缺的一环。 本文旨在探讨深度学习
    的头像 发表于 12-09 11:01 245次阅读
    深度<b class='flag-5'>学习</b><b class='flag-5'>工作</b><b class='flag-5'>负载</b>中GPU与LPU的主要差异

    关于对象存储和云硬盘区别,你了解多少?

    挂载到云服务器上使用,适合高性能、低延迟的数据库和文件系统存储。选择哪种方案应根据具体业务需求和数据类型决定。UU云小编将从定义特点、使用方式与共享、存储与访问特性、应用场景等四方面
    的头像 发表于 11-01 10:57 150次阅读

    AI大模型与传统机器学习的区别

    多个神经网络层组成,每个层都包含大量的神经元和权重参数。 传统机器学习 :模型规模相对较小,参数数量通常只有几千到几百万,模型结构相对简单。 二、训练数据需求 AI大模型 :需要大规
    的头像 发表于 10-23 15:01 550次阅读

    使用带有三个DC-DC模块的UCC39002的48VIN、12VOUT负载共享系统

    电子发烧友网站提供《使用带有三个DC-DC模块的UCC39002的48VIN、12VOUT负载共享系统.pdf》资料免费下载
    发表于 10-22 10:23 0次下载
    使用带有<b class='flag-5'>三个</b>DC-DC模块的UCC39002的48VIN、12VOUT<b class='flag-5'>负载</b>共享系统

    RISC-V如何支持不同的AI机器学习框架和库?

    RISC-V如何支持不同的AI机器学习框架和库?还请坛友们多多指教一下。
    发表于 10-10 22:24

    AI引擎机器学习阵列指南

    云端动态工作负载以及超高带宽网络,同时还可提供高级安全性功能。AI 和数据科学家以及软硬件开发者均可充分利用高计算密度的优势来加速提升任何应用的性能。AI 引擎
    的头像 发表于 09-18 09:16 387次阅读
    <b class='flag-5'>AI</b>引擎<b class='flag-5'>机器</b><b class='flag-5'>学习</b>阵列指南

    机器人语言系统包括三个基本状态

    机器人语言系统(有时也被称为机器人语言操作系统)确实包括三个基本状态,这些状态是机器人程序运行和管理的核心组成部分。它们分别是: 监控状态 :在此状态下,系统负责对
    的头像 发表于 09-04 09:24 513次阅读

    相电零线电流过大原因是什么

    负载不平衡 相电系统由三个相位的电压和电流组成,它们之间相互垂直,形成一闭合的回路。在理想情况下,三个相位的
    的头像 发表于 08-14 09:41 1395次阅读

    LM258A两上电后烧穿,三个不正常工作是什么原因导致的?

    您好 客户在使用LM258AD/SOIC-8,小批100台,遇到两上电后烧穿,三个不正常工作。原理图如下, VDD± 12V,输出DC 2.5V,麻烦问下,可能是什么原因,有没有好
    发表于 08-02 11:54

    简述极管的三个工作区域

    极管的三个区域,通常指的是其在不同工作条件下的状态区域,即截止区、放大区和饱和区。这三个区域定义了极管在不同电压和电流条件下的行为特性,
    的头像 发表于 07-29 10:50 3270次阅读

    可调变阻器三个引脚怎么区分

    的区分对于正确使用可调变阻器至关重要。本文将介绍可调变阻器的三个引脚的区分方法。 一、可调变阻器的工作原理 在了解可调变阻器的三个引脚之前,我们首先需要了解其工作原理。可调变阻器主要由
    的头像 发表于 07-24 11:12 1180次阅读

    机器人视觉可以分为哪三个部分?

    机器人视觉是机器人技术中的一重要分支,它涉及到图像处理、计算机视觉、机器学习等多个领域。机器
    的头像 发表于 07-04 11:17 608次阅读

    微波测量的三个基本参量是什么

    微波测量是电子工程领域中的一重要分支,它涉及到对微波信号的频率、幅度、相位等参数的测量。在微波测量中,有三个基本参量:频率、幅度和相位。这三个参量是微波信号的基本特征,对于微波系统的设计、调试
    的头像 发表于 05-28 14:46 1325次阅读

    如何判断极管的三个极性

    极管是电子电路中的基本元件之一,其性能的好坏直接影响到整个电路的性能。而判断极管的三个极性(基极b、发射极e、集电极c)是电路分析和设计中不可或缺的一步。下面将详细介绍判断极管
    的头像 发表于 05-21 15:26 6369次阅读

    篱笆三个桩——记晶体极管的发明

    篱笆三个桩——记晶体极管的发明
    的头像 发表于 05-12 08:14 714次阅读
    一<b class='flag-5'>个</b>篱笆<b class='flag-5'>三个</b>桩——记晶体<b class='flag-5'>三</b>极管的发明