0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AWS推全新机器学习定制训练芯片Trainium

如意 来源:cnBeta.COM 作者:cnBeta.COM 2020-12-02 11:18 次阅读

在 2020 年度的 re:Invent 大会上,亚马逊云服务(AWS)推出了全新的机器学习定制训练芯片 Trainium 。通过对 TensorFlow、PyTorch 和 MXNet 提供支持,该公司希望带来比任何竞争对手都更高的性能表现。此外 Trainium 还可作为一个 EC2 实例,在 AWS 的 SageMaker 机器学习平台上使用,基于这些定制芯片的新实例将于 2021 上半年推出。

Trainium 具有相当显著的速度和成本优势,与标准的 AWS GPU 实例相比,AWS 承诺可带来 30% 的吞吐量提升、以及降低 45% 的单次引用成本。

此外 AWS 正与英特尔合作启动基于 Habana Gaudi 的 EC2 机器学习训练实例。与定于 2021 年推出的版本相比,未来版本有望带来高达 40% 的性价比提升。

需要指出的是,两款新产品都是去年 re:Invent 大会上推出的 AWS Inferentia 定制芯片方案的补充,且 Trainium 使用了与 Inferentia 相同的软件开发套件(SDK)。

据悉,在机器学习基础架构中,90% 的开销都用于解决推理成本。尽管 Inferentia 有着成本方面的优势,但开发团队也受到了固定 ML 训练的预算限制。

为了突破训练范围和频度的限制,AWS Trainium 通过以云为中心的 ML 训练,带来了最高性能和最低成本。结合两者,客户能够切实扩展 ML 训练的工作量、同时加速端到端的部署。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    452

    文章

    50182

    浏览量

    420685
  • 机器学习
    +关注

    关注

    66

    文章

    8346

    浏览量

    132289
  • AWS
    AWS
    +关注

    关注

    0

    文章

    426

    浏览量

    24285
收藏 人收藏

    评论

    相关推荐

    亚马逊新,阿里达摩院退出,融资规模大幅下滑后量子计算还是好生意吗?

    电子发烧友网报道(文/吴子鹏)在亚马逊的“AWS re:Invent 2023”活动中,其云计算部门AWS宣布推出两款新的自研芯片,分别是Graviton4和Trainium2。对于这
    的头像 发表于 11-30 00:12 2954次阅读
    亚马逊<b class='flag-5'>推</b>新,阿里达摩院退出,融资规模大幅下滑后量子计算还是好生意吗?

    麻省理工学院推出新型机器训练模型

    近日,据TechCrunch报道,麻省理工学院的研究团队展示了一种创新的机器训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据集,而是借鉴了大型语言模型(LLM)如GPT-4等所使用的大规模信息处理方式,为
    的头像 发表于 11-04 14:56 258次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速你的 Pytorch 深度学习训练
    的头像 发表于 10-28 14:05 114次阅读
    Pytorch深度<b class='flag-5'>学习</b><b class='flag-5'>训练</b>的方法

    英特尔和AWS共同投资定制芯片

    英特尔与全球云计算巨头亚马逊AWS达成了一项重大合作,标志着英特尔制造业务迎来了一位重量级客户——AWS。此次合作不仅可能为英特尔正在美国兴建的芯片工厂注入新的活力,更有望助力这家老牌芯片
    的头像 发表于 09-19 16:53 337次阅读

    英特尔与亚马逊AWS深化合作,共谋数十亿美元定制芯片计划

    英特尔与亚马逊云计算巨头AWS宣布了一项重大的长期战略合作协议,该协议涉及数十亿美元的投资,旨在通过定制芯片设计加速人工智能(AI)应用并优化各类工作负载的性能。这一合作标志着双方长达18年的合作关系迈入了一个
    的头像 发表于 09-18 16:31 811次阅读

    Cloudera推出机器学习项目加速器 (AMP) 的全新套件

    / -- Cloudera是唯一真正意义上的数据、分析和人工智能混合平台,该平台今天宣布推出多款全新机器学习项目加速器 (AMP) ,旨在缩短企业人工智能用例的价值实现时间。 新增功能主要是在Cloudera中为企业提供前沿的人工智能技术和示例,帮助企业进行人工智能整合并
    的头像 发表于 09-13 14:51 206次阅读

    pycharm如何训练机器学习模型

    PyCharm是一个流行的Python集成开发环境(IDE),它提供了丰富的功能,包括代码编辑、调试、测试等。在本文中,我们将介绍如何在PyCharm中训练机器学习模型。 一、安装PyCharm
    的头像 发表于 07-11 10:14 610次阅读

    训练和迁移学习的区别和联系

    训练和迁移学习是深度学习机器学习领域中的两个重要概念,它们在提高模型性能、减少训练时间和降低
    的头像 发表于 07-11 10:12 688次阅读

    如何理解机器学习中的训练集、验证集和测试集

    理解机器学习中的训练集、验证集和测试集,是掌握机器学习核心概念和流程的重要一步。这三者不仅构成了模型学习
    的头像 发表于 07-10 15:45 2788次阅读

    深度学习模型训练过程详解

    深度学习模型训练是一个复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。训练一个深度学习模型,本质上是通过优化算法调整模型参数,使模型能够更好地拟合数据,提高预测或分类的准
    的头像 发表于 07-01 16:13 1000次阅读

    亚马逊AWSTrainium2 AI架构

    AWS最新推出的Trainium2 AI训练引擎在re:Invent 2023主机上首次亮相,引起广泛关注,通过与AWS实验室的Gadi Hutt的交流和对技术文档的挖掘,可以试图深入
    发表于 12-14 11:48 327次阅读
    亚马逊<b class='flag-5'>AWS</b>的<b class='flag-5'>Trainium</b>2 AI架构

    深度解读亚马逊AI芯片核心技术

    Trainium1 芯片于 2020 年 12 月发布,并以两个不同的实例(Trn1 和 Trn1n)发货。我们当时对 Trainium1 和2021 年 12 月的这些实例进行了尽可能多的分析,坦率地说,
    发表于 12-06 10:04 739次阅读
    深度解读亚马逊AI<b class='flag-5'>芯片</b>核心技术

    国内首款开源鸿蒙人形机器人发布

     乐聚机器人在12月5日发布了一款名为“夸父”的全新机器人产品。夸父机器人被誉为国内首款开源鸿蒙人形机器人,具备跳跃能力且适应多种地形。
    的头像 发表于 12-05 16:38 1589次阅读

    AWS推出由AWS设计的AWS Trainium2芯片系列

    一年多来,我们一直期待Amazon Web Services在今年的re:Invent大会上为其本土服务器推出 Graviton4 处理器。
    的头像 发表于 11-29 17:30 1102次阅读
    <b class='flag-5'>AWS</b>推出由<b class='flag-5'>AWS</b>设计的<b class='flag-5'>AWS</b> <b class='flag-5'>Trainium</b>2<b class='flag-5'>芯片</b>系列

    如何在新机器中设置默认的defconifg?

    我忽略了这段话的方式是让我的新机器使用旧的“UBOOT_CONFIG_BASEMAME ” = “IMx93_11x11_evk ”而不是“UBOT_CONFIG_BASEMA
    发表于 11-13 07:14