0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AWS推全新机器学习定制训练芯片Trainium

如意 来源:cnBeta.COM 作者:cnBeta.COM 2020-12-02 11:18 次阅读

在 2020 年度的 re:Invent 大会上,亚马逊云服务(AWS)推出了全新的机器学习定制训练芯片 Trainium 。通过对 TensorFlow、PyTorch 和 MXNet 提供支持,该公司希望带来比任何竞争对手都更高的性能表现。此外 Trainium 还可作为一个 EC2 实例,在 AWS 的 SageMaker 机器学习平台上使用,基于这些定制芯片的新实例将于 2021 上半年推出。

Trainium 具有相当显著的速度和成本优势,与标准的 AWS GPU 实例相比,AWS 承诺可带来 30% 的吞吐量提升、以及降低 45% 的单次引用成本。

此外 AWS 正与英特尔合作启动基于 Habana Gaudi 的 EC2 机器学习训练实例。与定于 2021 年推出的版本相比,未来版本有望带来高达 40% 的性价比提升。

需要指出的是,两款新产品都是去年 re:Invent 大会上推出的 AWS Inferentia 定制芯片方案的补充,且 Trainium 使用了与 Inferentia 相同的软件开发套件(SDK)。

据悉,在机器学习基础架构中,90% 的开销都用于解决推理成本。尽管 Inferentia 有着成本方面的优势,但开发团队也受到了固定 ML 训练的预算限制。

为了突破训练范围和频度的限制,AWS Trainium 通过以云为中心的 ML 训练,带来了最高性能和最低成本。结合两者,客户能够切实扩展 ML 训练的工作量、同时加速端到端的部署。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    453

    文章

    50364

    浏览量

    421649
  • 机器学习
    +关注

    关注

    66

    文章

    8373

    浏览量

    132395
  • AWS
    AWS
    +关注

    关注

    0

    文章

    427

    浏览量

    24312
收藏 人收藏

    评论

    相关推荐

    亚马逊新,阿里达摩院退出,融资规模大幅下滑后量子计算还是好生意吗?

    电子发烧友网报道(文/吴子鹏)在亚马逊的“AWS re:Invent 2023”活动中,其云计算部门AWS宣布推出两款新的自研芯片,分别是Graviton4和Trainium2。对于这
    的头像 发表于 11-30 00:12 2985次阅读
    亚马逊<b class='flag-5'>推</b>新,阿里达摩院退出,融资规模大幅下滑后量子计算还是好生意吗?

    麻省理工学院推出新型机器训练模型

    近日,据TechCrunch报道,麻省理工学院的研究团队展示了一种创新的机器训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据集,而是借鉴了大型语言模型(LLM)如GPT-4等所使用的大规模信息处理方式,为
    的头像 发表于 11-04 14:56 375次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速你的 Pytorch 深度学习训练
    的头像 发表于 10-28 14:05 140次阅读
    Pytorch深度<b class='flag-5'>学习</b><b class='flag-5'>训练</b>的方法

    英特尔和AWS共同投资定制芯片

    英特尔与全球云计算巨头亚马逊AWS达成了一项重大合作,标志着英特尔制造业务迎来了一位重量级客户——AWS。此次合作不仅可能为英特尔正在美国兴建的芯片工厂注入新的活力,更有望助力这家老牌芯片
    的头像 发表于 09-19 16:53 356次阅读

    英特尔与亚马逊AWS深化合作,共谋数十亿美元定制芯片计划

    英特尔与亚马逊云计算巨头AWS宣布了一项重大的长期战略合作协议,该协议涉及数十亿美元的投资,旨在通过定制芯片设计加速人工智能(AI)应用并优化各类工作负载的性能。这一合作标志着双方长达18年的合作关系迈入了一个
    的头像 发表于 09-18 16:31 844次阅读

    Cloudera推出机器学习项目加速器 (AMP) 的全新套件

    / -- Cloudera是唯一真正意义上的数据、分析和人工智能混合平台,该平台今天宣布推出多款全新机器学习项目加速器 (AMP) ,旨在缩短企业人工智能用例的价值实现时间。 新增功能主要是在Cloudera中为企业提供前沿的人工智能技术和示例,帮助企业进行人工智能整合并
    的头像 发表于 09-13 14:51 222次阅读

    pycharm如何训练机器学习模型

    PyCharm是一个流行的Python集成开发环境(IDE),它提供了丰富的功能,包括代码编辑、调试、测试等。在本文中,我们将介绍如何在PyCharm中训练机器学习模型。 一、安装PyCharm
    的头像 发表于 07-11 10:14 676次阅读

    训练和迁移学习的区别和联系

    训练和迁移学习是深度学习机器学习领域中的两个重要概念,它们在提高模型性能、减少训练时间和降低
    的头像 发表于 07-11 10:12 822次阅读

    如何理解机器学习中的训练集、验证集和测试集

    理解机器学习中的训练集、验证集和测试集,是掌握机器学习核心概念和流程的重要一步。这三者不仅构成了模型学习
    的头像 发表于 07-10 15:45 3163次阅读

    深度学习模型训练过程详解

    深度学习模型训练是一个复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。训练一个深度学习模型,本质上是通过优化算法调整模型参数,使模型能够更好地拟合数据,提高预测或分类的准
    的头像 发表于 07-01 16:13 1068次阅读

    如何使用Python进行图像识别的自动学习自动训练

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握一些重要的概念和技术。在本文中,我们将介绍如何使用Python中的一些常用
    的头像 发表于 01-12 16:06 535次阅读

    亚马逊AWSTrainium2 AI架构

    AWS最新推出的Trainium2 AI训练引擎在re:Invent 2023主机上首次亮相,引起广泛关注,通过与AWS实验室的Gadi Hutt的交流和对技术文档的挖掘,可以试图深入
    发表于 12-14 11:48 345次阅读
    亚马逊<b class='flag-5'>AWS</b>的<b class='flag-5'>Trainium</b>2 AI架构

    深度解读亚马逊AI芯片核心技术

    Trainium1 芯片于 2020 年 12 月发布,并以两个不同的实例(Trn1 和 Trn1n)发货。我们当时对 Trainium1 和2021 年 12 月的这些实例进行了尽可能多的分析,坦率地说,
    发表于 12-06 10:04 757次阅读
    深度解读亚马逊AI<b class='flag-5'>芯片</b>核心技术

    国内首款开源鸿蒙人形机器人发布

     乐聚机器人在12月5日发布了一款名为“夸父”的全新机器人产品。夸父机器人被誉为国内首款开源鸿蒙人形机器人,具备跳跃能力且适应多种地形。
    的头像 发表于 12-05 16:38 1607次阅读

    AWS推出由AWS设计的AWS Trainium2芯片系列

    一年多来,我们一直期待Amazon Web Services在今年的re:Invent大会上为其本土服务器推出 Graviton4 处理器。
    的头像 发表于 11-29 17:30 1157次阅读
    <b class='flag-5'>AWS</b>推出由<b class='flag-5'>AWS</b>设计的<b class='flag-5'>AWS</b> <b class='flag-5'>Trainium</b>2<b class='flag-5'>芯片</b>系列