0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊宣布推出全新的AI训练芯片AWS Trainium

我快闭嘴 来源:半导体行业观察综合 作者:半导体行业观察综 2020-12-02 15:21 次阅读

在近日举办的re:Invent开发人员大会上,AWS宣布推出全新的AI训练芯片AWS Trainium,这是该公司用于训练机器学习模型的下一代定制芯片。该公司承诺,通过对TensorFlow,PyTorch和MXNet的支持,它可以提供比云中任何竞争对手更高的性能。

亚马逊方面介绍,AWS Trainium是由AWS设计的第二个定制的 机器学习(ML)芯片,为在云中训练ML模型提供最佳的性价比。除了提供最具成本效益的ML训练外,Trainium还为云中的ML提供了最高的性能和最大的万亿次运算(TFLOPS)计算能力,并支持更广泛的ML应用。

从他们提供的数据可以看到,亚马逊新芯片与标准的AWS GPU实例相比,带来了30%的吞吐量提升,并将每次使用成本降低了45%。

亚马逊指出,Trainium芯片专门针对深度学习培训工作负载进行了优化,适用于图像分类,语义搜索,翻译,语音识别,自然语言处理和推荐引擎等应用。

按照亚马逊的说法,随着ML的使用加速,我们迫切需要通过推理和训练来提高性能并降低基础架构成本。去年,AWS推出了AWS Inferentia,这是一种定制芯片,可为客户提供云中最低成本的高性能ML推理。虽然Inferentia解决了推理成本,即使该成本占ML基础架构成本的90%,但许多开发团队也还受到固定ML训练预算的限制。这限制了改进模型和应用程序所需的培训范围和频率。AWS Trainium通过为云中的ML培训提供最高的性能和最低的成本来应对这一挑战。借助Trainium和Inferentia,客户将拥有从扩展培训工作量到部署加速推理的ML计算的端到端流程。

亚马逊进一步指出,AWS Trainium与AWS Inferentia共享相同的AWS神经元SDK,这就方便Inferentia开发人员开始使用Trainium。由于Neuron SDK已与包括TensorFlow,PyTorch和MXNet在内的流行ML框架集成在一起,因此开发人员可以通过最少的代码更改轻松地从基于GPU的实例迁移到AWS Trainium。

据介绍,AWS Trainium可通过Amazon EC2实例和AWS Deep Learning AMI以及包括Amazon SageMaker,Amazon ECS,EKS和AWS Batch在内的托管服务使用。

因为没有基准测试结果,所以我们尚不清楚Trainium的性能在与Google的张量处理单元(TPU)进行比较时,谁更厉害。后者是Google托管在Google Cloud Platform中的AI训练工作负载的芯片。谷歌表示,即将推出的第四代TPU提供的矩阵乘法万亿次运算能力是第三代TPU的两倍以上。(矩阵通常用于表示输入到AI模型的数据。)它还提供了“显著”的内存带宽提升,同时受益于互连技术的进步。

过去,机器学习的部署受到算法的大小和速度以及对昂贵硬件的需求的限制。实际上, 麻省理工学院的一份报告发现,机器学习可能正在接近计算极限。一项单独的Synced 研究估计,华盛顿大学的Grover假新闻检测模型在大约两周内花费了25,000美元进行训练。据报道,OpenAI花费了高达1200万美元来训练其GPT-3语言模型,而Google估计花费了6,912美元来训练BERT,这是一种双向转换器模型,可为11种自然语言处理任务重新定义最先进的技术。

随着企业需求的增长,Amazon越来越倾向于转向AI和机器学习训练以及推理服务。根据一项估计,2017年全球机器学习市场的价值为15.8亿美元,预计到2024年将达到208.3亿美元。11月,亚马逊宣布将Alexa和Rekognition的部分计算转移到Inferentia支持的实例上,旨在使工作更快,更便宜,同时将其从Nvidia芯片上移开。当时,该公司声称将部分Alexa工作转移到Inferentia,从而使延迟时间缩短了25%,而成本却降低了30%。
责任编辑:tzh

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    453

    文章

    50378

    浏览量

    421698
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397
  • 亚马逊
    +关注

    关注

    8

    文章

    2624

    浏览量

    83180
收藏 人收藏

    评论

    相关推荐

    亚马逊推新,阿里达摩院退出,融资规模大幅下滑后量子计算还是好生意吗?

    电子发烧友网报道(文/吴子鹏)在亚马逊的“AWS re:Invent 2023”活动中,其云计算部门AWS宣布推出两款新的自研
    的头像 发表于 11-30 00:12 2986次阅读
    <b class='flag-5'>亚马逊</b>推新,阿里达摩院退出,融资规模大幅下滑后量子计算还是好生意吗?

    亚马逊将推新芯片,挑战英伟达

    亚马逊正准备推出其最新的人工智能芯片,这标志着其在半导体技术方面数十亿美元的投资迈出了重要一步。目标是减少对NVIDIA的依赖,后者目前在AI处理器市场占据主导地位。
    的头像 发表于 11-15 01:08 132次阅读
    <b class='flag-5'>亚马逊</b>将推新<b class='flag-5'>芯片</b>,挑战英伟达

    亚马逊云科技与甲骨文合作推出新服务

    近日,亚马逊云科技(Amazon Web Services,简称AWS)与甲骨文(Oracle)宣布了一项重大合作,共同推出了Oracle Database@Amazon Web Se
    的头像 发表于 10-08 14:57 350次阅读

    英特尔与亚马逊AWS深化合作,共谋数十亿美元定制芯片计划

    英特尔与亚马逊云计算巨头AWS宣布了一项重大的长期战略合作协议,该协议涉及数十亿美元的投资,旨在通过定制芯片设计加速人工智能(AI)应用并优
    的头像 发表于 09-18 16:31 844次阅读

    亚马逊AWS自研AI芯片崛起,挑战英伟达

    近期,据路透社独家报道披露,在德克萨斯州奥斯汀市一处紧密防守的芯片实验室中,六位来自亚马逊AWS的工程师正在对一种尚未公开透露名称及详细参数的新型服务器展开深入测试。这一关键事件引人注目,因为我们
    的头像 发表于 07-27 14:33 998次阅读

    亚马逊AWS称未停止任何英伟达芯片订单

    针对近期关于“亚马逊云计算部门暂停订购英伟达Hopper芯片”的报道,亚马逊AWS部门近日给出了明确回应。AWS发言人表示,公司并未停止任何
    的头像 发表于 05-22 11:39 506次阅读

    亚马逊推出电商AI工具

    亚马逊近日宣布推出了一项创新的电商AI工具,该工具旨在帮助卖家们更加高效地创建产品详情页面。据了解,这一AI新功能具备强大的自动化能力,能够
    的头像 发表于 03-21 11:45 744次阅读

    亚马逊AWS将投资超50亿美元在墨西哥建立数据中心集群

    亚马逊网络服务(AWS)墨西哥公司近日宣布,随着企业对新技术的广泛采用和云服务需求的日益增长,公司计划投资超过50亿美元在墨西哥建立一个全新的数据中心集群。该决策标志着
    的头像 发表于 02-28 10:31 428次阅读

    亚马逊推出生成式AI购物助手Rufus

    亚马逊公司宣布推出全新的生成式AI工具,旨在帮助改善客户的在线购物体验。这款AI助手被命名为Ru
    的头像 发表于 02-03 13:53 682次阅读

    亚马逊AWSTrainium2 AI架构

    AWS最新推出Trainium2 AI训练引擎在re:Invent 2023主机上首次亮相,引起广泛关注,通过与
    发表于 12-14 11:48 348次阅读
    <b class='flag-5'>亚马逊</b><b class='flag-5'>AWS</b>的<b class='flag-5'>Trainium</b>2 <b class='flag-5'>AI</b>架构

    深度解读亚马逊AI芯片核心技术

    Trainium1 芯片于 2020 年 12 月发布,并以两个不同的实例(Trn1 和 Trn1n)发货。我们当时对 Trainium1 和2021 年 12 月的这些实例进行了尽可能多的分析,坦率地说,
    发表于 12-06 10:04 757次阅读
    深度解读<b class='flag-5'>亚马逊</b><b class='flag-5'>AI</b><b class='flag-5'>芯片</b>核心技术

    亚马逊再发两款自研芯片训练芯片时隔三年迎来更新

    电子发烧友网报道(文/周凯扬)在今年的AWS re:Invent上,云服务巨头亚马逊公开了两款全新的自研芯片,一是基于Arm架构的新一代Gravition CPU,Gravition4
    的头像 发表于 11-30 00:09 1524次阅读

    NVIDIA 为部分大型亚马逊 Titan 基础模型提供训练支持

    本文将介绍亚马逊如何使用 NVIDIA NeMo 框架、GPU 以及亚马逊云科技的 EFA 来训练其 最大的新一代大语言模型(LLM)。 大语言模型的一切都很庞大——巨型模型是在数千颗 NVIDIA
    的头像 发表于 11-29 21:15 513次阅读
    NVIDIA 为部分大型<b class='flag-5'>亚马逊</b> Titan 基础模型提供<b class='flag-5'>训练</b>支持

    AWS推出AWS设计的AWS Trainium2芯片系列

    一年多来,我们一直期待Amazon Web Services在今年的re:Invent大会上为其本土服务器推出 Graviton4 处理器。
    的头像 发表于 11-29 17:30 1159次阅读
    <b class='flag-5'>AWS</b><b class='flag-5'>推出</b>由<b class='flag-5'>AWS</b>设计的<b class='flag-5'>AWS</b> <b class='flag-5'>Trainium</b>2<b class='flag-5'>芯片</b>系列

    亚马逊云科技推出8门全新的免费课程,帮助成年人提升AI和生成式AI技能

    提供免费人工智能(AI)技能培训和教育资源。亚马逊云科技计划通过推出新的人工智能课程和学习计划以及扩展现有项目来兑现这一承诺。作为该目标的一部分,亚马逊云科技
    的头像 发表于 11-24 13:54 516次阅读