亚马逊宣布推出全新的AI训练芯片AWS Trainium-电子发烧友网

在近日举办的re：Invent开发人员大会上，AWS宣布推出全新的AI训练芯片AWS Trainium，这是该公司用于训练机器学习模型的下一代定制芯片。该公司承诺，通过对TensorFlow，PyTorch和MXNet的支持，它可以提供比云中任何竞争对手更高的性能。

据亚马逊方面介绍，AWS Trainium是由AWS设计的第二个定制的机器学习（ML）芯片，为在云中训练ML模型提供最佳的性价比。除了提供最具成本效益的ML训练外，Trainium还为云中的ML提供了最高的性能和最大的万亿次运算（TFLOPS）计算能力，并支持更广泛的ML应用。

从他们提供的数据可以看到，亚马逊新芯片与标准的AWS GPU实例相比，带来了30％的吞吐量提升，并将每次使用成本降低了45%。

亚马逊指出，Trainium芯片专门针对深度学习培训工作负载进行了优化，适用于图像分类，语义搜索，翻译，语音识别，自然语言处理和推荐引擎等应用。

按照亚马逊的说法，随着ML的使用加速，我们迫切需要通过推理和训练来提高性能并降低基础架构成本。去年，AWS推出了AWS Inferentia，这是一种定制芯片，可为客户提供云中最低成本的高性能ML推理。虽然Inferentia解决了推理成本，即使该成本占ML基础架构成本的90％，但许多开发团队也还受到固定ML训练预算的限制。这限制了改进模型和应用程序所需的培训范围和频率。AWS Trainium通过为云中的ML培训提供最高的性能和最低的成本来应对这一挑战。借助Trainium和Inferentia，客户将拥有从扩展培训工作量到部署加速推理的ML计算的端到端流程。

亚马逊进一步指出，AWS Trainium与AWS Inferentia共享相同的AWS神经元SDK，这就方便Inferentia开发人员开始使用Trainium。由于Neuron SDK已与包括TensorFlow，PyTorch和MXNet在内的流行ML框架集成在一起，因此开发人员可以通过最少的代码更改轻松地从基于GPU的实例迁移到AWS Trainium。

据介绍，AWS Trainium可通过Amazon EC2实例和AWS Deep Learning AMI以及包括Amazon SageMaker，Amazon ECS，EKS和AWS Batch在内的托管服务使用。

因为没有基准测试结果，所以我们尚不清楚Trainium的性能在与Google的张量处理单元（TPU）进行比较时，谁更厉害。后者是Google托管在Google Cloud Platform中的AI训练工作负载的芯片。谷歌表示，即将推出的第四代TPU提供的矩阵乘法万亿次运算能力是第三代TPU的两倍以上。（矩阵通常用于表示输入到AI模型的数据。）它还提供了“显著”的内存带宽提升，同时受益于互连技术的进步。

过去，机器学习的部署受到算法的大小和速度以及对昂贵硬件的需求的限制。实际上，麻省理工学院的一份报告发现，机器学习可能正在接近计算极限。一项单独的Synced 研究估计，华盛顿大学的Grover假新闻检测模型在大约两周内花费了25，000美元进行训练。据报道，OpenAI花费了高达1200万美元来训练其GPT-3语言模型，而Google估计花费了6，912美元来训练BERT，这是一种双向转换器模型，可为11种自然语言处理任务重新定义最先进的技术。

随着企业需求的增长，Amazon越来越倾向于转向AI和机器学习训练以及推理服务。根据一项估计，2017年全球机器学习市场的价值为15.8亿美元，预计到2024年将达到208.3亿美元。11月，亚马逊宣布将Alexa和Rekognition的部分计算转移到Inferentia支持的实例上，旨在使工作更快，更便宜，同时将其从Nvidia芯片上移开。当时，该公司声称将部分Alexa工作转移到Inferentia，从而使延迟时间缩短了25％，而成本却降低了30％。
责任编辑:tzh

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
455

文章
50732

浏览量
423253
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132573
亚马逊

亚马逊

+关注

关注
8

文章
2651

浏览量
83324

亚马逊转向Trainium芯片，全力投入AI模型训练

，亚马逊AWS推出了两款芯片：Inferentia和Trainium。其中，Inferentia主要用于

发表于 12-13 14:14 •268次阅读

亚马逊云科技宣布Amazon Trainium2实例正式可用

亚马逊云科技推出新一代AI训练芯片Amazon Trainium3

发表于 12-06 09:15 •149次阅读

苹果利用AWS定制AI芯片提升服务

近日，苹果公司在AWS Reinvent大会上透露，正借助亚马逊云计算部门AWS的定制人工智能(AI)芯片来强化其搜索等服务。此举显示了苹果

发表于 12-05 14:14 •167次阅读

亚马逊启动“登月”计划，目标部署10万颗自研AI芯片

：Trainium2，目标是在亚马逊自己的数据中心里部署10万颗Trainium2，以提高数据处理效率并降低AI芯片采购成本。近几年，

发表于 12-02 00:26 •2183次阅读

亚马逊追加40亿美元投资，深化与Anthropic战略合作

标志着双方将在人工智能模型训练方面展开更加紧密的合作，共同探索前沿技术，提升模型性能和效率。为了支持Anthropic未来的模型训练和部署，亚马逊计划提供其先进的Amazon Trainiu

发表于 11-26 11:13 •381次阅读

亚马逊将推新芯片，挑战英伟达

亚马逊正准备推出其最新的人工智能芯片，这标志着其在半导体技术方面数十亿美元的投资迈出了重要一步。目标是减少对NVIDIA的依赖，后者目前在AI处理器市场占据主导地位。

发表于 11-15 01:08 •253次阅读

亚马逊云科技与甲骨文合作推出新服务

近日，亚马逊云科技（Amazon Web Services，简称AWS）与甲骨文（Oracle）宣布了一项重大合作，共同推出了Oracle Database@Amazon Web Se

发表于 10-08 14:57 •407次阅读

英特尔将为亚马逊定制AI芯片

英特尔首席执行官帕特·基辛格近日宣布了一项重大合作，正式将亚马逊AWS纳入其高端制造业务的客户行列。双方将携手开启一项为期数年、投资规模高达数十亿美元的宏伟计划，共同研发一款专为人工智能计算量身定制的

发表于 09-20 17:54 •922次阅读

英特尔与亚马逊AWS深化合作,共谋数十亿美元定制芯片计划

英特尔与亚马逊云计算巨头AWS宣布了一项重大的长期战略合作协议，该协议涉及数十亿美元的投资，旨在通过定制芯片设计加速人工智能（AI）应用并优

发表于 09-18 16:31 •928次阅读

亚马逊AWS自研AI芯片崛起,挑战英伟达

近期，据路透社独家报道披露，在德克萨斯州奥斯汀市一处紧密防守的芯片实验室中，六位来自亚马逊AWS的工程师正在对一种尚未公开透露名称及详细参数的新型服务器展开深入测试。这一关键事件引人注目，因为我们

发表于 07-27 14:33 •1096次阅读

英伟达宣布每年设计一代全新AI芯片，加快其他产品线更新速度

英伟达CEO黄仁勋宣布，公司将每年推出全新AI芯片，以满足市场需求。他表示，Blackwell后将有新款

发表于 05-23 10:41 •761次阅读

亚马逊AWS称未停止任何英伟达芯片订单

针对近期关于“亚马逊云计算部门暂停订购英伟达Hopper芯片”的报道，亚马逊AWS部门近日给出了明确回应。AWS发言人表示，公司并未停止任何

发表于 05-22 11:39 •540次阅读

亚马逊推出电商AI工具

亚马逊近日宣布推出了一项创新的电商AI工具，该工具旨在帮助卖家们更加高效地创建产品详情页面。据了解，这一AI新功能具备强大的自动化能力，能够

发表于 03-21 11:45 •778次阅读

亚马逊AWS将投资超50亿美元在墨西哥建立数据中心集群

亚马逊网络服务（AWS）墨西哥公司近日宣布，随着企业对新技术的广泛采用和云服务需求的日益增长，公司计划投资超过50亿美元在墨西哥建立一个全新的数据中心集群。该决策标志着

发表于 02-28 10:31 •465次阅读

亚马逊推出生成式AI购物助手Rufus

亚马逊公司宣布推出全新的生成式AI工具，旨在帮助改善客户的在线购物体验。这款AI助手被命名为Ru

发表于 02-03 13:53 •739次阅读

搜索历史

亚马逊宣布推出全新的AI训练芯片AWS Trainium

评论

亚马逊转向Trainium芯片，全力投入AI模型训练

亚马逊云科技宣布Amazon Trainium2实例正式可用

苹果利用AWS定制AI芯片提升服务

亚马逊启动“登月”计划，目标部署10万颗自研AI芯片

亚马逊追加40亿美元投资，深化与Anthropic战略合作

亚马逊将推新芯片，挑战英伟达

亚马逊云科技与甲骨文合作推出新服务

英特尔将为亚马逊定制AI芯片

英特尔与亚马逊AWS深化合作,共谋数十亿美元定制芯片计划

亚马逊AWS自研AI芯片崛起,挑战英伟达

英伟达宣布每年设计一代全新AI芯片，加快其他产品线更新速度

亚马逊AWS称未停止任何英伟达芯片订单

亚马逊推出电商AI工具

亚马逊AWS将投资超50亿美元在墨西哥建立数据中心集群

亚马逊推出生成式AI购物助手Rufus