亚马逊推出基于Inferentia芯片的Inf1实例-电子发烧友网

当地时间12月3日，亚马逊在“AWS re：invent”大会上正式发布了自主研发的第二代基于Arm架构的服务器芯片Graviton2，同时公布了去年发布的云端AI推理芯片Inferentia的最新进展。

亚马逊AWS在此次大会上推出了Inf1实例，该实例由Inferentia芯片提供支持，是一个在云端为AI推理提供支持的实例，AWS CEO Andy Jassy称之为云中可用的成本最低的推理产品。

Andy Jassy 指出：使用云服务为AI解决方案提供动力的运营成本绝大多数来自推理，而推理芯片可能会很昂贵，并且要求低延迟和高吞吐量。许多企业都在模型训练的定制芯片上投入了大量精力，尽管常规 CPU 上已经能够较好地执行推理运算，但定制芯片的效率明显更高。“与Nvidia G4实例相比，Inf1具有更低的延迟，吞吐量将提高3倍，并且每个实例的成本降低40％。”

Inferentia芯片还将由Annapurna Labs提供支持，该芯片企业是2015年被以色列AWS收购的。Inferentia芯片拥有4的个NeuronCore，可以提供128TOPS的算力，而每个Inf1实例可以提供2000 TOPS的算力。

与 EC4 上的常规 G4 实例相比，Inferentia 能够让 AWS 带来更低的延时、三倍的吞吐量、且降低 40% 单次的成本。

Inf1实例目前已经上市，并将与PyTorch，MXNet和TensoRFlow集成。不过，目前其仅可在EC2计算服务中使用，但明年，Inf1将可以用于EKS实例和Amazon的SageMaker，来进行机器学习的推理运算。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ARM

ARM

+关注

关注
134

文章
9211

浏览量
371128
AI

AI

+关注

关注
87

文章
32487

浏览量
271683
亚马逊

亚马逊

+关注

关注
8

文章
2687

浏览量
83993

NeuroBlade携手亚马逊EC2 F2实例，加速数据分析

数据分析加速领域的领航者NeuroBlade，近日宣布与亚马逊云科技(AWS)最新推出的Amazon Elastic Compute Cloud (Amazon EC2) F2实例实现深度集成。这一

发表于 12-31 11:37 •320次阅读

亚马逊云科技发布Amazon Trainium2实例

近期，亚马逊云科技宣布了一项重要更新：基于Amazon Trainium2的全新Amazon Elastic Compute Cloud(Amazon EC2)Trn2实例现已正式推出。这一创新

发表于 12-27 14:57 •387次阅读

亚马逊转向Trainium芯片，全力投入AI模型训练

，亚马逊AWS推出了两款芯片：Inferentia和Trainium。其中，Inferentia主要用于AI推理，而Trainium则专注于

发表于 12-13 14:14 •412次阅读

亚马逊云科技宣布Amazon Trainium2实例正式可用

亚马逊云科技推出新一代AI训练芯片Amazon Trainium3 全新Amazon EC2 Trn2实例采用亚马逊云科技最新的Traini

发表于 12-06 09:15 •293次阅读

<b class='flag-5'>亚马逊</b>云科技宣布Amazon Trainium2<b class='flag-5'>实例</b>正式可用

亚马逊追加40亿美元投资，深化与Anthropic战略合作

标志着双方将在人工智能模型训练方面展开更加紧密的合作，共同探索前沿技术，提升模型性能和效率。为了支持Anthropic未来的模型训练和部署，亚马逊计划提供其先进的Amazon Trainium和Amazon Inferentia芯片

发表于 11-26 11:13 •492次阅读

亚马逊将推新芯片，挑战英伟达

亚马逊正准备推出其最新的人工智能芯片，这标志着其在半导体技术方面数十亿美元的投资迈出了重要一步。目标是减少对NVIDIA的依赖，后者目前在AI处理器市场占据主导地位。亚马逊的云计算部门

发表于 11-15 01:08 •387次阅读

亚马逊将推出最新人工智能芯片

近日，亚马逊(Amazon.com)宣布即将推出其最新的人工智能芯片，标志着这家大型科技集团在半导体领域的又一重大举措。据悉，亚马逊正寻求通过数十亿美元的半导体投资获得丰厚回报，并计划

发表于 11-14 15:27 •353次阅读

亚马逊云科技推出Amazon Lambda SnapStart功能

亚马逊云科技推出Amazon Lambda SnapStart，大幅提升Java Lambda函数启动性能　　北京，2024年10月29日 —— 亚马逊云科技近日宣布，与光环新网和西云数据

发表于 10-30 10:59 •408次阅读

亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

北京2024年7月15日 /美通社/ -- 亚马逊云科技宣布基于自研芯片Amazon Graviton4处理器的Amazon Elastic Compute Cloud (Amazon EC2

发表于 07-15 16:09 •458次阅读

亚马逊网络服务即将推出第四代Graviton处理器

7月10日，雅虎财经独家报道了亚马逊网络服务（AWS）即将推出的重大技术进展——其第四代Graviton处理器，即Graviton4芯片。这一重要信息由AWS的计算与人工智能产品管理总监拉胡尔·库尔卡尼在德克萨斯州奥斯汀的

发表于 07-10 15:51 •719次阅读

亚马逊云科技升级“3+1”合作伙伴战略与合作伙伴共赴新征程

北京2024年5月31日 /美通社/ -- 亚马逊云科技中国合作伙伴峰会在上海召开。峰会上，亚马逊云科技升级推出“3+1”合作伙伴战略，聚焦生成式AI、专注行业和业务拓展三大业务战略，

发表于 06-11 10:05 •746次阅读

亚马逊云科技升级“3+1”合作伙伴战略

亚马逊云科技近期于上海召开了盛大的中国合作伙伴峰会。在这次会议上，亚马逊云科技正式宣布推出升级版的“3+1”合作伙伴战略，旨在通过聚焦生成式AI、专注行业和业务拓展三大核心领域，以及提

发表于 06-06 10:50 •769次阅读

亚马逊推出“Project PI”提升商品质量

近日，亚马逊为提升顾客满意度，推出了创新性的“Project PI”（侦探项目）。该项目利用先进的生成式AI和计算机视觉技术，为商品质量把控提供了强有力的支持。

发表于 06-06 09:20 •446次阅读

亚马逊AWS称未停止任何英伟达芯片订单

针对近期关于“亚马逊云计算部门暂停订购英伟达Hopper芯片”的报道，亚马逊AWS部门近日给出了明确回应。AWS发言人表示，公司并未停止任何与英伟达相关的订单。

发表于 05-22 11:39 •647次阅读

亚马逊推出电商AI工具

亚马逊近日宣布推出了一项创新的电商AI工具，该工具旨在帮助卖家们更加高效地创建产品详情页面。据了解，这一AI新功能具备强大的自动化能力，能够基于卖家提供的关键词和产品图片等信息，智能地生成产品标题、描述以及其他重要的详细信息。

发表于 03-21 11:45 •906次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

亚马逊推出基于Inferentia芯片的Inf1实例

评论

NeuroBlade携手亚马逊EC2 F2实例，加速数据分析

亚马逊云科技发布Amazon Trainium2实例

亚马逊转向Trainium芯片，全力投入AI模型训练

亚马逊云科技宣布Amazon Trainium2实例正式可用

亚马逊追加40亿美元投资，深化与Anthropic战略合作

亚马逊将推新芯片，挑战英伟达

亚马逊将推出最新人工智能芯片

亚马逊云科技推出Amazon Lambda SnapStart功能

亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

亚马逊网络服务即将推出第四代Graviton处理器

亚马逊云科技升级“3+1”合作伙伴战略与合作伙伴共赴新征程

亚马逊云科技升级“3+1”合作伙伴战略

亚马逊推出“Project PI”提升商品质量

亚马逊AWS称未停止任何英伟达芯片订单

亚马逊推出电商AI工具