0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊推出基于Inferentia芯片的Inf1实例

汽车玩家 来源:芯智讯 作者:芯智讯 2019-12-05 14:31 次阅读

当地时间12月3日,亚马逊在“AWS re:invent”大会上正式发布了自主研发的第二代基于Arm架构的服务器芯片Graviton2,同时公布了去年发布的云端AI推理芯片Inferentia的最新进展。

亚马逊AWS在此次大会上推出了Inf1实例,该实例由Inferentia芯片提供支持,是一个在云端为AI推理提供支持的实例,AWS CEO Andy Jassy称之为云中可用的成本最低的推理产品

Andy Jassy 指出:使用云服务为AI解决方案提供动力的运营成本绝大多数来自推理,而推理芯片可能会很昂贵,并且要求低延迟和高吞吐量。许多企业都在模型训练的定制芯片上投入了大量精力,尽管常规 CPU 上已经能够较好地执行推理运算,但定制芯片的效率明显更高。“与Nvidia G4实例相比,Inf1具有更低的延迟,吞吐量将提高3倍,并且每个实例的成本降低40%。”

Inferentia芯片还将由Annapurna Labs提供支持,该芯片企业是2015年被以色列AWS收购的。Inferentia芯片拥有4的个NeuronCore,可以提供128TOPS的算力,而每个Inf1实例可以提供2000 TOPS的算力。

与 EC4 上的常规 G4 实例相比,Inferentia 能够让 AWS 带来更低的延时、三倍的吞吐量、且降低 40% 单次的成本。

Inf1实例目前已经上市,并将与PyTorch,MXNet和TensoRFlow集成。不过,目前其仅可在EC2计算服务中使用,但明年,Inf1将可以用于EKS实例和Amazon的SageMaker,来进行机器学习的推理运算。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9059

    浏览量

    366929
  • AI
    AI
    +关注

    关注

    87

    文章

    30279

    浏览量

    268509
  • 亚马逊
    +关注

    关注

    8

    文章

    2630

    浏览量

    83213
收藏 人收藏

    评论

    相关推荐

    亚马逊追加40亿美元投资,深化与Anthropic战略合作

    标志着双方将在人工智能模型训练方面展开更加紧密的合作,共同探索前沿技术,提升模型性能和效率。 为了支持Anthropic未来的模型训练和部署,亚马逊计划提供其先进的Amazon Trainium和Amazon Inferentia芯片
    的头像 发表于 11-26 11:13 307次阅读

    亚马逊将推新芯片,挑战英伟达

    亚马逊正准备推出其最新的人工智能芯片,这标志着其在半导体技术方面数十亿美元的投资迈出了重要一步。目标是减少对NVIDIA的依赖,后者目前在AI处理器市场占据主导地位。亚马逊的云计算部门
    的头像 发表于 11-15 01:08 211次阅读
    <b class='flag-5'>亚马逊</b>将推新<b class='flag-5'>芯片</b>,挑战英伟达

    亚马逊推出最新人工智能芯片

    近日,亚马逊(Amazon.com)宣布即将推出其最新的人工智能芯片,标志着这家大型科技集团在半导体领域的又一重大举措。据悉,亚马逊正寻求通过数十亿美元的半导体投资获得丰厚回报,并计划
    的头像 发表于 11-14 15:27 194次阅读

    亚马逊云科技推出Amazon Lambda SnapStart功能

    亚马逊云科技推出Amazon Lambda SnapStart,大幅提升Java Lambda函数启动性能   北京,2024年10月29日 —— 亚马逊云科技近日宣布,与光环新网和西云数据
    的头像 发表于 10-30 10:59 210次阅读

    亚马逊AWS自研AI芯片崛起,挑战英伟达

    近期,据路透社独家报道披露,在德克萨斯州奥斯汀市一处紧密防守的芯片实验室中,六位来自亚马逊AWS的工程师正在对一种尚未公开透露名称及详细参数的新型服务器展开深入测试。这一关键事件引人注目,因为我们
    的头像 发表于 07-27 14:33 1018次阅读

    亚马逊云科技宣布基于自研Amazon Graviton4的Amazon EC2 R8g实例正式可用

    北京2024年7月15日 /美通社/ -- 亚马逊云科技宣布基于自研芯片Amazon Graviton4处理器的Amazon Elastic Compute Cloud (Amazon EC2
    的头像 发表于 07-15 16:09 353次阅读

    亚马逊网络服务即将推出第四代Graviton处理器

    7月10日,雅虎财经独家报道了亚马逊网络服务(AWS)即将推出的重大技术进展——其第四代Graviton处理器,即Graviton4芯片。这一重要信息由AWS的计算与人工智能产品管理总监拉胡尔·库尔卡尼在德克萨斯州奥斯汀的
    的头像 发表于 07-10 15:51 578次阅读

    亚马逊云科技升级“3+1”合作伙伴战略 与合作伙伴共赴新征程

    北京2024年5月31日 /美通社/ -- 亚马逊云科技中国合作伙伴峰会在上海召开。峰会上,亚马逊云科技升级推出“3+1”合作伙伴战略,聚焦生成式AI、专注行业和业务拓展三大业务战略,
    的头像 发表于 06-11 10:05 585次阅读
    <b class='flag-5'>亚马逊</b>云科技升级“3+<b class='flag-5'>1</b>”合作伙伴战略 与合作伙伴共赴新征程

    亚马逊云科技升级“3+1”合作伙伴战略

    亚马逊云科技近期于上海召开了盛大的中国合作伙伴峰会。在这次会议上,亚马逊云科技正式宣布推出升级版的“3+1”合作伙伴战略,旨在通过聚焦生成式AI、专注行业和业务拓展三大核心领域,以及提
    的头像 发表于 06-06 10:50 662次阅读

    亚马逊推出“Project PI”提升商品质量

    近日,亚马逊为提升顾客满意度,推出了创新性的“Project PI”(侦探项目)。该项目利用先进的生成式AI和计算机视觉技术,为商品质量把控提供了强有力的支持。
    的头像 发表于 06-06 09:20 333次阅读

    亚马逊AWS称未停止任何英伟达芯片订单

    针对近期关于“亚马逊云计算部门暂停订购英伟达Hopper芯片”的报道,亚马逊AWS部门近日给出了明确回应。AWS发言人表示,公司并未停止任何与英伟达相关的订单。
    的头像 发表于 05-22 11:39 517次阅读

    亚马逊推出电商AI工具

    亚马逊近日宣布推出了一项创新的电商AI工具,该工具旨在帮助卖家们更加高效地创建产品详情页面。据了解,这一AI新功能具备强大的自动化能力,能够基于卖家提供的关键词和产品图片等信息,智能地生成产品标题、描述以及其他重要的详细信息。
    的头像 发表于 03-21 11:45 758次阅读

    亚马逊云科技在中国区域推出Amazon Network Firewall

    轻松实现云上工作负载保护 北京2024年3月7日 /美通社/ -- 亚马逊云科技宣布,通过与光环新网和西云数据的紧密合作,在亚马逊云科技(北京)区域和(宁夏)区域推出网络防火墙服务Amazon
    的头像 发表于 03-07 16:02 679次阅读

    亚马逊AWS的Trainium2 AI架构

    AWS最新推出的Trainium2 AI训练引擎在re:Invent 2023主机上首次亮相,引起广泛关注,通过与AWS实验室的Gadi Hutt的交流和对技术文档的挖掘,可以试图深入了解Trainium2与之前Inferentia系列的关系以及对Trainium2的期望
    发表于 12-14 11:48 354次阅读
    <b class='flag-5'>亚马逊</b>AWS的Trainium2 AI架构

    深度解读亚马逊AI芯片核心技术

    Trainium1 芯片于 2020 年 12 月发布,并以两个不同的实例(Trn1 和 Trn1n)发货。我们当时对 Trainium
    发表于 12-06 10:04 770次阅读
    深度解读<b class='flag-5'>亚马逊</b>AI<b class='flag-5'>芯片</b>核心技术