0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

变革性技术机器学习把硅战争带到云端

454398 来源:开源云中文社区 作者:开源云中文社区 2020-12-30 11:56 次阅读

AWS全球基础设施和客户支持高级副总裁Peter DeSantis在AWS Re:Invent年度用户活动上发表主旨演讲时表示,与CPU巨头AMDIntel提供的处理器相比AWS的处理器和芯片设计在云应用程序性能方面具有优越性,而且AWS的图形处理器性能超过了Nvidia为机器学习(ML)提供的GPU。他指的是AWS Graviton2处理器,由AWS使用64位Arm Neoverse定制。

随着AWS上以及Azure和Google Cloud Platform(GCP)上可用选择的爆炸式增长,客户可能会越来越仔细地考虑应用程序性能和服务提供的成本/性能比。这样,底层芯片和服务器基础设施将成为决定云原生应用程序性能、功耗以及成本的关键因素。

因此,AWS希望旗舰64位基于ARM的Gravion2和其他内部设计的处理器的强大功能发挥重要作用,以帮助客户提高其应用程序的性能。

DeSantis说:“对AWS硅技术的深度投资真正令人兴奋和带来变革的是能够跨定制硬件和软件工作,以提供独特的功能。通过在整个堆栈中工作,我们能够比以往任何时候更快地实现这些改进。”

发力芯片

Graviton2有望通过多种方式进一步提高应用程序性能。DeSantis作出了大胆的声明,AWS Graviton2提供了优于传统设计的性能、节能优势和安全性。AWS还公开表示,为Amazon EC2 T4g、M6g、C6g和R6g实例以及基于本地NVMe的SSD存储的“变体”提供动力的Graviton2“为各种工作负载”提供了比基于x86的实例高出40%的性价比

DeSantis说,在基于Graviton的Amazon EC2 A1实例中引入Graviton的目的是让AWS“与客户和ISV合作伙伴合作,了解他们在现代64位ARM处理器上运行工作负载需要什么”。

DeSantis解释说,如今用户需要的是将处理器设计与在云环境中运行的高度分布式微服务应用程序相匹配的能力。今天的开发者也基本上不再用C++编写云原生应用程序,而是用GO和Ruat,并且“完全改变了高性能多线程应用程序的开发”。

“对我来说,最令人兴奋的趋势之一是转向基于服务的架构,从大型单体应用程序向小型专门构建的独立应用程序发展。这正是容器和Lambda支持的计算类型。虽然横向扩展计算已经发展到利用更高核心处理器,但处理器设计师从未真正抛弃旧世界。他们试图做到这两个方面,既满足传统应用程序的需要,又满足现代扩展应用程序的需要。”

DeSantis在重申Graviton2的设计者“专注于确保每个核心都能为现代云工作负载提供最真实的性能”的同时,还暗指传统的CPU性能基准(如用于衡量PC和服务器性能的基准)不再适用。“我们利用运行实际横向扩展应用程序的经验,确定需要在哪些方面添加功能以确保最佳性能。”

DeSantis还表示,Graviton2的设计旨在节省每个芯片的硅表面,同时通过减少内核数量来降低功耗——这是衡量处理器性能的传统方法。

“我们设计Graviton的目的是有尽可能多的独立核心,而尽管独立,Graviton两个核心的设计是一致的。”

Snap的工程高级副总裁Jerry Hunter表示,Snap使用Graviron2有助于降低AWS DynamoDB和S3的成本和能耗。除了用AWS的DynamoDB和S3进行存储外,他还看到了Graviton2“在不消耗大量能源的情况下为客户降低成本并创造更好的性能”。

Hunter说,Snap向Graviton2的转变“非常简单”,API“与以前使用的非常相似”,因此“不需要花太多时间来迁移代码以进行测试。我们节省了20%的成本,这是非常棒的,因为我们能够切换此负载,并立即获得成本节约和更高的性能。”

芯片上的机器学习

虽然没有透露具体的基准测试,DeSantis还表示AWS优于Nvidia。总的来说,与用于支持ML的大规模推理基础设施的GPU相比,AWS Inferentia提供了“以一半的成本实现了最高的吞吐量(每次推理)”。具体到Nvidia,DeSantis说Amazon Alexa最近将其推理工作负载从基于Nvidia GPU的硬件转移到了基于Inferentia的EC2实例,成本降低了30%,延迟降低了25%。

对于ML开发人员,AWS的Neuron团队提供了TensorFlow、PyTorch和Apache MXNet等框架来设计运行在Inferntia上的应用程序。DeSantis说:“开发人员可以利用Inferntia的成本节约和性能,而不需要对ML代码进行很多更改或根本不做任何更改,并保持对其他ML处理器的支持。”

在没有透露具体细节的情况下,DeSantis说,AWS为ML设计的下一款硅芯片将包括明年推出的AWS Trainium。

“我们在机器学习芯片上的投资才刚刚开始。正如Inferentia所做的那样,Trainium将提供最低成本和最高性能的方式来运行训练工作负载。”

对于ML开发团队,AWS还通过机器学习扩展运维,并将AWS的数据库服务(包括S3和Dynamo)与AWS SageMaker及其ML基础设施集成在一起。有了正确的硅基础设施和开发工具,目的是提供一个机器学习平台可以满足DevOps团队的需求,因为他们可以在不改变基础设施和工具集的情况下,从10或100个ML项目模型扩展到1000个。

“这是一种变革性的技术。我认为,开始机器学习并开始进行概念验证非常重要,而AWS提供的工具使其变得更加容易,”AWS ML的副总裁Bratin Saha表示。“所以,我认为让客户明白机器学习是现在的关键,而不是未来,这一点非常重要。”
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10733

    浏览量

    209889
  • NVIDIA
    +关注

    关注

    14

    文章

    4796

    浏览量

    102506
  • 机器学习
    +关注

    关注

    66

    文章

    8308

    浏览量

    131986
  • AWS
    AWS
    +关注

    关注

    0

    文章

    419

    浏览量

    24204
收藏 人收藏

    评论

    相关推荐

    探索机器人快换盘技术的未来之路:智能化与协作的革新

    机器人快换盘技术正经历变革,AI、机器学习、传感器、机器视觉及协作
    的头像 发表于 09-26 11:26 122次阅读

    AI引擎机器学习阵列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在凭借 AI 引擎机器学习 ( ML ) 架构来提供突破的 AI 推断加速。这些器件的设计应用范围广泛,包括用于
    的头像 发表于 09-18 09:16 202次阅读
    AI引擎<b class='flag-5'>机器</b><b class='flag-5'>学习</b>阵列指南

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器
    发表于 08-12 11:21

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命的变化。然而,尽管
    的头像 发表于 07-01 11:40 736次阅读

    名单公布!【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来?

    设备的运行状况,生成各种维度的报告。 同时,通过大数据分析和机器学习技术,可以对业务进行预测和预警,从而协助社会和企业进行科学决策、降低成本并创造新的价值。 当今时代,数据无处不在,而时间序列数据更是
    发表于 06-25 15:00

    深入探讨机器学习的可视化技术

    机器学习可视化(简称ML可视化)一般是指通过图形或交互方式表示机器学习模型、数据及其关系的过程。目标是使理解模型的复杂算法和数据模式更容易,使技术
    发表于 04-25 11:17 318次阅读
    深入探讨<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的可视化<b class='flag-5'>技术</b>

    通孔技术可靠技术概述

    Via, TSV )成为了半导体封装核心技术之一,解决芯片垂直方向上的电气和物理互连,减小器件集成尺寸,实现封装小型化。本文介绍了通孔技术的可靠,包括热应力可靠
    的头像 发表于 04-12 08:47 127次阅读

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。
    的头像 发表于 03-23 08:26 491次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>8大调参技巧

    工业智能机器人以其卓越的技术和创新能力,正引领着行业的升级与变革

    技术先锋”富唯智能机器人:推动移动机器人行业升级与变革 在快速发展的移动机器人领域中,富唯智能机器
    的头像 发表于 03-04 11:47 468次阅读
    工业智能<b class='flag-5'>机器</b>人以其卓越的<b class='flag-5'>技术</b>和创新能力,正引领着行业的升级与<b class='flag-5'>变革</b>

    基础模型能为机器人带来怎样的可能

    机器人是一种拥有无尽可能技术,尤其是当搭配了智能技术时。近段时间创造了许多变革应用的大模型
    发表于 01-26 14:47 172次阅读
    基础模型能为<b class='flag-5'>机器</b>人带来怎样的可能<b class='flag-5'>性</b>?

    什么是机器学习?它的重要体现在哪

    任务的解决方法。机器学习的重要体现在几个方面数据处理能力:在当今数字化时代,我们产生了大量的数据。机器学习能够处理和分析这些庞大的数据集,
    的头像 发表于 01-05 08:27 1173次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?它的重要<b class='flag-5'>性</b>体现在哪

    焊缝跟踪未来:人工智能与机器学习的影响

    随着科技的不断进步,焊接行业也在迎来一场革命变革。焊缝跟踪技术,作为焊接领域的关键创新之一,正在经历着人工智能和机器学习的引领下迎来更加
    的头像 发表于 12-12 11:51 389次阅读

    TDK机器学习解决方案促进边缘人工智能前景大幅扩展

    物联网技术的进步为大量设备带来了互联网连接能力。此外,边缘计算的发展如今还为边缘设备提供机器学习*1,将人工智能的版图从云端扩展到外围。本文将深入介绍一款突破
    的头像 发表于 10-27 12:18 314次阅读
    TDK<b class='flag-5'>机器</b><b class='flag-5'>学习</b>解决方案促进边缘人工智能前景大幅扩展

    机器学习技术在智能制造应用实例

    智能制造应用在工业领域中,可实现自动化作业,在企业生产与产线管理和设备控制方面有良好的效果。智能制造以机器学习技术作为支撑。
    发表于 10-27 09:29 744次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>技术</b>在智能制造应用实例

    如何看待元宇宙关键技术战争的影响

    本文分析导致战争复杂的部分原因,介绍元宇宙的关键技术,给出元宇宙在军事领域的应用模式及对复杂战争的影响,剖析元宇宙技术对理解复杂
    发表于 10-17 10:27 412次阅读