0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TOPS 与现实世界的性能:AI 加速器的基准性能

juju宇哥 来源:juju宇哥 作者:juju宇哥 2022-07-14 17:17 次阅读

蓬勃发展的机器学习人工智能新兴用例有望通过加速信息处理和提高决策准确性为行业创造重大价值。但机器学习模型是计算密集型、需要高频和实时 AI 分析场景,这导致企业依赖于使用每秒万亿次操作 (TOPS) 指标的性能指导。TOPS 捕捉到“加速器在一秒钟内可以提供多少数学运算?” 比较和确定给定推理任务的最佳加速器。

虽然 TOPS 是一个“容易”计算的指标,但它通常无法为实际工作负载提供可靠的性能指标。受限于加速器中乘法器和加法器的数量,该指标无法考虑处理神经网络模型的计算硬件结构。随着数据网络模型更快地处理数据,企业如何通过更快、更可靠的决策进行扩展,尤其是在边缘?

在这篇文章中,我们将回顾 TOPS、它在测量延迟方面的挑战以及它与现实世界的性能计算有何不同,并提供一种通过基准测试来计算性能的替代方法,它提供了一种更可靠的方法来解释计算硬件结构。

TOPS 作为绩效衡量标准的现实

TOPS 是一个简化指标:它告诉您 AI 加速器在一秒钟内可以处理多少计算操作,并且利用率为 100%。本质上,它着眼于加速器可以在很短的时间内解决多少数学运算问题。

例如,如果一个 AI 加速器提供 5 TOPS,另一个提供 15 TOPS,则推断后者比前者快三倍。但是,就像 CPU 速度的兆赫兹和千兆赫兹一样,TOPS 也失去了确定整体计算机性能的相关性。随着人们对 AI 应用的兴趣日益浓厚,最新的 AI 加速器可以比简单的算术更快地处理数据,并且更复杂。

然而,TOPS 很少准确地捕捉到 AI 处理器在整个硬件设备中的重要性。如今,相机、边缘服务器和计算机中的 AI 处理器通常是决定计算能力和能源效率的关键组件之一。事实上,TOPS 未能考虑到现实世界的工作量。通常,由于诸如空闲计算机单元等待来自内存的数据、加速器不同部分之间的同步开销和控制开销等因素,实际性能可能会显着低于 TOPS 值。根据加速器的架构和工作负载特性,

更高的 TOPS 不等于更高的性能

虽然较高的 TOPS 值可以表示具有更多计算元素的更大 AI 加速器,但现实情况可能恰恰相反。更高的 TOPS 通常会导致更大的加速器具有更多的计算元素和内存块,以将数据馈送到这些计算单元,这会导致更高的成本和功耗。另一方面,高效的加速器使用较少数量的计算资源提供更高的性能,因此 TOPS 评级较低。最终,理想的 AI 加速器是使用低 TOPS 提供高性能的加速器。

TOPS 不包括所有计算类型

TOPS 指标考虑了加速器的乘法器和加法器,这通常会导致性能指标不准确,因为加速器可以拥有除此之外的其他计算资源。例如,Kinara 的架构采用归约树而不是加法器阵列,从而显着降低能耗。由于在此计算中未捕获归约树的计算能力,TOPS 指标将不够准确。ResNet50、MobileNet V1 和 YOLO_v3 等标准神经网络在比较不同的加速器时非常有用,因为它们也可以用作“猜测”给定加速器是否能够满足开发人员自身工作负载需求的代理。

推理延迟是评估 AI 加速器性能的指标

对于在 Edge AI 上进行投资的企业,通过基准测试计算性能提供了一种可靠的方法来计算计算硬件结构与 TOPS。由于大多数实际应用程序需要极快的推理时间,因此衡量性能的最佳方法是运行特定的工作负载,通常是 ResNet-50、EfficientDet、Transformer 或自定义模型,以了解加速器的效率。使用不同类型、大小、拓扑和输入分辨率的网络进行实时处理,可以得出推理延迟度量。该指标计算加速器完成一个特定 AI 模型的干扰的执行时间。

随着 AI 工作负载及其支持计算架构的发展,通过准确的性能测量确保其可预测性具有重大影响,可以引导开发人员做出更优化的决策。通过使用推理延迟计算,它有助于处理和预测现代 AI 工作负载中的数据流,即使这些工作负载碎片化并且新架构的发展导致更多的不可预测性。最终,基准测试应用程序提供了一种可信且更可靠的 TOPS 替代方案,而 AI 加速器支持更有效的评估。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    806

    浏览量

    38064
  • AI
    AI
    +关注

    关注

    87

    文章

    31493

    浏览量

    270201
收藏 人收藏

    评论

    相关推荐

    EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器

    电子发烧友网站提供《EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器.pdf》资料免费下载
    发表于 01-07 14:12 0次下载
    EE-436:使用ADSP-SC59x/2159x高<b class='flag-5'>性能</b>FIR/IIR<b class='flag-5'>加速器</b>

    从版本控制到全流程支持:揭秘Helix Core如何成为您的创意加速器

    加速器
    龙智DevSecOps
    发布于 :2024年11月26日 13:42:47

    IBM与AMD携手部署MI300X加速器,强化AI与HPC能力

    举措预计将于2025年上半年正式推出。 此次合作的核心目标是提升通用人工智能(AI)模型的性能与能效,并为企业客户提供高性能计算(HPC)应用的强大支持。AMD的Instinct MI300X
    的头像 发表于 11-21 11:07 299次阅读

    IBM将在云平台部署AMD加速器

    IBM与AMD近期宣布了一项重要合作协议,根据协议,IBM将在其云平台上部署AMD Instinct MI300X加速器。这一举措旨在提升企业客户在生成式AI模型方面的性能和能效,进一步推动A
    的头像 发表于 11-19 16:24 271次阅读

    树莓派新推AI HAT+:26 TOPS性能版本震撼登场

    供了两种性能配置供用户选择。其中,基础版配备了Hailo-8L加速器性能达到13 TOPS(每秒万亿次操作),售价为70美元;而更为强大的高端版本则采用了Hailo-8
    的头像 发表于 11-07 13:44 539次阅读

    最强服务CPU来了!AI性能直接翻倍

    以及AI服务AI数据中心场景的CPU产品。它不仅能支持广泛的第三方GPU及AI加速器,与它们组合形成强大的异构计算平台,还能在其中补足G
    的头像 发表于 09-29 11:00 765次阅读
    最强服务<b class='flag-5'>器</b>CPU来了!<b class='flag-5'>AI</b><b class='flag-5'>性能</b>直接翻倍

    SiFive发布MX系列高性能AI加速器IP

    AI技术日新月异的今天,RISC-V IP设计领域的领军企业SiFive再次引领行业潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。这
    的头像 发表于 09-24 14:46 425次阅读

    TDA4 Edge AI处理性能和效率基准测试

    电子发烧友网站提供《TDA4 Edge AI处理性能和效率基准测试.pdf》资料免费下载
    发表于 09-11 09:21 0次下载
    TDA4 Edge <b class='flag-5'>AI</b>处理<b class='flag-5'>器</b>的<b class='flag-5'>性能</b>和效率<b class='flag-5'>基准</b>测试

    刷新AI PC NPU算力,AMD锐龙AI 9 HX 375领衔55 TOPS

    电子发烧友网报道(文/黄晶晶)最近AMD官网上线了锐龙AI 300系列中的最新成员锐龙AI 9 HX 375处理。原本Ryzen AI 9 HX 370的NPU达到了50
    的头像 发表于 08-07 00:28 3647次阅读
    刷新<b class='flag-5'>AI</b> PC NPU算力,AMD锐龙<b class='flag-5'>AI</b> 9 HX 375领衔55 <b class='flag-5'>TOPS</b>

    NPU和AI TOPS是什么?它们有哪些性能

    可运行AI模型的性能、准确性和效率。如今,TOPS(每秒万亿次运算)是衡量处理AI性能的主要方
    的头像 发表于 06-13 10:33 978次阅读

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    满足更高性能和更复杂的 AI 工作负载。Ethos-U NPU系列是业界首款 AI加速器,英飞凌、恩智浦半导体、奇景光电 (Himax)、Alif Semiconductor 和
    的头像 发表于 04-16 09:10 4716次阅读
    Arm推动生成式<b class='flag-5'>AI</b>落地边缘!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架构,<b class='flag-5'>性能</b>提升四倍

    Hitek Systems开发基于PCIe的高性能加速器以满足行业需求

    Hitek Systems 使用开放式 FPGA 堆栈 (OFS) 和 Agilex 7 FPGA,以开发基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在满足网络、计算和高容量存储应用的需求。
    的头像 发表于 03-22 14:02 704次阅读
    Hitek Systems开发基于PCIe的高<b class='flag-5'>性能</b><b class='flag-5'>加速器</b>以满足行业需求

    瑞萨发布下一代动态可重构人工智能处理加速器

    瑞萨最新发布的动态可重构人工智能处理(DRP-AI加速器,在业界引起了广泛关注。这款加速器拥有卓越的10 TOPS/W高功率效率,相比传
    的头像 发表于 03-08 13:45 826次阅读

    瑞萨电子宣布推出一款面向高性能机器人应用的新产品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速器无需冷却风扇即可提供高达80TOPSAI推理性能
    的头像 发表于 03-01 10:41 893次阅读
    瑞萨电子宣布推出一款面向高<b class='flag-5'>性能</b>机器人应用的新产品—RZ/V2H

    家居智能化,推动AI加速器的发展

    电子发烧友网报道(文/黄山明)AI加速芯片,也称为人工智能加速器AI Accelerator),是一种专为执行机器学习和深度学习任务而设计的ASIC或定制化处理
    的头像 发表于 02-23 00:18 4673次阅读