0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

边缘AI推理应用设计的发展

星星科技指导员 来源:嵌入式计算设计 作者:Geoff Tate 2022-07-10 10:03 次阅读

在过去的三四年里,人工智能推理市场发生了巨大变化。以前,甚至不存在边缘人工智能,大多数推理能力都发生在数据中心、超级计算机或政府应用程序中,这些应用程序通常也是大型计算项目。在所有这些情况下,性能都是至关重要的,并且始终是重中之重。快进到今天,边缘人工智能市场与此截然不同,尤其是当它进入更多商业应用时。对于这些用例,主要关注点更多的是低成本、功耗和小尺寸;而更少关于原始性能。

通过硬件-软件协同设计平衡更好的性能

在查看推理芯片时,很明显一种芯片与另一种不同。设计师总是在他们的设计中做出选择,而好的选择会考虑他们的最终应用以及他们在这些应用中的限制。例如,当 Flex Logix 设计其第一个推理芯片时,它最初的大小是现在的 4 倍。我们很快意识到,芯片需要更小才能在成本更低、功耗更低、外形尺寸更小的边缘 AI 市场中占据一席之地。

有趣的是,大多数人最初认为大多数推理总是在数据中心完成。这种观点最终发生了变化,因为行业意识到它有太多的数据需要移动,因此,这些数据开始向边缘移动。随着 5G 开始出现,更清楚的是,不可能始终将原始数据发送到云端进行处理。显然,边缘必须有一定的智能才能解决 99.9% 的场景,而数据中心实际上只需要用于极端情况。一个完美的例子是安全摄像头。边缘 AI 需要能够确定是否发生了任何可疑活动以及周围是否有人。然后,如果发现任何有趣的东西,这些部分可以发送到数据中心进行进一步处理。然而,发送到数据中心的数据实际上只是整体推理的一小部分。边缘推理 AI 通常意味着要满足很多约束,有时如果你想运行非常大的复杂模型,你实际上只需要在很小一部分数据上运行这些模型。

早期边缘 AI 推理设计的另一个误解是,一刀切的方法就足够了。这也被证明是错误的,因为出现了展示其优势和力量的专用芯片。关键是围绕算法构建芯片,因为如果它真的能在算法上磨练,你可以获得更好的性能。正确的平衡实际上是像专用硬件一样获得最有效的计算,但在编译时具有可编程性。

可编程性是关键

该行业确实处于人工智能发展的风口浪尖。在接下来的几十年里,我们将在这个领域看到的创新将是惊人的。就像任何长寿的市场一样,您可以期待变化。这就是为什么不为某些客户模型设计超级专业的芯片变得至关重要的原因。如果我们今天这样做,那么当芯片在两年后到达客户手中时,模型可能会发生重大变化——客户的要求也会发生变化。这就是我们不断听到有关公司最终获得他们的人工智能推理芯片的故事的主要原因——然后发现它们的表现并没有像他们需要的那样。如果将可编程性内置到芯片架构中,则可以轻松解决该问题。

如今,在任何边缘 AI 处理器中,AI 的灵活性和可编程性都至关重要。客户的算法会定期发生变化,系统设计也会发生变化。随着 Edge AI 功能在主流中的推广,越来越清楚的是,芯片设计人员需要能够适应和改变客户模型,而不是根据他们“认为”的模型来选择它。我们一次又一次地看到这一点,这就是编译器如此重要的原因。编译器中有很多对最终用户隐藏的技术,这些技术是围绕分配资源以确保一切都以最少的功率高效完成的。

另一个被密切关注的关键特性是吞吐量。现在正在构建好的推理芯片,以便它们可以非常快速地通过它们移动数据,这意味着它们必须非常快速地处理这些数据,并且非常快速地将其移入和移出内存。通常,芯片供应商会抛出各种各样的性能数据,例如 TOPS 或 ResNet-50,但研究这些数据的系统/芯片设计人员很快就会意识到这些数据通常毫无意义。真正重要的是推理引擎可以为模型、图像大小、批量大小和过程以及 PVT(过程/电压/温度)条件提供多少吞吐量。这是衡量其性能表现的第一个衡量标准,但令人惊讶的是,很少有供应商提供它。

边缘人工智能向前发展

今天的许多客户都渴望吞吐量,并正在寻找能够以与他们现在使用的相同功率/价格为他们提供更高吞吐量和更大图像尺寸的解决方案。当他们得到它时,他们的解决方案将比竞争解决方案更准确和可靠,然后他们的市场采用和扩展将加速。因此,尽管今天的应用程序有数千或数万个单位,但我们预计随着推理的可用性,这种情况会迅速增长,从而提供越来越多的吞吐量/美元和吞吐量/瓦特。

边缘人工智能市场正在迅速增长,芯片供应商也在这个市场上争夺一席之地。事实上,到 2020 年代中期,人工智能销售额迅速增长至数百亿美元,其中大部分增长来自边缘人工智能推理。没有人可以预测未来的模型,这就是为什么在设计时考虑到灵活性和可编程性更为重要

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19096

    浏览量

    228794
  • 芯片
    +关注

    关注

    452

    文章

    50196

    浏览量

    420716
  • AI
    AI
    +关注

    关注

    87

    文章

    29780

    浏览量

    268072
收藏 人收藏

    评论

    相关推荐

    边缘计算的未来发展趋势

    边缘计算的未来发展趋势呈现出多元化和高速增长的态势,以下是对其未来发展趋势的分析: 一、技术融合与创新 与5G、AI技术的深度融合 随着5G技术的普及,其大带宽、低延迟的特性为
    的头像 发表于 10-24 14:21 395次阅读

    AMD分析嵌入式边缘AI发展

    随着人工智能( AI )技术广泛应用于各行各业,从云到边缘的解决方案逐渐成为信息技术领域新的热点。嵌入式边缘 AI 在当今的各种边缘应用中能
    的头像 发表于 09-18 09:30 241次阅读
    AMD分析嵌入式<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>的<b class='flag-5'>发展</b>

    什么是边缘AI边缘AI的供电挑战

    RECOM 的 RACM1200-V 采用数字通信,可轻松集成到边缘 AI设计中。
    的头像 发表于 09-02 11:52 367次阅读
    什么是<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>?<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>的供电挑战

    Imagination 引领边缘计算和AI创新,拥抱AI未来发展

    6月25日,2024“N+”AI互动创新论坛在南京举办,Imagination中国资深副总裁张晓波受邀出席。在主题演讲中,张晓波表示,Imagination作为图形、计算和边缘人工智能领域的领导者
    的头像 发表于 06-28 08:28 490次阅读
    Imagination 引领<b class='flag-5'>边缘</b>计算和<b class='flag-5'>AI</b>创新,拥抱<b class='flag-5'>AI</b>未来<b class='flag-5'>发展</b>

    MediaTek与NVIDIA TAO加速物联网边缘AI应用发展

    在即将到来的COMPUTEX 2024科技盛会上,全球知名的芯片制造商MediaTek宣布了一项重要合作——将NVIDIA的TAO(TensorRT Accelerated Optimizer)与其NeuroPilot SDK(软件开发工具包)集成,共同推动边缘AI
    的头像 发表于 06-12 14:49 429次阅读

    如何基于OrangePi AIpro开发AI推理应

    。通过昇腾CANN软件栈的AI编程接口,可满足大多数AI算法原型验证、推理应用开发的需求。AscendCL(AscendComputingLanguage,昇腾计算
    的头像 发表于 06-04 14:23 436次阅读
    如何基于OrangePi AIpro开发<b class='flag-5'>AI</b><b class='flag-5'>推理应</b>用

    ai边缘盒子有哪些用途?ai视频分析边缘计算盒子详解

    近年来,随着人工智能和边缘计算的发展,一种名为AI边缘盒子的新型设备正逐渐引起广泛关注。作为一种集成了边缘计算和
    的头像 发表于 05-29 14:24 820次阅读
    <b class='flag-5'>ai</b><b class='flag-5'>边缘</b>盒子有哪些用途?<b class='flag-5'>ai</b>视频分析<b class='flag-5'>边缘</b>计算盒子详解

    边缘AI芯片提供商超星未来完成数亿元 Pre-B轮融资

    AI产业生态中,计算芯片被视为行业的“卖水人”。依据云端/边缘端、训练/推理两大分类标准,AI芯片可划分为四个类别,其中边缘
    的头像 发表于 05-09 09:38 500次阅读

    ONNX Runtime支持龙架构,AI推理生态再添新翼

    近日,备受瞩目的AI推理框架开源社区ONNX Runtime宣布推出支持龙架构的新版本1.17.0,这一里程碑式的更新意味着龙芯平台上的AI推理应用开发与部署将更加便捷。
    的头像 发表于 03-27 10:58 640次阅读

    基于EdgeX+OpenVINO™的边缘智能融合网关YiFUSION实战

    边缘智能需求的大部分客户已经对AI推理边缘计算有一定的了解,都希望可以将边缘数采和AI
    的头像 发表于 02-29 18:18 1140次阅读
    基于EdgeX+OpenVINO™的<b class='flag-5'>边缘</b>智能融合网关YiFUSION实战

    什么是AI边缘计算,AI边缘计算的特点和优势介绍

    随着人工智能的迅猛发展AI边缘计算成为了热门话题。那么什么是AI边缘计算呢?简单来说,它是将人工智能技术引入
    的头像 发表于 02-01 11:42 793次阅读

    边缘AI它到底是什么?能做什么?

    边缘,减少了数据的传输延迟和依赖云端的通信需求。边缘AI能够在接近数据源的设备上进行实时决策和推理,这为许多应用领域带来了革命性的改变。 边缘
    的头像 发表于 01-11 14:44 1203次阅读

    AI算法在RZ/V芯片中的移植推理流程

    之前文章已介绍了一些AI算法Demo的应用 ,我们提供从模型训练到RZ/V系列嵌入式端推理应用的完整流程。整体流程如下图所示。
    的头像 发表于 12-20 12:21 992次阅读
    <b class='flag-5'>AI</b>算法在RZ/V芯片中的移植<b class='flag-5'>推理</b>流程

    HarmonyOS:使用MindSpore Lite引擎进行模型推理

    场景介绍 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件设备 AI 模型推理的功能,目前已经在图像分类、目标识别、人脸识别、文字识别等应用中广泛使用。 本文介绍
    发表于 12-14 11:41

    算力强劲的AI边缘计算盒子# 边缘计算

    AI边缘计算
    成都华江信息
    发布于 :2023年11月24日 16:31:06