0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenFive与EdgeCortix合作打造软件定义的边缘AI加速器

lPCU_elecfans 来源:电子发烧友网 作者:电子发烧友网 2022-04-27 08:25 次阅读

电子发烧友网报道(文/周凯扬)边缘计算从始至终都是一个让业界苦思冥想的问题,与云端计算这种集中式结构不同,边缘计算的分布式结构杜绝了“齐心办大事”的可能性。而且并非将体积依然不可小视的计算服务器部署在边缘端,就能解决边缘计算的一切要求,尤其是在边缘AI需求持续高涨的当下。

根据IDC的统计,到了2025年全球互联设备将达到416亿台,与此同时边缘传感器收集的数据将达到79.4ZB。在这么庞大的量下,边缘AI提出的要求却是高性能、低功耗,挑战确实不亚于手机SoC的开发了。即便如此,雨后春笋一般冒头的AI芯片公司还是在挑战“卷”的限度。

软件定义的边缘AI加速器

平时留意RISC-V动向的小伙伴们应该有所耳闻,3月中旬IP厂商Alphawave花了2亿美元收购SiFive旗下OpenFive。然而同样在3月,在收购之前,专注于高速连接SoC IP的OpenFive宣布了与AI初创公司EdgeCortix的合作,共同打造下一代的边缘AI加速器。

在软件定义的AI加速中,灵活度最高的还得属通用CPU,但一谈到能耗,就有些相形见绌了,与较为专一的GPU相比,从性能和能效上都有一定差距。然而GPU虽说能效高于GPU,但放在边缘端动辄几百瓦的功耗又太夸张了,因此特定领域的AI加速器虽然牺牲了一定的灵活性,但做到了最高的能效比,也因此被边缘AI所看重。

在这一理念下,EdgeCortix推出了动态神经加速器(DNA),一个运行时可重构的特定领域加速器设计,用于低功耗的实时AI推理应用,既可以部署在FPGA上,也可以部署在自研设计的ASIC芯片上。

SAKURA,正是基于该设计打造的一款高能效的边缘AI协处理器。与部分AI芯片不一样,SAKURA并没有选择5nm之类的先进工艺,而是选择了12nm的成熟工艺。在800MHz的频率下,SAKURA可以达到40TOPS的算力,在多芯片组合下更是可以达到200TOPS,搭载该芯片的PCIe板卡典型功耗只有10W到15W。

只谈性能不谈规模是毫无意义的,AI芯片厂商最喜欢拿来对比还是英伟达的各大GPU,这不,EdgeCortix也选择了同用台积电12nm工艺的英伟达AGX Xavier GPU来进行对比,可以看出AGX Xavier的面积近乎是SAKURA的四倍,在算力上依然比后者低上25%,两者能耗相差不大,但PPA上明显是SAKURA更胜一筹。

不过这也不是实际场景的比较,我们还是拿深度学习模型的测试结果来看,由于软件定义的特性,无论是在单芯多核和多芯的扩展下,SAKURA的异构计算单元都可以得到有效的利用。EdgeCortix给出了在YOLOv3这一实时物体检测算法中的比较,在同规模的数据下SAKURA的推理耗时最高可以做到AGX Xavier的16分之一。

这倒不是说SAKURA就一定是边缘AI的最优解,在给出的诸多对比中,大部分是Batch Size只有1下的测试结果,这是因为SAKURA对低Batch Size和INT8做过优化。更何况SAKURA对标的还是英伟达AGX Xavier、AGX Orin和高通Cloud AI 100这一档的边缘AI芯片。

模拟与AI

不久前,笔者曾介绍了AI初创公司Aspinity的AML100边缘AI芯片,主打处理传感器输出的模拟数据,来实现降低功耗的作用。近日,Aspinity透露了更多这款芯片的细节,并更新了一些数据。传统的数据Always On方案无论是在智能手机智能手表还是智能家居产品中都已经普及,而且主打的就是低功耗,甚至低至数十uW。那么这种模拟AI芯片的优势又在哪呢?

传统的超低功耗芯片在提及功耗时,其实还是自身的功耗乃至待机时的功耗,而从传感器和ADC再到芯片的功耗,以及整个系统的功耗还是没那么容易忽略的。比如传统的Always On数字处理器架构系统在检测语音事件时,总功耗大概在3700uW左右,数字处理器的功耗还是占大头。

而在AML100组成的Always On系统中,传感器的功耗不变,而AML100可以做到40uW以下的功耗,这时由于AML100从模拟端接手了预处理和机器学习的任务,ADC和数字处理器端的功耗无限约接近0uW,因此总功耗要小于140uW,将整个系统的功耗降低了95%以上。

AML100终究还是一个用于事件唤醒的边缘AI芯片,面向破窗安全监测、语音唤醒之类的Always On应用,那么针对通用的边缘AI应用,它能否派上用场呢?

其实作用也是有的,AML100的定位本质上就是一个模拟层面上的预处理,可以有效减小数据集的大小,这样交给MCU或云端的数据会减少至多百倍,对于大部分边缘应用来说,处理数据的减少也近似等效于延长电池寿命了。

原文标题:边缘AI芯片正在数倍百倍地卷

文章出处:【微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    792

    浏览量

    37727
  • 边缘计算
    +关注

    关注

    22

    文章

    3056

    浏览量

    48561
  • 边缘AI
    +关注

    关注

    0

    文章

    89

    浏览量

    4941

原文标题:边缘AI芯片正在数倍百倍地卷

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    SiFive发布MX系列高性能AI加速器IP

    AI技术日新月异的今天,RISC-V IP设计领域的领军企业SiFive再次引领行业潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。这一创新产品专为
    的头像 发表于 09-24 14:46 295次阅读

    NVIDIA IGX平台加速实时边缘AI应用

    实时边缘 AI 对于医疗、工业和科学计算至关重要,因为这些任务关键型应用需要即时数据处理、低延迟和高可靠性,以确保作出及时准确的决策。这些挑战不仅涉及硬件平台上的高带宽传感处理和 AI
    的头像 发表于 09-09 10:14 472次阅读
    NVIDIA IGX平台<b class='flag-5'>加速</b>实时<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>应用

    西门子推出Catapult AI NN:重塑神经网络加速器设计的未来

    的需求,西门子数字化工业软件日前推出了一款名为Catapult AI NN的创新软件,旨在帮助神经网络加速器在专用集成电路(ASIC)和芯片级系统(SoC)上实现更高效的高层次综合(H
    的头像 发表于 06-19 16:40 653次阅读

    西门子推出Catapult AI NN软件,赋能神经网络加速器设计

    西门子数字化工业软件近日发布了Catapult AI NN软件,这款软件在神经网络加速器设计领域迈出了重要一步。Catapult
    的头像 发表于 06-19 11:27 806次阅读

    美国限制向中东AI加速器出口,审查国家安全

    AI加速器能协助数据中心处理大量人工智能聊天机器人和其他工具的开发信息。如今,它们已然成为构建AI基础设施的企业和政府的必需品。
    的头像 发表于 05-31 09:20 522次阅读

    Arm发布新一代Ethos-U AI加速器 Arm旨在瞄准国产CPU市场

    Arm发布的新一代Ethos-U AI加速器确实在业界引起了广泛关注。
    的头像 发表于 04-18 15:59 711次阅读

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构,性能提升四倍

    电子发烧友网报道(文/黄晶晶)在嵌入式领域,边缘与端侧AI推理需求不断增长,Arm既有Helium 技术使 CPU 能够执行更多计算密集型的 AI 推理算法,也有Ethos 系列 AI
    的头像 发表于 04-16 09:10 4505次阅读
    Arm推动生成式<b class='flag-5'>AI</b>落地<b class='flag-5'>边缘</b>!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架构,性能提升四倍

    Hailo获1.2亿美元新融资,首发AI加速器Hailo-10,助力边缘设备实现生成式人工智能

    摘要:随着Hailo推出最新的人工智能加速器,其融资总额现已突破3.4亿美元。这款专为个人计算机和汽车行业打造的人工智能加速器,以出色的低功耗性能处理大型语言模型(LLM),成功将生成式人工智能技术
    的头像 发表于 04-03 11:57 301次阅读

    Tenstorrent将为日本LSTC新型边缘2纳米AI加速器开发芯片

    加拿大AI芯片领域的初创公司Tenstorrent与日本尖端半导体技术中心(LSTC)达成了一项多层次合作协议。根据协议内容,LSTC将采用Tenstorrent的世界级RISC-V架构和芯片IP来开发其新型边缘2纳米人工智能
    的头像 发表于 02-28 10:49 619次阅读

    家居智能化,推动AI加速器的发展

    电子发烧友网报道(文/黄山明)AI加速芯片,也称为人工智能加速器AI Accelerator),是一种专为执行机器学习和深度学习任务而设计的ASIC或定制化处理
    的头像 发表于 02-23 00:18 4527次阅读

    回旋加速器原理 回旋加速器的影响因素

    回旋加速器(Cyclotron)是一种用于加速带电粒子的可再生粒子加速器。它的工作原理基于带电粒子在恒定强磁场中的运动。本文将详细介绍回旋加速器的原理以及影响因素。 一、回旋
    的头像 发表于 01-30 10:02 3511次阅读

    恩智浦与MicroEJ共同开发新平台加速器

    恩智浦与MicroEJ共同开发的新平台加速器,利用具有标准API的软件容器,为工业和物联网边缘应用带来与智能手机类似的软件设计灵活性,帮助客户大幅降低开发成本,缩短产品上市时间。
    的头像 发表于 01-22 10:16 682次阅读

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一种重要的实验设备,用于研究粒子物理学、核物理学等领域。其主要原理是通过电场和磁场的作用,对带电粒子进行加速,在高速运动过程中使其获得较大的动
    的头像 发表于 12-18 13:52 1955次阅读

    在CCES环境下如何使用21489的IIR加速器

    在VDSP++的环境下程序已经实现,但是到了CCES下,把中断初始化函数修改了,还是无法正确配置中断,直接返回IIR的中断初始化失败,请问CCES下怎么使用IIR加速器
    发表于 11-30 08:20

    21489的IIR加速器滤波参数设置如何对应加速器的滤波参数?

    目前在用21489内部的IIR加速器去做一个低通滤波,在例程的基础上修改参数。通过平板的fda 工具工具去设计参数,但是设计出来的参数不知道如何对应加速器的滤波参数,手册里也看得不是很明白。 设计的参数如下: 请问
    发表于 11-30 08:11