0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安霸发布N1系列生成式AI芯片支持前端设备运行本地LLM应用

Ambarella安霸半导体 来源:Ambarella安霸半导体 2024-01-09 15:19 次阅读

单颗 SoC 支持 1 至 340 亿参数的多模态大模型(Multi-Modal LLM)推理,实现前端低功耗生成式 AI

美国加利福尼亚州圣克拉拉市,2024年1月8日-

Ambarella (下称“安霸”,专注 AI 视觉感知的半导体公司,纳斯达克股票代码:AMBA)于当天宣布,在 2024 国际消费电子展(CES)期间,展出在其新款 N1 系列 SoC 上运行多模态大模型(Multi-Modal LLM),其每次推理的功耗显著低于当前市场的通用 GPU 解决方案。

生成式 AI 是为了处理大规模数据集而最早应用于服务器上的变革性技术,而安霸的目标是将生成式 AI 部署于终端设备和本地硬件上,从而将其广泛应用于视频安防分析、机器人以及众多工业领域。

安霸将在中高端 SoC 上提供已优化的生成式 AI 处理。这些 AI SoC 包含了功耗低于 5 瓦的 CV72 芯片,以及最新的可应用于服务器端,功耗低于 50 瓦的 N1 芯片。与 GPU 及其他 AI 加速器相比,安霸提供了完整的 SoC 解决方案,每生成一个 token 的能效比最高可提高 3 倍,并可快捷、低成本地部署在终端产品中。

生成式 AI 在我们的目标市场上实现了突破,之前无法想象的功能得以实现。使用我们的 N1 系列 SoC 来进行多模态大模型推理,将使所有的前端设备变得更智能,更低功耗,和更低成本。

市场研究公司 Omdia 高级计算首席分析师 Alexander Harrowell 表示:“在未来 18 个月内,几乎所有设备前端应用都将被生成式 AI 增强。把生成式 AI 的计算转移到设备前端的要点,就在于每瓦的 AI 性能,以及它与前端生态系统其余部分的集成,而不仅仅是原始数据的吞吐量。”

所有安霸的 AI SoC 均可搭配全新的 Cooper 开发平台。此外,为了缩短客户新产品上市的时间,安霸已预先移植和优化了 LIama-2 等流行的大语言模型。其在 N1 芯片上运行的大语言和视觉助手 LLava 模型,可对多达 32 个摄像头同时进行多模态视觉分析。这些经过预训练和调优的模型可从 Cooper Model Garden 下载

在现实世界的众多应用里,除了语言,视觉输入也是一种关键模式。安霸 SoC 的特有架构非常适合以超低功耗同时运行视频处理和 AI 计算。安霸的 AI SoC 并不是单一的 AI 加速器,它不仅能够高效处理多模态大模型,还能同时执行各种系统功能。

生成式 AI 将成为计算机视觉处理中跨越式的新技术,它可将上下文学习和场景理解应用于各种设备,从而涵盖安防设施、自主机器人以及众多工业应用。基于安霸 AI 芯片的设备端通过运行大语言模型和多模态处理可实现以下功能:安防视频的上下文智能搜索、通过自然语言命令控制的机器人、以及多才多艺的AI助手,比如代码、文本和图像的生成等。

这些依赖摄像头和自然语言理解的系统,大部分将受益于设备前端的生成式 AI 处理,其处理速度得以提高,隐私保护得到加强,并且总成本也会降低。安霸解决方案支持的本地处理也非常适合垂直领域大语言模型,这些大语言模型通常需要针对每个具体应用场景进行调整;而传统的集中式服务器方案则是使用更大、功耗更高的大语言模型来满足不同用例的要求。

基于安霸最初为自动驾驶开发的 CV3-HD 架构,N1 系列 SoC 对总算力资源进行了针对性的优化,从而以超极低功耗运行多模态大模型。例如,N1 SoC 在单流模式下以低于 50 瓦的功耗运行 Llama2-13B,每秒可推理 25 个 token。N1 解决方案自带移植好的大模型,使系统整合更容易,因此它可快速帮助 OEM 厂商部署生成式 AI,特别是要求低功耗的各种应用,比如自带本地应用的 AI 智能盒子、送货机器人等,不一而足。







审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    770

    浏览量

    36781
  • soc
    soc
    +关注

    关注

    38

    文章

    3818

    浏览量

    216311
  • 计算机视觉
    +关注

    关注

    8

    文章

    1614

    浏览量

    45717
  • AI芯片
    +关注

    关注

    17

    文章

    1751

    浏览量

    34531
  • LLM
    LLM
    +关注

    关注

    0

    文章

    223

    浏览量

    252

原文标题:安霸发布 N1 系列生成式 AI 芯片,支持前端设备运行本地 LLM 应用

文章出处:【微信号:AMBARELLA_AMBA,微信公众号:Ambarella安霸半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:1LLM部署

    。环境变量的配置,未来在具体项目中我们会再次提到。 下面我们正式开始项目。项目从输入到输出分别涉及了语音识别,图像识别,LLM,TTS这几个与AI相关的模块。先从最核心的LLM开始。 由于LLAMA3
    发表于 06-25 15:02

    AI初创公司Alembic攻克LLM虚假信息难题

    近日,AI领域的创新者Alembic公司宣布了一项重大突破:其全新AI系统成功解决了LLM(大型语言模型)中的虚假信息生成问题。这一成就标志着长久以来困扰
    的头像 发表于 06-18 14:26 277次阅读

    Arm平台赋能移动端生成AI

    生成式人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘侧的移动设备
    的头像 发表于 04-26 11:09 580次阅读

    安霸发布全新N1系列生成AI芯片

    安霸在CES 2024上发布了全新的N1系列生成AI芯片,这是一款专门为
    的头像 发表于 01-09 15:32 878次阅读

    Ambarella展示了在其CV3-AD芯片运行LLM的能力

    Ambarella前不久展示了在其CV3-AD芯片运行LLM的能力。这款芯片是CV3系列中最强大的,专为自动驾驶设计。
    的头像 发表于 11-28 09:05 1446次阅读
    Ambarella展示了在其CV3-AD<b class='flag-5'>芯片</b>上<b class='flag-5'>运行</b><b class='flag-5'>LLM</b>的能力

    MediaTek 发布天玑 8300 移动芯片,全面革新推动端侧生成AI 创新

    MediaTek 发布天玑 8300 5G 生成AI 移动芯片,将天玑的旗舰级体验引入天玑 8000 系列,赋能高端智能手机
    的头像 发表于 11-21 20:30 303次阅读
    MediaTek <b class='flag-5'>发布</b>天玑 8300 移动<b class='flag-5'>芯片</b>,全面革新推动端侧<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 创新

    利用 NVIDIA Jetson 实现生成AI

    近日,NVIDIA 发布了 Jetson 生成AI 实验室(Jetson Generative AI Lab),使开发者能够通过 NVIDIA Jetson 边缘
    的头像 发表于 11-07 21:25 601次阅读
    利用 NVIDIA Jetson 实现<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    ARM Neoverse™N1核心技术参考手册

    Neoverse™N1内核是一款高性能、低功耗的ARM产品,采用ARM®V8-A架构。 Neoverse™N1核心支持: ·ARM®v8.2-A扩展。 ·RAS扩展。 ·统计概况分析扩展。 ·ARM
    发表于 08-29 08:05

    阿里平头哥发布首个 RISC-V AI 软硬全栈平台

    平台通过软硬件深度协同,较经典方案提升超 8 成性能,支持运行 170 余个主流 AI 模型,推动 RISC-V 进入高性能 AI 应用时代。 平头哥表示,他们通过更新自研一站
    发表于 08-26 14:14

    Stability AI发布首个用于编程的生成LLM AI产品—StableCode

    Stability AI 近日宣布了他们首个用于编程的生成LLM AI 产品 ——StableCode。该产品旨在帮助程序员完成日常工作,并为新手开发者提供实用的学习工具。
    的头像 发表于 08-24 11:27 704次阅读
    Stability <b class='flag-5'>AI</b><b class='flag-5'>发布</b>首个用于编程的<b class='flag-5'>生成</b>式<b class='flag-5'>LLM</b> <b class='flag-5'>AI</b>产品—StableCode

    ARM Neoverse™N1系统开发平台技术参考手册

    Neoverse N1处理器集群。 该系统通过以下方式在高速缓存一致性加速器互连(CCIX)协议的背景下演示ARM技术: ·在N1 SoC和加速卡之间运行一致的流量。 ·两个N1 S
    发表于 08-17 08:14

    启英泰伦新成果发布交流会线上直播预约开启

    将为大家带来主题为《用AI解锁声音的奥秘——启英泰伦新成果发布交流会》的线上直播。 01 发布CI231系列AI语音BLE
    发表于 08-15 14:31

    Arm Neoverse™ N1 PMU指南

    本文档提供了Neoverse N1 PMU事件的高级描述。 对体系结构行为和Neoverse N1微体系结构行为的引用阐明了这些事件描述。 有关ARM架构的更完整描述,请参阅ARM®架构参考手册
    发表于 08-12 07:10

    Arm Neoverse N1软件优化指南

    本文档提供了有关Neoverse N1管道、指令性能特征和特殊性能注意事项的高级信息。此信息旨在帮助优化Neoverse N1软件和编译器的人员。有关Neoverse N1处理器的更完整描述,请参阅Arm®Neoverse™
    发表于 08-11 06:56

    ARM Neoverse N1 Core性能分析方法

    Arm Neoverse生态系统正在大幅增长,许多Arm硬件和软件合作伙伴正在开发应用程序,并将其工作负载移植到基于Arm的云实例上。随着基于Neoverse N1的系统变得广泛可用,与传统系统相比
    发表于 08-09 06:01