Kinara发布Ara-2边缘AI处理器，实现高效、经济、节能的推理性能-电子发烧友网

Kinar于近期发布了Ara-2边缘AI 处理器，这是一款专为边缘服务器及笔记本电脑打造的高性能、高效能且节能推理解决方案，尤其适用于视频分析、大规模语言模型（LLM）在内的各类AI应用。值得注意的是，Ara-2也能够良好适应传统AI模型和基于Transformer架构的尖端AI模型，其所具备的体验式增强功能集使得Ara-2的性能较初代的Ara-1处理器有显著提升，可达成超过5至8倍的增长，将实时响应能力与大吞吐量相结合，从而达致高度精炼的延迟优化设计和均衡性能。

生成式AI现已成为主流，然而大多数此类应用却在数据中心的GPU上运行，由此引发的延迟、高成本以及隐私问题亟待解决。Ara-2顺应时代变化，贴心支持生成式AI模型所需引导的数十亿个参数，为跨境转移提供便利。同时，为了更顺畅地完成从GPU至各个AI模型的过度，其内建的计算引擎以及软件开发套件（SDK）均为此进行定制搭建。

“Ara-2的诞生使得我们有能力根据客户需求提供更高性能和成本选择。如Ara-1，其专为智能相机及具有2至8路视频流的边缘AI设备而生；而Ara-2则特别擅长处理针对16至32路甚至更多视频流的底层边缘服务器或笔记本电脑，且与高端相机完美兼容。” Kinara首席执行官Ravi Annavajjhala对此表示。“借助先进的计算引擎，Ara-2能够快速处理高清图像，有效提升精度，实现更高水平的对象检视、识别及追踪。例如，针对生成式AI模型，Stable Diffusion每10秒即可生成一幅图片，LLaMA-7B则可达到每秒几十个token的处理速率。”

据悉，Ampere将在10月份容忍Kinar加入其人工智能平台联盟，共同致力于降低系统复杂度，推动人工智能进一步提升协同工作能力和开放性，目标在于提供比GPU更优的总体性能，同时兼顾吞吐量、功率和成本效益。该团队的首席布道师Sean Varley认为：“ ARA-2展现的性能和功能集让我坚定朝这个方向发展，助力行业推出性能更优且与现有GPU技术相匹敌的AI替代方案。”

除此之外，Ara-2还秉持着安全启动、加密内存访问以及安全主控接口等特性，确保企业AI部署拥有更高的安全性。Kinar亦为之提供全套的SDK支持，囊括模型编译器、计算单元调度程序、灵活的量化选项（含内置的Kinar量化器）以及对PyTorch和TFLite预量化模型的支持、多芯片负荷均衡器系统与动态调节主控运行等诸多要素。

Ara-2提供独立设备、USB模块、M.2模块以及多个Ara-2组成的PCIe卡等丰富形式供消费者选择。 Kinara计划在CES上现场展示这款备受瞩目的Ara-2产品。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4795

浏览量
129502
数据中心

数据中心

+关注

关注
16

文章
4876

浏览量
72466
生成式AI

生成式AI

+关注

关注
0

文章
518

浏览量
565

Arm技术助力Google Axion处理器加速AI工作负载推理

由 Arm Neoverse V2 平台赋能的 Google Axion 处理器已在 Google Cloud 上正式上线，其中，C4A 是首款基于 Axion 的云虚拟机，为基于 CPU 的人工智能 (AI)

发表于 02-14 14:11 •107次阅读

Arm技术助力Google Axion<b class='flag-5'>处理器</b>加速<b class='flag-5'>AI</b>工作负载<b class='flag-5'>推理</b>

恩智浦3.07亿美元收购Kinara，强化边缘AI布局

近日，恩智浦半导体公司（NXP Semiconductors）宣布了一项重大收购计划，将以3.07亿美元（约合22.44亿元人民币）现金收购边缘AI NPU（神经处理单元）公司Kinara

发表于 02-12 17:02 •253次阅读

恩智浦拟22.44亿人民币收购边缘NPU企业Kinara

近日，全球领先的半导体公司恩智浦半导体宣布，已与边缘NPU(神经网络处理器)企业Kinara达成最终收购协议。根据协议，恩智浦将以3.07亿美元(当前约合22.44亿元人民币)现金收购Kina

发表于 02-12 10:31 •128次阅读

使用NVIDIA推理平台提高AI推理性能

NVIDIA推理平台提高了 AI 推理性能，为零售、电信等行业节省了数百万美元。

发表于 02-08 09:59 •246次阅读

Arm KleidiAI助力提升PyTorch上LLM推理性能

热门的深度学习框架尤为突出，许多企业均会选择其作为开发 AI 应用的库。通过部署 Arm Kleidi 技术，Arm 正在努力优化 PyTorch，以加速在基于 Arm 架构的处理器上运行 LLM 的性能。Arm 通过将 Kle

发表于 12-03 17:05 •973次阅读

英特尔®至强®可扩展处理器助力智慧医疗的数字化转型

医疗机构实现数据的收集、分析和辅助决策，从而提升医疗服务质量与效率。这一处理器内置的AI加速器显著提升了AI

发表于 09-29 11:13 •6160次阅读

英特尔® 酷睿™ Ultra 处理器面向多行业加速AI产业升级

持竞争力，企业亟需更高效的计算平台来处理日益复杂的数据分析和AI推理任务。为响应这一时代需求，英特尔正式发布英特尔® 酷睿™ Ultra

发表于 09-14 20:36 •1.3w次阅读

开箱即用，AISBench测试展示英特尔至强处理器的卓越推理性能

。中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务器系统性能测试规范》（征求意见稿）相关要求，使用AISBench 2.0测试工具，完成了第五代英特尔至强可扩展处理器的AI

发表于 09-06 15:33 •446次阅读

基于瑞萨RZ/V2H AI微处理器的解决方案：高性能视觉AI系统

RZ/V2H嵌入式AI微处理器，采用瑞萨最新的DRP-AI3技术，可提供高达8TOPS（Dense模型）/80TOPS（sparse模型）的AI

发表于 07-02 18:36 •634次阅读

宁畅B5000 G5多节点服务器采用第五代英特尔至强可扩展处理器

“基于第五代英特尔至强可扩展处理器的宁畅B5000 G5多节点服务器，可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需求，而且与专用的GPU服务

发表于 05-27 11:46 •928次阅读

台积电：AI服务器处理器预计翻番，拉动收入增长

台积电将 AI 服务器处理器严格限定为用于 AI 训练与推理的 GPU、CPU 及 AI 加速

发表于 04-19 15:04 •423次阅读

自然语言处理应用LLM推理优化综述

当前，业界在将传统优化技术引入 LLM 推理的同时，同时也在探索从大模型自回归解码特点出发，通过调整推理过程和引入新的模型结构来进一步提升推理性能。

发表于 04-10 11:48 •700次阅读

UL Procyon AI 发布图像生成基准测试，基于Stable Diffusion

UL去年发布的首个Windows版Procyon AI推理基准测试，以计算机视觉工作负载评估AI推理性能。新推出的图像生成测试将提供统一、精

发表于 03-25 16:16 •994次阅读

AMD EPYC处理器：AI推理能力究竟有多强？

如今，AMD EPYC处理器已经成为最常被选择用于AI推理的服务器平台，尤其是第四代Genoa EPYC 9004系列，执行AI

发表于 03-15 09:47 •585次阅读

瑞萨电子宣布推出一款面向高性能机器人应用的新产品—RZ/V2H

具有10TOPS/W能效的新一代AI加速器无需冷却风扇即可提供高达80TOPS的AI推理性能

发表于 03-01 10:41 •918次阅读