Kinar于近期发布了Ara-2边缘AI处理器,这是一款专为边缘服务器及笔记本电脑打造的高性能、高效能且节能推理解决方案,尤其适用于视频分析、大规模语言模型(LLM)在内的各类AI应用。值得注意的是,Ara-2也能够良好适应传统AI模型和基于Transformer架构的尖端AI模型,其所具备的体验式增强功能集使得Ara-2的性能较初代的Ara-1处理器有显著提升,可达成超过5至8倍的增长,将实时响应能力与大吞吐量相结合,从而达致高度精炼的延迟优化设计和均衡性能。
生成式AI现已成为主流,然而大多数此类应用却在数据中心的GPU上运行,由此引发的延迟、高成本以及隐私问题亟待解决。Ara-2顺应时代变化,贴心支持生成式AI模型所需引导的数十亿个参数,为跨境转移提供便利。同时,为了更顺畅地完成从GPU至各个AI模型的过度,其内建的计算引擎以及软件开发套件(SDK)均为此进行定制搭建。
“Ara-2的诞生使得我们有能力根据客户需求提供更高性能和成本选择。如Ara-1,其专为智能相机及具有2至8路视频流的边缘AI设备而生;而Ara-2则特别擅长处理针对16至32路甚至更多视频流的底层边缘服务器或笔记本电脑,且与高端相机完美兼容。” Kinara首席执行官Ravi Annavajjhala对此表示。“借助先进的计算引擎,Ara-2能够快速处理高清图像,有效提升精度,实现更高水平的对象检视、识别及追踪。例如,针对生成式AI模型,Stable Diffusion每10秒即可生成一幅图片,LLaMA-7B则可达到每秒几十个token的处理速率。”
据悉,Ampere将在10月份容忍Kinar加入其人工智能平台联盟,共同致力于降低系统复杂度,推动人工智能进一步提升协同工作能力和开放性,目标在于提供比GPU更优的总体性能,同时兼顾吞吐量、功率和成本效益。该团队的首席布道师Sean Varley认为:“ ARA-2展现的性能和功能集让我坚定朝这个方向发展,助力行业推出性能更优且与现有GPU技术相匹敌的AI替代方案。”
除此之外,Ara-2还秉持着安全启动、加密内存访问以及安全主控接口等特性,确保企业AI部署拥有更高的安全性。Kinar亦为之提供全套的SDK支持,囊括模型编译器、计算单元调度程序、灵活的量化选项(含内置的Kinar量化器)以及对PyTorch和TFLite预量化模型的支持、多芯片负荷均衡器系统与动态调节主控运行等诸多要素。
Ara-2提供独立设备、USB模块、M.2模块以及多个Ara-2组成的PCIe卡等丰富形式供消费者选择。 Kinara计划在CES上现场展示这款备受瞩目的Ara-2产品。
-
gpu
+关注
关注
27文章
4516浏览量
127629 -
数据中心
+关注
关注
15文章
4359浏览量
71112 -
生成式AI
+关注
关注
0文章
434浏览量
339
发布评论请先 登录
相关推荐
基于瑞萨RZ/V2H AI微处理器的解决方案:高性能视觉AI系统
![基于瑞萨RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微<b class='flag-5'>处理器</b>的解决方案:高<b class='flag-5'>性能</b>视觉<b class='flag-5'>AI</b>系统](https://file1.elecfans.com/web2/M00/F7/28/wKgZomaD21SAbKA6AADrJjvRsaM578.png)
UL Procyon AI 发布图像生成基准测试,基于Stable Diffusion
AMD EPYC处理器:AI推理能力究竟有多强?
英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理器如何为AI加速
英特尔发布第五代至强可扩展处理器:性能和能效大幅提升,AI 加速
Kinara推出Ara-2边缘AI处理器,为边缘服务器和笔记本电脑提供高性
![<b class='flag-5'>Kinara</b>推出<b class='flag-5'>Ara-2</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b><b class='flag-5'>处理器</b>,为<b class='flag-5'>边缘</b>服务<b class='flag-5'>器</b>和笔记本电脑提供高性](https://file1.elecfans.com/web2/M00/DF/3C/wKgaomYvPwaAOwLNAADMc7dQmYk881.jpg)
用上这个工具包,大模型推理性能加速达40倍
![用上这个工具包,大模型<b class='flag-5'>推理性能</b>加速达40倍](https://file1.elecfans.com//web2/M00/B4/0B/wKgZomVp1VeAe-FnAACtHVch3i8131.png)
Nvidia 通过开源库提升 LLM 推理性能
最新MLCommons结果公布 英特尔展现强大AI推理性能
![最新MLCommons结果公布 英特尔展现强大<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>](https://file1.elecfans.com//web2/M00/A3/61/wKgZomUEQpSAGFIyAABOUcjx2Xw150.gif)
最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人
![最新MLPerf v3.1测试结果认证,Gaudi<b class='flag-5'>2</b>在GPT-J模型上<b class='flag-5'>推理性能</b>惊人](https://file1.elecfans.com//web2/M00/A2/AA/wKgZomUANVWAY6S7AAJVP79DRaA450.png)
求助,为什么将不同的权重应用于模型会影响推理性能?
如何提高YOLOv4模型的推理性能?
英特尔® AMX 助力百度ERNIE-Tiny AI推理性能提升2.66倍,尽释AI加速潜能
![英特尔® AMX 助力百度ERNIE-Tiny <b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>提升2.66倍,尽释<b class='flag-5'>AI</b>加速潜能](https://file1.elecfans.com/web2/M00/8C/DB/wKgZomSzu-mAUDc7AAtdXIGd1TI532.jpg)
评论