0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kinara发布Ara-2边缘AI处理器,实现高效、经济、节能的推理性能

微云疏影 来源:综合整理 作者:综合整理 2023-12-19 11:05 次阅读

Kinar于近期发布了Ara-2边缘AI处理器,这是一款专为边缘服务器及笔记本电脑打造的高性能、高效能且节能推理解决方案,尤其适用于视频分析、大规模语言模型(LLM)在内的各类AI应用。值得注意的是,Ara-2也能够良好适应传统AI模型和基于Transformer架构的尖端AI模型,其所具备的体验式增强功能集使得Ara-2的性能较初代的Ara-1处理器有显著提升,可达成超过5至8倍的增长,将实时响应能力与大吞吐量相结合,从而达致高度精炼的延迟优化设计和均衡性能。

生成式AI现已成为主流,然而大多数此类应用却在数据中心GPU上运行,由此引发的延迟、高成本以及隐私问题亟待解决。Ara-2顺应时代变化,贴心支持生成式AI模型所需引导的数十亿个参数,为跨境转移提供便利。同时,为了更顺畅地完成从GPU至各个AI模型的过度,其内建的计算引擎以及软件开发套件(SDK)均为此进行定制搭建。

“Ara-2的诞生使得我们有能力根据客户需求提供更高性能和成本选择。如Ara-1,其专为智能相机及具有2至8路视频流的边缘AI设备而生;而Ara-2则特别擅长处理针对16至32路甚至更多视频流的底层边缘服务器或笔记本电脑,且与高端相机完美兼容。” Kinara首席执行官Ravi Annavajjhala对此表示。“借助先进的计算引擎,Ara-2能够快速处理高清图像,有效提升精度,实现更高水平的对象检视、识别及追踪。例如,针对生成式AI模型,Stable Diffusion每10秒即可生成一幅图片,LLaMA-7B则可达到每秒几十个token的处理速率。”

据悉,Ampere将在10月份容忍Kinar加入其人工智能平台联盟,共同致力于降低系统复杂度,推动人工智能进一步提升协同工作能力和开放性,目标在于提供比GPU更优的总体性能,同时兼顾吞吐量、功率和成本效益。该团队的首席布道师Sean Varley认为:“ ARA-2展现的性能和功能集让我坚定朝这个方向发展,助力行业推出性能更优且与现有GPU技术相匹敌的AI替代方案。”

除此之外,Ara-2还秉持着安全启动、加密内存访问以及安全主控接口等特性,确保企业AI部署拥有更高的安全性。Kinar亦为之提供全套的SDK支持,囊括模型编译器、计算单元调度程序、灵活的量化选项(含内置的Kinar量化器)以及对PyTorch和TFLite预量化模型的支持、多芯片负荷均衡器系统与动态调节主控运行等诸多要素。

Ara-2提供独立设备、USB模块、M.2模块以及多个Ara-2组成的PCIe卡等丰富形式供消费者选择。 Kinara计划在CES上现场展示这款备受瞩目的Ara-2产品

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4736

    浏览量

    128932
  • 数据中心
    +关注

    关注

    16

    文章

    4775

    浏览量

    72119
  • 生成式AI
    +关注

    关注

    0

    文章

    503

    浏览量

    474
收藏 人收藏

    评论

    相关推荐

    Arm KleidiAI助力提升PyTorch上LLM推理性能

    热门的深度学习框架尤为突出,许多企业均会选择其作为开发 AI 应用的库。通过部署 Arm Kleidi 技术,Arm 正在努力优化 PyTorch,以加速在基于 Arm 架构的处理器上运行 LLM 的性能。Arm 通过将 Kle
    的头像 发表于 12-03 17:05 786次阅读
    Arm KleidiAI助力提升PyTorch上LLM<b class='flag-5'>推理性能</b>

    英特尔®至强®可扩展处理器助力智慧医疗的数字化转型

    医疗机构实现数据的收集、分析和辅助决策,从而提升医疗服务质量与效率。   这一处理器内置的AI加速显著提升了AI
    发表于 09-29 11:13 6088次阅读
    英特尔®至强®可扩展<b class='flag-5'>处理器</b>助力智慧医疗的数字化转型

    米尔STM32MP2核心板首发新品上市!高性能+多接口+边缘算力

    米尔发布基于STM32MP257设计的嵌入式处理器模块MYC-LD25X核心板及开发板。核心板基于STM32MP2系列是意法半导体推出最新一代工业级64位微处理器,采用LGA 252
    发表于 09-20 18:24

    英特尔® 酷睿™ Ultra 处理器面向多行业加速AI产业升级

    持竞争力,企业亟需更高效的计算平台来处理日益复杂的数据分析和AI推理任务。 为响应这一时代需求,英特尔正式发布英特尔® 酷睿™ Ultra
    发表于 09-14 20:36 1.3w次阅读
    英特尔® 酷睿™ Ultra <b class='flag-5'>处理器</b>面向多行业加速<b class='flag-5'>AI</b>产业升级

    基于全志V853处理器的智能辅助驾驶算法介绍

    全志V853处理器,是专为智慧视觉领域设计的AI处理器,配备了高效的NPU算力和丰富的外设接口,能够提供稳定的AI
    的头像 发表于 09-14 09:23 726次阅读
    基于全志V853<b class='flag-5'>处理器</b>的智能辅助驾驶算法介绍

    开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

    。 中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务系统性能测试规范》(征求意见稿)相关要求,使用AISBench 2.0测试工具,完成了第五代英特尔至强可扩展处理器AI
    的头像 发表于 09-06 15:33 339次阅读
    开箱即用,AISBench测试展示英特尔至强<b class='flag-5'>处理器</b>的卓越<b class='flag-5'>推理性能</b>

    使用边缘AI和Sitara处理器进行关键字检测

    电子发烧友网站提供《使用边缘AI和Sitara处理器进行关键字检测.pdf》资料免费下载
    发表于 09-02 11:30 0次下载
    使用<b class='flag-5'>边缘</b><b class='flag-5'>AI</b>和Sitara<b class='flag-5'>处理器</b>进行关键字检测

    基于瑞萨RZ/V2H AI处理器的解决方案:高性能视觉AI系统

    RZ/V2H嵌入式AI处理器,采用瑞萨最新的DRP-AI3技术,可提供高达8TOPS(Dense模型)/80TOPS(sparse模型)的AI
    发表于 07-02 18:36 508次阅读
    基于瑞萨RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微<b class='flag-5'>处理器</b>的解决方案:高<b class='flag-5'>性能</b>视觉<b class='flag-5'>AI</b>系统

    宁畅B5000 G5多节点服务采用第五代英特尔至强可扩展处理器

    “基于第五代英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务,可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需求,而且与专用的GPU服务
    的头像 发表于 05-27 11:46 825次阅读
    宁畅B5000 G5多节点服务<b class='flag-5'>器</b>采用第五代英特尔至强可扩展<b class='flag-5'>处理器</b>

    risc-v多核芯片在AI方面的应用

    得RISC-V多核芯片能够更好地适应AI算法的不同需求,包括深度学习、神经网络等,从而提高芯片的性能和效率,降低成本,使AI边缘计算晶片更具竞争力。 再者,RISC-V的多核设计可以进
    发表于 04-28 09:20

    台积电:AI服务处理器预计翻番,拉动收入增长 

    台积电将 AI 服务处理器严格限定为用于 AI 训练与推理的 GPU、CPU 及 AI 加速
    的头像 发表于 04-19 15:04 359次阅读

    自然语言处理应用LLM推理优化综述

    当前,业界在将传统优化技术引入 LLM 推理的同时,同时也在探索从大模型自回归解码特点出发,通过调整推理过程和引入新的模型结构来进一步提升推理性能
    发表于 04-10 11:48 587次阅读
    自然语言<b class='flag-5'>处理</b>应用LLM<b class='flag-5'>推理</b>优化综述

    UL Procyon AI 发布图像生成基准测试,基于Stable Diffusion

    UL去年发布的首个Windows版Procyon AI推理基准测试,以计算机视觉工作负载评估AI推理性能。新推出的图像生成测试将提供统一、精
    的头像 发表于 03-25 16:16 881次阅读

    AMD EPYC处理器AI推理能力究竟有多强?

    如今,AMD EPYC处理器已经成为最常被选择用于AI推理的服务平台,尤其是第四代Genoa EPYC 9004系列,执行AI
    发表于 03-15 09:47 488次阅读

    瑞萨电子宣布推出一款面向高性能机器人应用的新产品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速无需冷却风扇即可提供高达80TOPS的AI推理性能
    的头像 发表于 03-01 10:41 839次阅读
    瑞萨电子宣布推出一款面向高<b class='flag-5'>性能</b>机器人应用的新产品—RZ/V<b class='flag-5'>2</b>H