0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kinara发布Ara-2边缘AI处理器,实现高效、经济、节能的推理性能

微云疏影 来源:综合整理 作者:综合整理 2023-12-19 11:05 次阅读

Kinar于近期发布了Ara-2边缘AI处理器,这是一款专为边缘服务器及笔记本电脑打造的高性能、高效能且节能推理解决方案,尤其适用于视频分析、大规模语言模型(LLM)在内的各类AI应用。值得注意的是,Ara-2也能够良好适应传统AI模型和基于Transformer架构的尖端AI模型,其所具备的体验式增强功能集使得Ara-2的性能较初代的Ara-1处理器有显著提升,可达成超过5至8倍的增长,将实时响应能力与大吞吐量相结合,从而达致高度精炼的延迟优化设计和均衡性能。

生成式AI现已成为主流,然而大多数此类应用却在数据中心GPU上运行,由此引发的延迟、高成本以及隐私问题亟待解决。Ara-2顺应时代变化,贴心支持生成式AI模型所需引导的数十亿个参数,为跨境转移提供便利。同时,为了更顺畅地完成从GPU至各个AI模型的过度,其内建的计算引擎以及软件开发套件(SDK)均为此进行定制搭建。

“Ara-2的诞生使得我们有能力根据客户需求提供更高性能和成本选择。如Ara-1,其专为智能相机及具有2至8路视频流的边缘AI设备而生;而Ara-2则特别擅长处理针对16至32路甚至更多视频流的底层边缘服务器或笔记本电脑,且与高端相机完美兼容。” Kinara首席执行官Ravi Annavajjhala对此表示。“借助先进的计算引擎,Ara-2能够快速处理高清图像,有效提升精度,实现更高水平的对象检视、识别及追踪。例如,针对生成式AI模型,Stable Diffusion每10秒即可生成一幅图片,LLaMA-7B则可达到每秒几十个token的处理速率。”

据悉,Ampere将在10月份容忍Kinar加入其人工智能平台联盟,共同致力于降低系统复杂度,推动人工智能进一步提升协同工作能力和开放性,目标在于提供比GPU更优的总体性能,同时兼顾吞吐量、功率和成本效益。该团队的首席布道师Sean Varley认为:“ ARA-2展现的性能和功能集让我坚定朝这个方向发展,助力行业推出性能更优且与现有GPU技术相匹敌的AI替代方案。”

除此之外,Ara-2还秉持着安全启动、加密内存访问以及安全主控接口等特性,确保企业AI部署拥有更高的安全性。Kinar亦为之提供全套的SDK支持,囊括模型编译器、计算单元调度程序、灵活的量化选项(含内置的Kinar量化器)以及对PyTorch和TFLite预量化模型的支持、多芯片负荷均衡器系统与动态调节主控运行等诸多要素。

Ara-2提供独立设备、USB模块、M.2模块以及多个Ara-2组成的PCIe卡等丰富形式供消费者选择。 Kinara计划在CES上现场展示这款备受瞩目的Ara-2产品

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4795

    浏览量

    129502
  • 数据中心
    +关注

    关注

    16

    文章

    4876

    浏览量

    72466
  • 生成式AI
    +关注

    关注

    0

    文章

    518

    浏览量

    565
收藏 人收藏

    评论

    相关推荐

    Arm技术助力Google Axion处理器加速AI工作负载推理

    由 Arm Neoverse V2 平台赋能的 Google Axion 处理器已在 Google Cloud 上正式上线,其中,C4A 是首款基于 Axion 的云虚拟机,为基于 CPU 的人工智能 (AI)
    的头像 发表于 02-14 14:11 107次阅读
    Arm技术助力Google Axion<b class='flag-5'>处理器</b>加速<b class='flag-5'>AI</b>工作负载<b class='flag-5'>推理</b>

    恩智浦3.07亿美元收购Kinara,强化边缘AI布局

    近日,恩智浦半导体公司(NXP Semiconductors)宣布了一项重大收购计划,将以3.07亿美元(约合22.44亿元人民币)现金收购边缘AI NPU(神经处理单元)公司Kinara
    的头像 发表于 02-12 17:02 253次阅读

    恩智浦拟22.44亿人民币收购边缘NPU企业Kinara

    近日,全球领先的半导体公司恩智浦半导体宣布,已与边缘NPU(神经网络处理器)企业Kinara达成最终收购协议。根据协议,恩智浦将以3.07亿美元(当前约合22.44亿元人民币)现金收购Kina
    的头像 发表于 02-12 10:31 128次阅读

    使用NVIDIA推理平台提高AI推理性能

    NVIDIA推理平台提高了 AI 推理性能,为零售、电信等行业节省了数百万美元。
    的头像 发表于 02-08 09:59 246次阅读
    使用NVIDIA<b class='flag-5'>推理</b>平台提高<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    Arm KleidiAI助力提升PyTorch上LLM推理性能

    热门的深度学习框架尤为突出,许多企业均会选择其作为开发 AI 应用的库。通过部署 Arm Kleidi 技术,Arm 正在努力优化 PyTorch,以加速在基于 Arm 架构的处理器上运行 LLM 的性能。Arm 通过将 Kle
    的头像 发表于 12-03 17:05 973次阅读
    Arm KleidiAI助力提升PyTorch上LLM<b class='flag-5'>推理性能</b>

    英特尔®至强®可扩展处理器助力智慧医疗的数字化转型

    医疗机构实现数据的收集、分析和辅助决策,从而提升医疗服务质量与效率。   这一处理器内置的AI加速显著提升了AI
    发表于 09-29 11:13 6160次阅读
    英特尔®至强®可扩展<b class='flag-5'>处理器</b>助力智慧医疗的数字化转型

    英特尔® 酷睿™ Ultra 处理器面向多行业加速AI产业升级

    持竞争力,企业亟需更高效的计算平台来处理日益复杂的数据分析和AI推理任务。 为响应这一时代需求,英特尔正式发布英特尔® 酷睿™ Ultra
    发表于 09-14 20:36 1.3w次阅读
    英特尔® 酷睿™ Ultra <b class='flag-5'>处理器</b>面向多行业加速<b class='flag-5'>AI</b>产业升级

    开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能

    。 中国电子技术标准化研究院赛西实验室依据国家标准《人工智能服务系统性能测试规范》(征求意见稿)相关要求,使用AISBench 2.0测试工具,完成了第五代英特尔至强可扩展处理器AI
    的头像 发表于 09-06 15:33 446次阅读
    开箱即用,AISBench测试展示英特尔至强<b class='flag-5'>处理器</b>的卓越<b class='flag-5'>推理性能</b>

    基于瑞萨RZ/V2H AI处理器的解决方案:高性能视觉AI系统

    RZ/V2H嵌入式AI处理器,采用瑞萨最新的DRP-AI3技术,可提供高达8TOPS(Dense模型)/80TOPS(sparse模型)的AI
    发表于 07-02 18:36 634次阅读
    基于瑞萨RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微<b class='flag-5'>处理器</b>的解决方案:高<b class='flag-5'>性能</b>视觉<b class='flag-5'>AI</b>系统

    宁畅B5000 G5多节点服务采用第五代英特尔至强可扩展处理器

    “基于第五代英特尔 至强 可扩展处理器的宁畅B5000 G5多节点服务,可以在满足大量AI推理场景在吞吐量、时延、容量、并发能力等方面的需求,而且与专用的GPU服务
    的头像 发表于 05-27 11:46 928次阅读
    宁畅B5000 G5多节点服务<b class='flag-5'>器</b>采用第五代英特尔至强可扩展<b class='flag-5'>处理器</b>

    台积电:AI服务处理器预计翻番,拉动收入增长 

    台积电将 AI 服务处理器严格限定为用于 AI 训练与推理的 GPU、CPU 及 AI 加速
    的头像 发表于 04-19 15:04 423次阅读

    自然语言处理应用LLM推理优化综述

    当前,业界在将传统优化技术引入 LLM 推理的同时,同时也在探索从大模型自回归解码特点出发,通过调整推理过程和引入新的模型结构来进一步提升推理性能
    发表于 04-10 11:48 700次阅读
    自然语言<b class='flag-5'>处理</b>应用LLM<b class='flag-5'>推理</b>优化综述

    UL Procyon AI 发布图像生成基准测试,基于Stable Diffusion

    UL去年发布的首个Windows版Procyon AI推理基准测试,以计算机视觉工作负载评估AI推理性能。新推出的图像生成测试将提供统一、精
    的头像 发表于 03-25 16:16 994次阅读

    AMD EPYC处理器AI推理能力究竟有多强?

    如今,AMD EPYC处理器已经成为最常被选择用于AI推理的服务平台,尤其是第四代Genoa EPYC 9004系列,执行AI
    发表于 03-15 09:47 585次阅读

    瑞萨电子宣布推出一款面向高性能机器人应用的新产品—RZ/V2H

    具有10TOPS/W能效的新一代AI加速无需冷却风扇即可提供高达80TOPS的AI推理性能
    的头像 发表于 03-01 10:41 918次阅读
    瑞萨电子宣布推出一款面向高<b class='flag-5'>性能</b>机器人应用的新产品—RZ/V<b class='flag-5'>2</b>H