0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Kinara发布Ara-2边缘AI处理器,实现高效、经济、节能的推理性能

微云疏影 来源:综合整理 作者:综合整理 2023-12-19 11:05 次阅读

Kinar于近期发布了Ara-2边缘AI处理器,这是一款专为边缘服务器及笔记本电脑打造的高性能、高效能且节能推理解决方案,尤其适用于视频分析、大规模语言模型(LLM)在内的各类AI应用。值得注意的是,Ara-2也能够良好适应传统AI模型和基于Transformer架构的尖端AI模型,其所具备的体验式增强功能集使得Ara-2的性能较初代的Ara-1处理器有显著提升,可达成超过5至8倍的增长,将实时响应能力与大吞吐量相结合,从而达致高度精炼的延迟优化设计和均衡性能。

生成式AI现已成为主流,然而大多数此类应用却在数据中心GPU上运行,由此引发的延迟、高成本以及隐私问题亟待解决。Ara-2顺应时代变化,贴心支持生成式AI模型所需引导的数十亿个参数,为跨境转移提供便利。同时,为了更顺畅地完成从GPU至各个AI模型的过度,其内建的计算引擎以及软件开发套件(SDK)均为此进行定制搭建。

“Ara-2的诞生使得我们有能力根据客户需求提供更高性能和成本选择。如Ara-1,其专为智能相机及具有2至8路视频流的边缘AI设备而生;而Ara-2则特别擅长处理针对16至32路甚至更多视频流的底层边缘服务器或笔记本电脑,且与高端相机完美兼容。” Kinara首席执行官Ravi Annavajjhala对此表示。“借助先进的计算引擎,Ara-2能够快速处理高清图像,有效提升精度,实现更高水平的对象检视、识别及追踪。例如,针对生成式AI模型,Stable Diffusion每10秒即可生成一幅图片,LLaMA-7B则可达到每秒几十个token的处理速率。”

据悉,Ampere将在10月份容忍Kinar加入其人工智能平台联盟,共同致力于降低系统复杂度,推动人工智能进一步提升协同工作能力和开放性,目标在于提供比GPU更优的总体性能,同时兼顾吞吐量、功率和成本效益。该团队的首席布道师Sean Varley认为:“ ARA-2展现的性能和功能集让我坚定朝这个方向发展,助力行业推出性能更优且与现有GPU技术相匹敌的AI替代方案。”

除此之外,Ara-2还秉持着安全启动、加密内存访问以及安全主控接口等特性,确保企业AI部署拥有更高的安全性。Kinar亦为之提供全套的SDK支持,囊括模型编译器、计算单元调度程序、灵活的量化选项(含内置的Kinar量化器)以及对PyTorch和TFLite预量化模型的支持、多芯片负荷均衡器系统与动态调节主控运行等诸多要素。

Ara-2提供独立设备、USB模块、M.2模块以及多个Ara-2组成的PCIe卡等丰富形式供消费者选择。 Kinara计划在CES上现场展示这款备受瞩目的Ara-2产品

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4516

    浏览量

    127629
  • 数据中心
    +关注

    关注

    15

    文章

    4359

    浏览量

    71112
  • 生成式AI
    +关注

    关注

    0

    文章

    434

    浏览量

    339
收藏 人收藏

    评论

    相关推荐

    基于瑞萨RZ/V2H AI处理器的解决方案:高性能视觉AI系统

    RZ/V2H嵌入式AI处理器,采用瑞萨最新的DRP-AI3技术,可提供高达8TOPS(Dense模型)/80TOPS(sparse模型)的AI
    发表于 07-02 18:36 194次阅读
    基于瑞萨RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微<b class='flag-5'>处理器</b>的解决方案:高<b class='flag-5'>性能</b>视觉<b class='flag-5'>AI</b>系统

    台积电:AI服务处理器预计翻番,拉动收入增长 

    台积电将 AI 服务处理器严格限定为用于 AI 训练与推理的 GPU、CPU 及 AI 加速
    的头像 发表于 04-19 15:04 191次阅读

    UL Procyon AI 发布图像生成基准测试,基于Stable Diffusion

    UL去年发布的首个Windows版Procyon AI推理基准测试,以计算机视觉工作负载评估AI推理性能。新推出的图像生成测试将提供统一、精
    的头像 发表于 03-25 16:16 512次阅读

    AMD EPYC处理器AI推理能力究竟有多强?

    如今,AMD EPYC处理器已经成为最常被选择用于AI推理的服务平台,尤其是第四代Genoa EPYC 9004系列,执行AI
    发表于 03-15 09:47 244次阅读

    英特尔专家为您揭秘第五代英特尔® 至强® 可扩展处理器如何为AI加速

    % 1 ,AI 推理性能提升42% 2 。 这一系列性能提升的背后,存在着怎样的创新与突破?第五代英特尔 至强 可扩展处理器为什么要强调为
    的头像 发表于 12-23 12:20 547次阅读

    英特尔发布第五代至强可扩展处理器性能和能效大幅提升,AI 加速

    此外,至强可扩展处理器被誉为行业首屈一指的内置AI加速数据中心处理器,全新第五代产品更能优化参数量高达200亿的大型语言模型,使其推理性能
    的头像 发表于 12-15 11:02 584次阅读

    Kinara推出Ara-2边缘AI处理器,为边缘服务和笔记本电脑提供高性

    虽然生成式AI应用日趋盛行,但大部分应用仍依赖GPU在数据中心运行,存在着延迟高、成本大、隐私泄漏等诸多风险。为了解决此类问题,Ara-2处理器支持生成式AI模型所需要的大量参数,有效
    的头像 发表于 12-14 10:12 711次阅读
    <b class='flag-5'>Kinara</b>推出<b class='flag-5'>Ara-2</b><b class='flag-5'>边缘</b><b class='flag-5'>AI</b><b class='flag-5'>处理器</b>,为<b class='flag-5'>边缘</b>服务<b class='flag-5'>器</b>和笔记本电脑提供高性

    用上这个工具包,大模型推理性能加速达40倍

    作者: 英特尔公司 沈海豪、罗屿、孟恒宇、董波、林俊 编者按: 只需不到9行代码, 就能在CPU上实现出色的LLM推理性能。 英特尔  Extension for Transformer 创新
    的头像 发表于 12-01 20:40 801次阅读
    用上这个工具包,大模型<b class='flag-5'>推理性能</b>加速达40倍

    Nvidia 通过开源库提升 LLM 推理性能

    加利福尼亚州圣克拉拉——Nvidia通过一个名为TensorRT LLM的新开源软件库,将其H100、A100和L4 GPU的大型语言模型(LLM)推理性能提高了一倍。 正如对相同硬件一轮又一轮改进
    的头像 发表于 10-23 16:10 418次阅读

    最新MLCommons结果公布 英特尔展现强大AI推理性能

    、第四代英特尔 至强 可扩展处理器,以及英特尔 至强 CPU Max系列的测试结果。 该结果显示了英特尔在AI推理方面极具竞争力的表现,并进一步加强了其对加速从云到网络到边缘再到端的工
    的头像 发表于 09-15 19:35 392次阅读
    最新MLCommons结果公布 英特尔展现强大<b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>

    瑞萨电子RZ/V2系列MPU简介

    )。DRP-AI专为嵌入式机器视觉类AI/ML(Machine Learning)应用优化设计,可提供实时AI推理和图像处理功能,同时兼具了
    的头像 发表于 09-13 12:24 881次阅读
    瑞萨电子RZ/V<b class='flag-5'>2</b>系列MPU简介

    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人

    测试结果,其中包括英特尔所提交的基于Habana® Gaudi®2 加速、第四代英特尔®至强®可扩展处理器,以及英特尔®至强® CPU Max 系列的测试结果。该结果显示了英特尔在AI
    的头像 发表于 09-12 17:54 309次阅读
    最新MLPerf v3.1测试结果认证,Gaudi<b class='flag-5'>2</b>在GPT-J模型上<b class='flag-5'>推理性能</b>惊人

    求助,为什么将不同的权重应用于模型会影响推理性能

    生成两个 IR文件(相同的 .xml 文件,但不同的 .bin 文件) 具有不同重量的类似模型,以不同的 fps (27fps 和 6fps) 运行 更多样化的权重是否会影响 Myriad X 上的推理性能
    发表于 08-15 07:00

    如何提高YOLOv4模型的推理性能

    使用 PyTorch 对具有非方形图像的 YOLOv4 模型进行了训练。 将 权重转换为 ONNX 文件,然后转换为中间表示 (IR)。 无法确定如何获得更好的推理性能
    发表于 08-15 06:58

    英特尔® AMX 助力百度ERNIE-Tiny AI推理性能提升2.66倍,尽释AI加速潜能

    能千行百业 人民网携手英特尔启动“数智加速度”计划 WAIC 2023:英特尔以技术之力推动边缘人工智能发展,打造数字化未来“芯”时代 英特尔 AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载压力 原文标题:英特尔®
    的头像 发表于 07-14 20:10 312次阅读
    英特尔® AMX 助力百度ERNIE-Tiny <b class='flag-5'>AI</b><b class='flag-5'>推理性能</b>提升2.66倍,尽释<b class='flag-5'>AI</b>加速潜能