加利福尼亚州洛斯阿尔托斯,2020年11月19日– Deep Vision退出隐身模式,并启动其ARA-1推理处理器,以支持在边缘创建新的世界AI视觉应用程序。处理器以紧凑的外形尺寸实现了计算,内存,能效(典型值2W)和超低延迟之间的最佳平衡,使其成为端点(如相机,传感器以及具有高计算能力的边缘服务器)的最终选择需求,模型灵活性和能源效率至关重要。
Deep Vision首席执行官Ravi Annavajjhala说:“当今复杂的AI工作负载不仅需要低功耗,而且还需要低延迟才能在边缘交付实时智能。” “不再需要在性能和效率之间进行权衡。开发人员现在可以在一个处理器上获得更高准确性的结果和丰富的数据见解。”
突破性的高效架构
深度学习模型的复杂性不断增长,并在边缘推动了对AI的计算需求的增长。Deep Vision ARA-1处理器基于获得专利的多态数据流架构,能够处理各种数据流,以最大程度地减少片上数据移动。该架构支持每个神经网络模型内的指令,从而可以在深度学习模型内最佳地映射任何数据流模式。将数据保持在靠近计算引擎的位置可以最大程度地减少数据移动,从而确保高推理吞吐量,低延迟和更高的电源效率。编译器自动为神经网络中的每一层评估多个数据流模式,并选择性能最高和功耗最低的模式。
通过同时进行多模型处理,Deep Vision ARA-1处理器还可以有效地运行多个模型,而不会影响性能,从而更快,更准确地生成结果。Deep Vision ARA-1处理器以比Edge TPU和Movidius MyriadX低的系统功耗运行深度学习模型,例如Resnet-50,其延迟比Edge TPU高6倍,而延迟比MyriadX高4倍。
以软件为中心的方法打破了复杂性障碍
Deep Vision的软件开发套件(SDK)和硬件紧密结合在一起,可以无缝地协同工作,
以最低的功耗确保最佳的模型精度。借助内置的量化器,模拟器和事件探查器,开发人员拥有支持计算复杂的推理应用程序设计和执行所需的所有工具。从历史上讲,在不进行大量代码开发的情况下将模型迁移到生产的过程一直具有挑战性。Deep Vision的SDK还支持无摩擦的工作流程,从而实现了从培训模型到生产应用程序的低代码,自动化,无缝迁移过程。该SDK通过显着提高生产率并缩短整体上市时间,从而减少了昂贵的开发时间。
责任编辑:lq
-
处理器
+关注
关注
68文章
19155浏览量
229055 -
神经网络
+关注
关注
42文章
4762浏览量
100519 -
AI
+关注
关注
87文章
30072浏览量
268345
发布评论请先 登录
相关推荐
评论