基于 ODLA 的异构 AI 硬件对接方案介绍-电子发烧友网

在刚刚结束的 2020 云栖大会上，阿里云宣布对行业开源业界首个深度学习开放接口标准 ODLA（Open Deep Learning API）。阿里云在今年 5 月份的 OCP 全球峰会上首次对外公布 ODLA 接口标准，并宣布已率先在 Graphcore 等生态伙伴上获得支持。IPU 是 Graphcore 为机器智能从零设计的 AI 处理器，通过 ODLA 接口，开发者可以在 IPU 上快速跑通 AI Matrix 的各类模型。

基于 ODLA 的异构 AI 硬件对接方案介绍

张伟丰博士在 2020 OCP 全球峰会上公布 ODLA 接口标准

ODLA 是一个为加速深度学习的统一异构硬件编程接口。ODLA 规范了深度学习计算任务的定义和执行，实现上层应用和底层异构硬件平台的解耦，让 AI 异构计算更简单，实践代码“生成一次，随时链接，随处执行”的愿景。

“令人兴奋的新应用程序意味着我们对数据中心的期望比以往任何时候都要更高。我们希望通过使用更广泛的硬件选择，以更大的规模，扩大操作类型范围。ODLA 使我们能够管理这种复杂性，并挖掘出这些出色的新技术的全部潜力。”Graphcore 高级副总裁兼中国区总经理卢涛表示。

阿里云开发 ODLA 是为了解决异构计算中存在许久的一个核心挑战。ODLA 是轻量高效的异构硬件统一接口标准，可在异构计算环境中实现效率最大化。在异构计算环境中，软件框架需要从专业芯片中获得最高性能，需要多种类型处理器在一个通用平台上协同工作，而每种处理器都需要针对其架构和专业知识领域进行某种程度的优化，例如 AI 的稀疏性。API 提供的抽象级别可以适应芯片架构之间的差异。

基于 ODLA 的异构 AI 硬件对接方案

通过 ODLA，在 Graphcore IPU 上技术适配和应用部署的工作量可以实现大幅度降低，且实现效率大幅提升。另外，通过 ODLA 可以更好的与 AI 计算框架进行软硬协同，快速利用现有的编译优化技术，达到最佳性能。对于异构任务，ODLA 充当该系统范围通用语言与特定于架构的优化之间的接口或转换器，该优化可从 Graphcore 的 IPU 等设备实现最佳性能。

对于数据中心运营商而言，除了简化了新微处理器技术的集成之外，ODLA 还带来了其他一系列好处。它支持通用和高性能的数据中心设置，并为高级应用程序提供统一的加速框架。对于应用程序开发人员来说，它减少了对不同架构进行重复优化的需求，并应该可以减少开发成本，缩短产品上市时间。

ODLA 在 2020 云栖大会上宣布的主要特性及优势包含：

透明接口层，零损耗。

接口抽象和统一，软硬件解耦：通过面向 AI 的多粒度算子抽象，定义统一的接口，解耦具体软硬件，平滑迁移业务；实现代码复用，提升开发和部署效率。

多模态执行方式：支持多种执行模式，覆盖解释执行、编译执行、载入预编译代码等场景，兼容各种硬件的运行模式。

AI 全场景支持：支持推理和训练，适配云、边、端全场景 AI 业务；拥有广泛的算子定义和丰富的接口（设备管理、会话管理、执行管理、事件同步 / 异步、资源查询、性能监控等）。

卓越的扩展性，支持 AI 芯片厂家独特属性和自定义算子。

张伟丰博士在云栖大会上宣布开源 ODLA

Graphcore 公司相信，IPU 将成为下一代数据中心 AI 工作负载的核心。我们深知，我们的愿景需要 ODLA 在内的诸多框架和工具，这些框架和工具能使我们的产品与其他同类最佳技术协同工作。

Graphcore 的联合创始人兼首席执行官 Nigel Toon 表示：“ODLA 优雅地满足了 Graphcore 新用户的两个最大需求。一是他们希望轻松地将我们的技术集成到现有的数据中心，二是他们希望确保最终的设置在从各个组件到整个系统的每个层级都能得到高度优化。”
责任编辑:pj

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

处理器

处理器

+关注

关注
68

文章
19165

浏览量
229124
AI

AI

+关注

关注
87

文章
30146

浏览量
268411
阿里云

阿里云

+关注

关注
3

文章
940

浏览量
42964

AI 识别 - 基于恩智浦 MCX N947 实现咖啡胶囊识别方案介绍

AIChatGPT

大大通

发布于 :2024年11月12日 14:07:30

汽车异构硬件平台开发如何进行静态代码分析

随着汽车软件开发复杂度的提升，异构硬件平台的应用已成为必然趋势。多编译器环境的引入不仅是技术发展的自然产物，更是解决日益增长的功能需求和技术挑战的有效途径。在此背景下，Helix QAC 作为一款

发表于 10-09 16:15 •453次阅读

汽车<b class='flag-5'>异构</b><b class='flag-5'>硬件</b>平台开发如何进行静态代码分析

深蕾半导体ASTRA AI详细介绍

ASTRA AI芯片是一种集成了多种计算单元（包括NPU/uNPU、GPU、CPU、DSP等）的异构计算系统级芯片（SOC），专为处理复杂的人工智能（AI）任务而设计。这种设计使得ASTRA

发表于 09-12 16:49 •293次阅读

浅谈国产异构双核RISC-V+FPGA处理器AG32VF407的优势和应用场景

任务优化计算资源，提高整体计算效率。灵活性与可扩展性： FPGA的灵活性允许用户根据需求重新配置硬件逻辑，实现高度定制化的解决方案。结合RISC-V的开放架构，用户可以更容易地根据应用需求调整

发表于 08-31 08:32

开启全新AI时代智能嵌入式系统快速发展——“第六届国产嵌入式操作系统技术与产业发展论坛”圆满结束

操作系统标准化的最新进展。华为计算产业战略规划总监周明耀在论坛上做了“华为在AI软硬件上积累及生态战略”专题报告。周明耀介绍华为计算产业在AI软硬

发表于 08-30 17:24

安谋科技异构算力组合，破局生成式AI算力挑战

近日，此芯科技集团有限公司（以下简称“此芯科技”）AI PC战略暨首款芯片发布会在上海举行，正式推出了其首款专为AI PC打造的异构高能效芯片产品——“此芯P1”。作为国产新一代AI

发表于 08-13 09:12 •517次阅读

安谋科技异构算力赋能AI计算，此芯科技首款AI PC芯片发布

7月30日，此芯科技集团有限公司（以下简称“此芯科技”）AI PC战略暨首款芯片发布会在上海举行，正式推出了其首款专为AI PC打造的异构高能效芯片产品——“此芯P1”。作为国产新一代AI

发表于 07-31 14:36 •1002次阅读

异构混训整合不同架构芯片资源，提高算力利用率

的解决方案。通过混合使用多种异构芯片，可以充分利用不同芯片的优势，提高算力利用率，降低算力成本，并推动AI技术的广泛应用。异构混训能够整合不同架构芯片资源在2024年世界人

发表于 07-18 00:11 •3353次阅读

开发者手机 AI - 目标识别 demo

。 NNRt host 实现了NNRt HDI接口功能，通过对接底层AI芯片接口为上层应用提供NPU硬件推理的能力。功能实现 JS从相机数据流获取一张图片，调用Native的接口进行目标识别的处理

发表于 04-11 16:14

迈尔微视重磅推出高精度对接相机M4 Mega

为移动机器人、人形机器人货物抓取、高精度对接提供3D视觉+AI一体化解决方案。

发表于 03-19 10:14 •685次阅读

高通NPU和异构计算提升生成式AI性能

异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担，需要配备不同的处理器，如专注于AI工作负载的定制设计的NPU、CPU和GPU。

发表于 03-06 14:15 •733次阅读

CES AI硬件层出不穷:你愿为AI的溢价买单吗?

硬件AI

电子发烧友网官方
发布于 :2024年01月30日 16:36:00

燧原科技与青云科技达成战略合作，创新异构算力调度

NEWS 燧原科技与青云科技日前达成战略合作，携手创新算力异构资源池的灵活调度，共建支持场景落地的AI算力生态，为AI应用快速落地、AI算力普惠提供驱动力。人工智能技术的发展正在步入

发表于 12-11 12:20 •615次阅读

异构专用AI芯片的黄金时代

异构专用AI芯片的黄金时代

发表于 12-04 16:42 •599次阅读

什么是异构集成？什么是异构计算？异构集成、异构计算的关系？

异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部，以增强功能性和提高性能。

发表于 11-27 10:22 •7037次阅读