0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA BlueField DPU编译应用程序的不同方法

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-04-25 11:51 次阅读

第一步

第二步

去喝杯咖啡…

第三步

您在说明书中常常看到“去喝杯咖啡”吗?作为一名开发人员,我很早就发现这种令人生厌的俏皮话是我生活中的祸根。无论持续时间长短,进程切换(Context Switches)在应用程序开发周期中都是一项高昂的成本。在所有需要您离开的步骤中,等待应用程序编译是最难摆脱的。

当我们进入 NVIDIA BlueField DPU 应用程序开发的新世界,有效地设置构建步骤非常重要,以便您能够无缝地编码→编译→单元测试。在本文中,我介绍了 DPU 编译应用程序的不同方法。

DOCA 数据平面插件的 FRR

(Free Range Routing)

在 DPU 应用程序开发系列文章中,我谈到了在 FRR 中创建 DOCA 数据平面插件以用于卸载策略。FRR 的代码行数接近 100 万行( 789678 SLOC ),这使得它成为衡量构建时间的绝佳候选。

直接在 BlueField DPU 上开发

DPU 具有 Arm64 架构,一种快速启动 DPU 应用程序的方法就是直接在 DPU 上开发。本测试使用具有 8G RAM 和 8 个 A72 CPU 内核的 NVIDIA BlueField2 DPU 。

我安装了 BlueField 引导文件( BFB ),它为 DPU 提供 Ubuntu 20.04.3 操作系统映像。它还包括 DOCA 1.2 和 DPDK 20.11.3 库。为了使用 DOCA 库构建应用程序,我将 DPDK pkgconfig 位置添加到 PKG_CONFIG 路径。

3ff97b74-c3bb-11ec-bce3-dac502259ad0.png

接下来,我通过克隆 FRR 在 DPU 上设置了我的代码工作区,并切换到 DOCA 数据平面插件。

40077706-c3bb-11ec-bce3-dac502259ad0.png

FRR 需要一个不断发展的先决条件列表,这些先决条件列举在FRR 社区文档中。安装了这些依赖项后,我将 FRR 配置为包括 DPDK 和 DOCA 数据平面插件。

4012c0b6-c3bb-11ec-bce3-dac502259ad0.png

当我使用 DPU 作为我的开发环境时,我构建并安装了 FRR 二进制文件:

401ec5fa-c3bb-11ec-bce3-dac502259ad0.png

以下是构建时间的表现。我用多种方法来衡量:

  • 使用make -j12 allmake install构建和安装二进制文件的时候

  • 使用dpkg-buildpackage –j12 –uc –us将它们组装成 Debian 软件包来构建相同二进制文件的时候

第一种方法用于编码和单元测试。第二种生成 deb 的方法需要与其他外部开发环境上的构建时间进行比较。


402994b2-c3bb-11ec-bce3-dac502259ad0.png

表 1 . DPU Arm 构建时间

时间上的差异是意料之中的。生成一个包需要几个额外的步骤。

使用 DPU 作为开发环境有一些明显的优势:

  • 您可以在不离开工作区的情况下进行编码、构建和安装,然后进行单元测试。

  • 您可以针对增量代码更改来优化构建。

与完整构建(Complete make)相比,最后一个选择通常可以大幅缩短构建时间。例如,我在 FRR 中修改了 DOCA 数据平面代码,并重建的结果如下:

4035d31c-c3bb-11ec-bce3-dac502259ad0.png

虽然这可能会让事情变得更简单,但它需要为每个开发人员无限期的保留 DPU ,仅用于应用程序开发或维护。您的开发环境可能还需要更多的内存和性能,因此长期来看,这是一个不太可行的选择。

在 x86 服务器上开发

我的 BlueField-2 DPU 由一台 x86-64 Ubuntu 20.04 服务器托管,我将这台服务器用于我的开发环境。

40428dfa-c3bb-11ec-bce3-dac502259ad0.png

在本例中,构建机器是 x86 ,应用程序将运行的主机是 DPU-Arm64 。有几种方法可以做到这一点:

  • 在 x86 构建机器上使用 Arm 仿真。提供的 DOCA 开发容器作为 DOCA 软件包的一部分。

  • 使用交叉编译工具链。

在这个测试中,我使用了第一个选项,因为它是最简单的。第二个选项可以提供不同的性能,但创建该工具链有其挑战。

我在x86 服务器上下载并加载了bfb_builder_doca_ubuntu_20.04容器,并启动了它。

405b5196-c3bb-11ec-bce3-dac502259ad0.png

DOCA 和 DPDK 库预先安装在这个容器中,我只需要将它们添加到PKG_CONFIG路径。

4071c8fe-c3bb-11ec-bce3-dac502259ad0.png

我在容器中设置了工作区和 FRR 先决条件,与前面的选项相同。

407da5c0-c3bb-11ec-bce3-dac502259ad0.png

我可以在这个 DOCA 容器中构建我的应用程序,但我无法对其进行测试。因此,必须将 FRR 二进制文件构建并打包到 deb 中,然后将其复制到 BlueField DPU 进行测试。我设置了 FRR Debian 规则,以匹配前面选项中使用的 FRR 构建配置,并生成了软件包:

408ec22e-c3bb-11ec-bce3-dac502259ad0.png

表 2 显示了构建时间与以前方法的比较:

409fc59c-c3bb-11ec-bce3-dac502259ad0.png

表 2 . DPU Arm 和 X86 构建时间

构建时间的大幅增加让我感到惊讶,因为我有一台充足 x86 资源的服务器,而且没有 Docker 限制。因此,将 CPU 和 RAM 用于解决问题似乎并不总是有帮助的!这种性能下降是因为跨体系结构造成的,正如您在下一个选项中看到的那样。

在 AWS Graviton 实例中开发

接下来,我尝试在 Arm 上构建我的应用程序,但这次是在性能更大的外部服务器上。为此,我使用了 Amazon EC2 Graviton 实例,其规格与我的 x86 服务器相当。

  • Arm 64 arch , Ubuntu 20.04 操作系统

  • 128G 内存

  • 32 vCPU

40ac6a86-c3bb-11ec-bce3-dac502259ad0.png

为了在这个实例中设置 DOCA 和 DPDK 库,我安装了 DOCA SDK repo meta 包。

40c0407e-c3bb-11ec-bce3-dac502259ad0.png

克隆和构建 FRR Debian 软件包的其余步骤与前面的选项相同。

表 3 显示了构建在 AWS Arm 实例上的运行情况:

40cfa712-c3bb-11ec-bce3-dac502259ad0.png

表 3 . DPU Arm 、X86 和 AWS Arm 的构建时间

这是一个明显的赢家,不需要咖啡。

图 1 显示了这些环境中的编译时间。

40e8399e-c3bb-11ec-bce3-dac502259ad0.png

图 1 . 具有不同选项的 FRR 构建时间

总结

在本文中,我讨论了 DPU 应用程序的几个开发环境:

  • BlueField DPU

  • x86 服务器上的 DOCA 开发容器

  • AWS Graviton 计算实例

你可以直接在 DPU 上对您的应用程序进行原型设计,在 x86 DOCA 开发容器中进行开发实践,然后用 DOCA 获取一个 AWS Graviton 实例,使其高速运行!

原文标题:为 NVIDIA BlueField DPU 应用程序选择开发环境

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4841

    浏览量

    102689
  • DPU
    DPU
    +关注

    关注

    0

    文章

    353

    浏览量

    24091
  • 应用程序
    +关注

    关注

    37

    文章

    3232

    浏览量

    57535

原文标题:为 NVIDIA BlueField DPU 应用程序选择开发环境

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    linux驱动程序编译方法是什么

    Linux驱动程序编译方法主要包括两种: 与内核一起编译编译成独立的内核模块 。以下是对这两种
    的头像 发表于 08-30 14:46 331次阅读

    linux驱动程序编译方法有哪两种

    Linux驱动程序编译方法主要可以归纳为两种: 手动编译 和 使用内核构建系统(Makefile)自动编译 。 1. 手动
    的头像 发表于 08-30 14:39 433次阅读

    NVIDIA BlueField-3 DPU助力思科提高工作负载安全性和运营效率

    、位置和外形尺寸的应用程序工作负载。 思科最近发布了Cisco Secure Workload 3.9 版,将企业的安全性和运营效率提升到了新的水平。它提供了新的功能来缓解威胁和漏洞,并为部署微分段(microsegmentation)提供了更大的灵活性。它现在还扩展到NVIDI
    的头像 发表于 06-27 17:31 697次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高性能的
    的头像 发表于 05-29 09:22 432次阅读

    NVIDIA DPU编程入门开课仪式在澳门科技大学成功举办

    5 月 24 日,NVIDIA DPU 编程入门开课仪式在澳门科技大学成功举办。作为首个在中国开设 NVIDIA DPU 编程相关课程的高校,来自澳门科技大学不同院系的师生共同见证了本
    的头像 发表于 05-28 09:40 342次阅读

    使用Docker部署Go Web应用程序步骤

    大多数情况下Go应用程序编译成单个二进制文件,web应用程序则会包括模版和配置文件。而当一个项目中有很多文件的时候,由于很多文件没有同步就会导致错误的发生并且产生很多的问题。
    发表于 04-20 09:33 459次阅读
    使用Docker部署Go Web<b class='flag-5'>应用程序</b>步骤

    【从0开始创建AWTK应用程序编译应用到RTOS平台

    AWStudio上编写好AWTK应用程序后,部署到RTOS平台(如STM32)是很方便的,下面就以STM32F429型号为例子来介绍如何编译AWTK应用到RTOS
    的头像 发表于 03-21 08:23 536次阅读
    【从0开始创建AWTK<b class='flag-5'>应用程序</b>】<b class='flag-5'>编译</b>应用到RTOS平台

    应用程序中的服务器错误怎么解决?

    在使用应用程序时,可能会遇到服务器错误的问题。这种错误通常会导致应用程序无法正常运行 ,给用户带来不便。下面将介绍应用程序中的服务器错误及其解决方法,帮助您快速解决这一问题。
    的头像 发表于 03-12 15:13 5412次阅读

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    网络平台上快速创建应用程序和服务,并启用 NVIDIA BlueField DPUNVIDIA
    的头像 发表于 02-23 10:02 411次阅读

    如何构建linux开发环境和编译软件工程、应用程序

    前文介绍了如何使用官方提供的镜像文件启动开发板,本文将说明如何构建linux开发环境和编译软件工程、应用程序
    的头像 发表于 01-03 12:31 1847次阅读
    如何构建linux开发环境和<b class='flag-5'>编译</b>软件工程、<b class='flag-5'>应用程序</b>

    NVIDIA DOCA 2.5 长期支持版本发布

    基础设施开发者的全面软件框架,NVIDIA DOCA 已被领先的云服务提供商、企业和 ISV 创新者所采用,为开发、优化和部署基于 NVIDIA BlueField 系列产品的加速应用程序
    的头像 发表于 12-26 18:25 362次阅读
    <b class='flag-5'>NVIDIA</b> DOCA 2.5 长期支持版本发布

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    同时介绍了DPU开发: 命令行DPU板卡设置 基于qemu的DPU应用模拟开发(基于DPU的arm64处理器平台) DPU各个模块检查及加
    发表于 12-24 10:54

    《数据处理器:DPU编程入门》读书笔记

    AI、机器学习、安全、电信和存储等应用,并提升性能,减轻虚拟化Hypervisor的工作负载。同时,它还具备开放性集成功能,未来支持更多功能集成。NVIDIADPU还提供统一的面向各种应用的编程接口
    发表于 12-21 10:47

    《数据处理器:DPU编程入门》+初步熟悉这本书的结构和主要内容

    浪费等问题。DPU将数据处理和网络功能集成到同一块硬件中,可以实现更高效的数据处理和传输,同时减少系统复杂性和资源开销。这种集成可以提供更低的延迟和更高的吞吐量,从而改善应用程序性能和用户体验。 2
    发表于 12-08 18:03

    【从0开始创建AWTK应用程序编译应用到嵌入式Linux平台运行

    。搭建Linux平台交叉编译环境在上一篇文章我们介绍了使用AWTK开发简单的应用并在PC上模拟运行,本篇文章就来介绍一下怎么让应用程序运行在嵌入式Linux平台上。1
    的头像 发表于 12-07 12:08 629次阅读
    【从0开始创建AWTK<b class='flag-5'>应用程序</b>】<b class='flag-5'>编译</b>应用到嵌入式Linux平台运行