0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA DOCA 1.3版本发布 元宇宙最火开发利器现身

电子麦克风 来源:电子发烧友网 作者:张迎辉 2022-07-12 07:14 次阅读
2022年上半年 NVIDIA DOCA 1.3版本发布,对于开发者们更好地使用DPU,尤其是新一代的英伟达BlueField DPU进行简单灵活的软件开发,有着更好的帮助。7月5日,英伟达的相关技术专家和首届NVIDIA DPU中国黑客松优秀开发者一起线上作了精彩的分享。

DOCA是 Data-Center-Infrastructur e-On-A-Chip-Architectur e的缩写,也就是“线上数据中心基础设施体系结构”。它是一个为BlueField DPU量身定做的软件开发平台,主要的目的是为开发者打造一个全面开放的开发平台,支持广大开发者可以在BlueField DPU上进行简单灵活的软件开发,让开发者可以快速地创建BlueField DPU,加速高性能的一些应用程序和服务。DOCA是依托于面向未来的API驱动的思维模式来构建的,可以让BlueField DPU硬件加速变得更加易用,从而实现非凡的数据中心的性能、效率,还有安全性。DOCA使开发者能够利用行业标准的API,在BlueField DPU上做快速的创建 应用程序和服务,类似于我们GPU上的CUDA,它能够解锁数据中心里的 创新功能, 并且能够更好地向下一代或者未来新一代BlueField DPU来做兼容性和进一步的持续支持。DOCA可以加快应用程序和服务的上市时间,让合作伙伴和客户在各自竞争领域里获得成功。并基于BlueField DPU服务场景发挥关键的灵魂作用,可以释放DPU的潜力。

英伟达网络技术专家崔岩先介绍了NVIDIA DOCA 的前几代软件版本的历史来源。

最早的DOCA 1.0是在2020年GTC秋季大会上,与BlueField-2 DPU一同发布的,后面持续演进到DOCA 1.1版本,更加完善了整个DOCA软件栈,提供了DOCA SDK、运行时、以及DOCA 服务。到了DOCA1.2版本,也就是在1.3之前使用的版本,在这个版本上更加加强了在零信任 分布式安全解决方案上的支持,直到我们这次5月份新发布的DOCA 1.3,它提供了121个新的API开发接口,也提供了一些全新和增强的功能,包括优化数据流插入的DOCA Flow库、 通信通道库、 正则表达式库、 我们App Shield SDK、 基于OVN的IPSec 加密的完全卸载,以及新增的一些DOCA服务,比如HBN,就是我们在DPU上实现了三层的路由功能。

从DOCA软件开发套件来看,它主要是为了来创建和构建应用程序所需的所有组件,包括驱动程序、抽象的API库、 各种开发工具、参考源代码、示例程序和开发所需相关的文档,现在到了DOCA 1.3版本,它已经是比较完善的软件栈,开发者可以轻松地基于这个软件栈在本地 BlueField DPU 上或X86的开发容器中 搭建开发环境,来快速地开发自己想要实现的应有程序或服务。

DOCA框架能够给开发者提供一个一致的开发体验,既可以统一访问BlueField DPU上各种硬件资源,从而简化网络存储安全和基础设施管理服务相关的开发,开发者也不用担心开发环境的 构建和 部署复杂程度,基本上DOCA是个即插即用 的方式,可以让开发者很容易地来使用这个软件栈。

同时,还为开发者提供了基于底层API抽象封装的高级API库,这样对于开发者来讲,可以大大地节省他的开发时间,更早或更快地来使大的开发应用投入到市场,获得更大的投资收益。当然,DOCA还提供了相应的容器化的DOCA服务,可以在BlueField DPU上直接进行部署,来提供相应的应用和解决方案。客户不需要在DOCA服务上再做进一步的开发。

在线上分享会,专家崔岩特别着重介绍了三个DOCA 1.3上的新功能或增强功能。

图:NVIDIA DOCA 1.3的主要新功能介绍

第一个要介绍的是正则表达式库,这个正则表达式也称为Regular Expression(RegEx),是许多脚本语言使用标准模式匹配的工具,有了它可以创建与文本模式匹配的一些过滤器,而不仅是单个单词或短语的匹配。正则表达式是专为高吞吐量、低延时、深度包检测的应用程序而设计,这些应用程序需要数据包,可以进行负载 检测和 异常 监测,通过正则表达式模式匹配字符串来实现相应的应用功能。这个正则表达式还可以做一个安全遥测的功能,可以在DOCA1.3上更好地提供一些安全方面的应用,比如 应用 识别、 入侵防御的系统、 URL的过滤、 文件的扫描、 深度数据包检测,以及App Shield的内存扫描。这些都会用到正则表达式库的相应功能,能为这些安全软件开发提供底层的API支持。

第二个需要强调的或者需要介绍的,是我们基于OVN的数据路径加密功能。在我们之前的1.2版本 能将主机内的IPsec相应的功能卸载到DPU之上,构建 IPsec的控制平面,在vSwitch 控制平面上实现 IPsec加密和解密。新的增强版本上,我们把这个功能相当于扩展到整个OVN范畴之内,不同主机之间都可以用这个IPsec的方式来创建不同的通道,进行数据的加密,保证数据在不同主机之间传递的时候,它是一个加密的状态。当这个数据达到某个主机时,DPU会把它解密成明文,把这些明文数据再传递给主机侧来为 业务应用 提供数据。这是OVN数据路径加密的,在DOCA1.3上的一个新增功能。

最后一个要介绍的是DOCA基于主机的网络,我们简称为“HBN”。这个功能是在NVIDIA BlueField DPU上基于主机的网络上可以进行管理和监控同一节点上虚拟机和容器之间的流量,也就是说我们在一个服务器主机上可能创建了多个虚拟机或多个容器,在它们之间会有一些数据流量,不仅是转发二层数据流量,还要实现三层 路由 功能,我们也把它实现在了BlueField的DPU之上,通过基于主机网络的DOCA服务。而且它还可以做加密和解密,进行节点流量的监控,同时也会把一些原来是依赖以TOR交换机上面的功能也在DPU上面得到了实现,这种方式会彻底改变客户构建和思考整个数据中心网络构建的方式。

随着BlueField DPU智能化程度的提高,在整个网络里把功能都会集中在BlueField DPU之上去做相应的实现,这样就会降低对TOR交换机的相关要求,BlueField DPU还可以 提供一个隔离的环境,这样可以做更好的安全性的部署。

归根到底,基于主机的网络HBN它是一个DOCA的服务,像我前面介绍的那样,它实际不需要客户再在上面做过多的开发,直接就可以通过容器的方式可以直接在BlueField DPU上面做部署,通过作为BGP的路由器来使用,可以做主机内的虚拟机或容器之间的三层数据转发路由,也可以对主机外相应的其他节点上的数据进行三层转发,使二层网络和三层网络都得以扩展。当然,也会扩展到云计算里多租户的环境之下。

在整个BlueField DPU上实现了这些动态的路由协议之后,可以大大地加速整个网络数据流量处理性能,同时BlueField DPU还可以提供相应的安全保障,这是HBN会给BlueField DPU和未来客户在数据中心网络部署的时候会带来全新的方式。

分享会上首届NVIDIA DPU中国黑客松亚军团队、优秀开发者代表胡效赫也很高兴地分享了他及其团队 使用DOCA 的开发经验与心得。

胡效赫是一位来自高校的DPU开发者,其黑客松参赛团队是由一位博士后和两位博士生组成的,研究方向是云计算和分布式系统。“从2020年NVIDIA发布BlueField DPU开始,我们就在关注相关的学术界和业界的信息。今年通过微信上的活动推送,我们得知并有机会参与了首届NVIDIA DPU中国黑客松,并获得了亚军。”

图:胡效赫(右一)所在的亚军团队的参赛过程中的记录

图:黑客松参赛项目的开发设计图

图:系统运行结果的示意图

在开发过程中通过专家的指导充分地了解了DPU的硬件特性,DOCA良好的可编程性让开发者可以快速实现并验证创新的想法。同时开发者也可以对DOCA的API进行深度、定制化开发,实现更好的性能和更丰富的功能。

胡效赫介绍说:“我们开发团队提出了DeepTrace项目,面向DPU驱动的基础设施的网包级函数粒度业务可观测性。我们以DOCA提供的网流及粗粒度可观测性为基础,对应的是DOCA中的Netflow API库,结合DPU的高性能网络处理功能,对应的是DPU的ASAP2网包分类引擎,以及DOCA中的Flow API库,以及数据平面和控制平面的可编程能力,将可观测性的力度提升至网包级,并精确到每个函数功能。同时,我们也做到了几乎可以忽略不计的性能损耗。”

“通过DOCA和项目开发来具体介绍我们是如何创新地设计DeepTrace项目的。业务流量首先经过DeepTrace预选器,再经由原始的GPU程序进行处理,在D PU程序中会调用DeepTrace的触发器来实现相应点位的观测,然后被观测的数据会被汇总收集至分析器,通过数据的重组和分析得到相应的结果,比如得到异常流量的检测以及业务问题的定位等。基于DOCA开发DeepTrace的整体编程模式和在CPU上进行DPDK网络功能的开发功能类似,这种模式提高了我们的开发效率。”

“具体来看,其中触发器部分的挑战是如何以最小的代价收集链式函数和网包的信息,我们采用的方案是以统一化、轻量化的函数内触发器实现,具体在开发过程中,我们将DOCA的NetFlow库修改为网包粒度,而需要观测的函数以API的形式调用触发器即可。”

“在预选器部分的挑战是如何处理大规模原始流量,并在函数链中记录网包。我们采用的方案是通过硬件卸载的预选器进行标记和过滤。具体在开发过程中我们调用DOCA的Flow库配置所需预选的颗粒 规则即可实现,因为预选功能实际由硬件卸载完成。所以,方案带来的性能损耗几乎可以忽略不计划。在分析器部分,我们由运行在ARM控制平面的开源开放工程实现。”
对于DOCA 开发者免费使用 卓越中心的DOCA开发环境的开放时间和规则,主办方也在线上作了解释。具体可以参考以下的两张PPT截图,供NVIDIA的DPU开发者参考。

卓越中心的运营方仍然还是之前所授权的两家公司:丽台信息和信弘智能科技。

NVIDIA网络与AI产品最新进展,元宇宙最火的硬件平台原来是它!

NVIDIA网络市场总监孟庆也在分享会上顺便介绍了一下公司网络产品最新进展,包括在众多开源联盟参与标准建设、开放网络软件等方面的进展,以及NVIDIA成为Linux基金会OPI项目创始成员等。

也提到了NVIDIA在全球Top 500超级计算机互连中占主导地位的成就,如上图所示。有197个 Top 500强系统中采用了NVIDIA InfiniBand 网络。

图:NVIDIA SPECTRUM-4以太网平台

孟庆还介绍了Spectrum-4 400Gbps 端到端以太网平台,其中包括 Spectrum-4 交换机、ConnectX-7智能网卡、BlueField-3 DPU及相关软件可以有力支撑炙手可热的元宇宙(Omniverse) 。“在数字孪生里,Omniverse标准的OVX SuperPod,我们采用的方案必须得是Spectrum-4 400G这套网络平台这样才能更好的实现您所需的数字孪生,由数字人-数字机器-物理世界做相应的互联,”孟庆说。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4940

    浏览量

    102818
  • 元宇宙
    +关注

    关注

    13

    文章

    1388

    浏览量

    11337
收藏 人收藏

    评论

    相关推荐

    NVIDIA DOCA-OFED的主要特性

    NVIDIA DOCA 软件平台释放了 NVIDIA BlueField 网络平台的潜力,并为NVIDIA BlueField和ConnectX设备提供了所需的所有主机驱动程序。
    的头像 发表于 11-09 13:50 182次阅读

    NVIDIA Parabricks v4.3.1版本的新功能

    会(ESHG)上发布,其加入了新的体细胞数据变异检测功能,并将业内领先的工具升级到最新版本。这个版本是继在 NVIDIA GTC 2024 大会上
    的头像 发表于 09-10 10:22 342次阅读
    <b class='flag-5'>NVIDIA</b> Parabricks v4.3.1<b class='flag-5'>版本</b>的新功能

    NVIDIA JetPack 6.0版本的关键功能

    NVIDIA JetPack SDK 支持 NVIDIA Jetson 模块,为构建端到端加速 AI 应用提供全面的解决方案。JetPack 6 通过微服务和一系列新功能,扩展了 Jetson 平台的灵活性和可扩展性,是 2024 年截至目前下载量最高的 JetPack
    的头像 发表于 09-09 10:18 340次阅读
    <b class='flag-5'>NVIDIA</b> JetPack 6.0<b class='flag-5'>版本</b>的关键功能

    IB Verbs和NVIDIA DOCA GPUNetIO性能测试

    NVIDIA DOCA GPUNetIO 是 NVIDIA DOCA SDK 中的一个库,专门为实时在线 GPU 数据包处理而设计。它结合了 GPUDirect RDMA 和 GPUD
    的头像 发表于 08-23 17:03 504次阅读
    IB Verbs和<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> GPUNetIO性能测试

    芯科科技发布Matter Simplicity SDK Extension v2.3.0版本

    Extension v2.3.0版本,通过软件更新来帮助开发人员基于Simplicity Studio加速构建Matter 1.3应用程序。新版本SDK支持面向Thread和Wi-F
    的头像 发表于 08-20 14:24 590次阅读

    Matter进化至1.3版本!支持更多芯片平台、终端,产业链玩家加速布局

    电子发烧友网报道(文/莫婷婷)距离2022年发布Matter1.0版本后,Matter标准在2年后已经进化到Matter 1.3版本。今年5月,连接标准联盟(CSA)
    的头像 发表于 07-09 00:21 3337次阅读
    Matter进化至<b class='flag-5'>1.3</b><b class='flag-5'>版本</b>!支持更多芯片平台、终端,产业链玩家加速布局

    联想发布国内首个软硬一体宇宙平台:联想晨星宇宙平台

    在科技浪潮翻涌的当下,宇宙的概念正在逐渐从科幻走向现实。近日,在备受瞩目的2024年上海MWC大会上,联想集团凭借其前瞻性的科技视野和深厚的研发实力,正式发布了国内首个软硬一体的
    的头像 发表于 07-01 10:46 699次阅读

    借助NVIDIA DOCA 2.7增强AI 云数据中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架为开发者提供了丰富的库、驱动和 API,以便为 NVIDIA BlueField DPU 和 SuperNIC 创建高性能的应用程序和服务。
    的头像 发表于 05-29 09:22 462次阅读

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    作为专为 NVIDIA® BlueField® 网络平台而设计的数据中心基础设施软件框架,NVIDIA® DOCA™ 使广大开发者能够利用其行业标准 API 在
    的头像 发表于 02-23 10:02 431次阅读

    鸿蒙原生应用服务实战-发布时多设备选择注意事项

    在可公开可获取DevEco Studio最新版本,Stage模型ArkTSAPI9开发服务HarmonyOS4现不支持平板等;但是服务在发布
    发表于 02-21 10:22

    NVIDIA TAO 5.2版本发布

    NVIDIA TAO 提供了一个低代码开源 AI 框架,无论你是初学者还是专业的数据科学家,都可以使用该框架加速视觉 AI 模型开发开发者现在可以利用迁移学习的强大功能和效率,通过调整和优化等措施,以史无前例的速度实现一流的准
    的头像 发表于 01-03 10:11 593次阅读

    NVIDIA DOCA 2.5 长期支持版本发布

    开放的软件开发套件和运行环境,同时驱动 NVIDIA DOCA 开发者社区和生态合作的长足发展。 此次发布
    的头像 发表于 12-26 18:25 387次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.5 长期支持<b class='flag-5'>版本</b><b class='flag-5'>发布</b>

    中国宇宙论坛暨常孝宇宙发布会即将在京举行

    中国宇宙论坛暨常孝宇宙发布会将于2024年1月9日在北京科技会堂盛大开启。本次论坛汇聚业内顶尖专家、学者和企业代表,共同探讨中国
    的头像 发表于 12-25 15:58 295次阅读

    工业宇宙与数字孪生的爱恨情仇

    数字孪生宇宙
    dianliang02
    发布于 :2023年12月13日 16:54:51

    宇宙,但可不能“起火”哦!--了解一下村田半固态凝胶软包电池

    宇宙,但可不能“起火”哦!--了解一下村田半固态凝胶软包电池
    的头像 发表于 12-06 16:43 559次阅读
    <b class='flag-5'>元</b><b class='flag-5'>宇宙</b>要<b class='flag-5'>火</b>,但可不能“起火”哦!--了解一下村田半固态凝胶软包电池