0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用NVIDIA操作符加速Kubernetes

星星科技指导员 来源:NVIDIA 作者:Troy Estes 2022-04-11 16:13 次阅读

Kubernetes 是一个开源的容器编排系统,用于自动化计算机应用程序部署、扩展和管理。它是一个非常流行的工具,可以用于自动展开和回滚、水平扩展、存储编排等。对于许多组织来说, Kubernetes 是其基础架构的关键组件。

安装和扩展 Kubernetes 的一个关键步骤是确保它正确利用基础设施的其他组件。 NVIDIA 运营商优化 Kubernetes 上的 GPU 和 NIC 的安装和管理,使软件堆栈能够在云中运行最需要资源的工作负载,如 AI 、 ML 、 DL 和 HPC ,数据中心和边缘。 NVIDIA 运营商由 GPU 运营商和网络运营商组成,是开源的,基于运营商框架。

NVIDIA GPU 运算符

NVIDIA GPU 操作符被打包为一个 Helm 图表,并安装和管理软件组件的生命周期,以便 GPU 加速的应用程序可以在 Kubernetes 上运行。这些组件包括 GPU 功能发现、 NVIDIA 驱动程序、 Kubernetes 设备插件、 NVIDIA 容器工具包和 DCGM 监控。

GPU 操作符使基础结构团队能够在集群级别与 Kubernetes 一起使用时管理 GPU 的生命周期,因此无需单独管理每个节点。以前,基础架构团队必须管理两个操作系统映像,一个用于 GPU 节点,另一个用于 CPU 节点。当使用 GPU 操作符时,基础设施团队也可以将 CPU 映像与 GPU 工作节点一起使用。

NVIDIA 网络运营商

网络运营商负责自动化 Kubernetes 集群中主机网络组件的部署和管理。它包括 Kubernetes 设备插件、 NVIDIA 驱动程序、 NVIDIA 对等内存驱动程序和 Multus 、 macvlan CNIs 。这些组件以前是手动安装的,但通过网络运营商实现了自动化,简化了部署过程,并通过增强的客户体验实现了加速计算。

单独或一起使用, NVIDIA 操作符简化了 Kubernetes 上的 GPU 和 SmartNIC 配置,并与合作伙伴云平台兼容。要了解有关这些组件的更多信息,以及 NVIDIA 操作员如何解决运行 AI 、 ML 、 DL 和 HPC 工作负载的关键挑战,并简化初始设置和第 2 天操作,请查看按需网络研讨会“ 用 NVIDIA Operators 加速 Kubernetes ”。

关于作者

Troy Estes 是 NVIDIA Edge 和企业计算解决方案的产品营销经理。在加入 Edge & Enterprise 业务部门之前,特洛伊曾在自主汽车业务部门和 NVIDIA 电网产品集团从事营销活动和支持产品 GTM 。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4934

    浏览量

    102795
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128686
  • 计算机
    +关注

    关注

    19

    文章

    7415

    浏览量

    87707
收藏 人收藏

    评论

    相关推荐

    NVIDIA加速计算如何推动医疗健康

    近日,NVIDIA 企业平台副总裁 Bob Pette 在 AI Summit 一场演讲中重点谈论了 NVIDIA 加速计算如何推动医疗健康、网络安全和制造等行业实现转型。他表示,加速
    的头像 发表于 11-20 09:10 201次阅读

    NVIDIA AI正加速推进药物研发

    在当前的医疗健康领域,AI 的重要性愈发凸显。NVIDIA AI 正加速推进药物研发,致力于减少药物的研发时间和成本,使更多的老年患者能够更快获得关键治疗。
    的头像 发表于 11-19 16:07 134次阅读

    NVIDIA加速AI在日本各行各业的应用

    企业借助基于 NVIDIA AI Enterprise 与 Omniverse 工业 AI 构建的创新中心和服务加速 AI 转型。
    的头像 发表于 11-19 15:45 144次阅读

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 162次阅读

    逻辑异或运算在Python中的用法

    在Python编程语言中,逻辑异或运算并不直接作为一个内置的操作符存在,因为Python更侧重于高级编程和可读性,并没有直接提供异或运算的简写形式用于逻辑运算(真/假值的异或)。然而
    的头像 发表于 11-19 09:46 77次阅读

    鸿蒙原生应用元服务开发-仓颉基础数据类型整数类型

    (十进制)。 整数类型支持的操作 整数类型默认支持的操作符包括:算术操作符、位操作符、关系操作符、自增和自减
    发表于 09-13 14:55

    鸿蒙原生应用元服务开发-仓颉基础数据类型布尔类型

    let b: Bool = false 布尔类型支持的操作 布尔类型支持的操作符包括:逻辑操作符(逻辑非!,逻辑与 &&,逻辑或 ||)、部分关系操作符
    发表于 09-09 09:57

    c语言中从左到右结合怎么看

    在C语言中,操作符的结合性(Associativity)是指当操作符在表达式中连续出现时,它们如何与操作数结合的顺序。对于大多数二元操作符(即需要两个
    的头像 发表于 08-20 11:42 695次阅读

    NVIDIA 加速人形机器人发展

    开发者可以访问新的 NVIDIA NIM 微服务,用于 Isaac Lab 和 Isaac Sim 中的机器人仿真、OSMO 机器人云计算编排服务和远程操作数据捕获工作流等       丹佛
    发表于 07-30 09:15 710次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>加速</b>人形机器人发展

    FPGA学习笔记---基本语法

    3、信号类型:wire, reg, tri等 4、参数定义:parameter 5、运算操作符:各种逻辑操作符、移位操作符、算数操作符等 6、比较判断:if ... else, ca
    发表于 06-23 14:58

    HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 变革

    by HPE 包含了可持续的加速计算产品组合以及全生命周期服务,将简化 AI 创造价值的过程,加速生成式 AI 的发展步伐。 NVIDIA AI Computing by HPE 由 HPE 与
    的头像 发表于 06-21 14:39 326次阅读

    “+”操作符的使用技巧

    这篇写个平时易被忽略的小知识点,一元 + 操作符的使用技巧。
    的头像 发表于 12-28 13:27 507次阅读

    oracle中拼接字符串函数

    , string2) 其中,string1 和 string2 是需要连接的字符串参数。 除了 CONCAT 函数,Oracle 还提供了一些其他的字符串拼接函数和操作符,这些函数和操作符可以根据具体的要求和情况来
    的头像 发表于 12-06 09:49 2804次阅读

    NVIDIA 初创加速计划 Omniverse 加速

    的重要力量。基于 NVIDIA 全栈式 AI 计算平台和 Omniverse TM 平台上的生成式 AI 创作实践,让企业、开发者能够了解可落地的生成式 AI 内容创作技术及其技术趋势与当前边界。 NVIDIA 初创加速计划 是
    的头像 发表于 12-04 20:35 619次阅读
    <b class='flag-5'>NVIDIA</b> 初创<b class='flag-5'>加速</b>计划 Omniverse <b class='flag-5'>加速</b>营

    使用pandas进行数据选择和过滤的基本技术和函数

    Python pandas库提供了几种选择和过滤数据的方法,如loc、iloc、[]括号操作符、query、isin、between等等
    的头像 发表于 12-01 10:14 335次阅读
    使用pandas进行数据选择和过滤的基本技术和函数