0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达CTO谈DPU:这是我们的重中之重

北京芯沐源科技有限公司 来源: 北京芯沐源科技有限公司 作者: 北京芯沐源科技有 2022-08-19 11:19 次阅读

2019年,Michael Kagan在Mellanox Technologies 担任首席技术官,领导加速网络技术的开发 ,这是他和八位同事在 20 年前创立的一家公司。然后在 2020 年 4 月,英伟达以 70 亿美元的价格收购了该公司,Kagan接任了这家科技巨头的首席技术官——这是他梦寐以求的工作。

英伟达总部位于加州圣克拉拉,但Kagan在公司位于以色列的办公室工作。

在位于以色列 Yokneam Illit 的 Mellanox,Kagan 监督了用于云数据中心计算和存储的高性能网络的开发。该公司生产适配器、电缆和高性能交换机等网络设备,以及新型处理器 DPU。Kagan 说,该公司的高速 InfiniBand产品可以在世界上大多数最快的超级计算机中找到,其高速以太网产品也可以在大多数云数据中心中找到。

IEEE 高级成员现在的工作重点是整合丰富的 Nvidia 技术来构建加速计算平台,其基础是三个芯片GPUCPU 和 DPU,或数据处理单元。DPU 可以支持卸载、加速和隔离数据中心工作负载,从而减少 CPU 和 GPU 工作负载。

“在 Mellanox,我们致力于数据中心互连,但在 Nvidia,我们将最先进的计算连接成一个单一的计算单元:数据中心,”Kagan 说。互连用于连接多个服务器并将整个数据中心组合成一个巨大的计算单元。

“我可以访问并打开 Nvidia 技术的大门,”他说。“这就是让我的生活令人兴奋和有趣的原因。我们正在构建未来的计算。”

英特尔到 Mellanox

Kagan出生在俄罗斯的圣彼得堡——当时被称为列宁格勒。1975 年高中毕业后,他的家人搬到了以色列。与许多崭露头角的工程师一样,他的好奇心使他分解和重新组装东西以弄清楚它们是如何工作的。而且,由于家里有很多工程师,他说,从事工程职业是一个容易的决定。

他就读于以色列理工学院Technion,因为“它是世界上最好的工程大学之一,”他说。“我选择电气工程的原因是因为它被认为是 Technion 最好的专业。”

Kagan 于 1980 年毕业,获得电气工程学士学位。他于1983年加入位于以色列海法的英特尔,担任设计工程师,并最终搬到位于俄勒冈州希尔斯伯勒的公司办公室,在那里他从事 80387 浮点协处理器的工作。一年后,回到以色列后,Kagan 担任 i8060XP 矢量处理器的架构师,然后领导和管理 Pentium MMX 微处理器的设计。

在英特尔工作的 16 年中,他一路晋升为首席架构师。1999 年,他准备举家迁往加利福尼亚,在那里他将领导公司的一个备受瞩目的项目。然后,英特尔的前同事 Eyal Waldman 邀请 Kagan 加入他和其他五个熟人的行列,组建了 Mellanox。

他回忆说,Kagan几乎每周都拒绝加入初创公司的提议,但 Mellanox 及其联合创始人团队和远见吸引了他。他说,他认为这是一次“引人入胜的冒险,一个建立公司的机会基于我成长的核心价值观的文化:卓越、团队合作和承诺。”

他说,在他在那里的 21 年里,他没有后悔。

“这是我做过的最伟大的决定之一,”他说。“它最终使我生活的方方面面受益:专业、经济和所有的一切。”

Kagan 说,这家初创公司的突破性产品 InfiniBand 专为今天的云计算而设计。

“我们采用了 InfiniBand 的优点并将它们固定在标准以太网之上,”他说。“因此,我们成为了最先进的高性能计算网络供应商。500 强计算机公司中超过一半的机器使用 Mellanox 互连,现在是 Nvidia 互连。

“大多数云提供商,如 Facebook、Azure和阿里巴巴,都使用 Nvidia 的网络和计算技术。无论你在互联网上做什么,你最有可能通过我们设计的芯片运行。”

Kagan 表示,Mellanox 和 Nvidia 之间的合作是“自然的”,因为两家公司已经合作了近十年。

“我们作为独立公司提供了很多创新解决方案,”他说。

BlueField 和 Omniverse 超级计算机

过去两年,作为 Nvidia 的 CTO,Kagan 已经将他的关注点从单纯的网络转移到集成多种 Nvidia 技术,包括构建 BlueField数据处理单元和Omniverse实时图形协作平台。

他表示,英伟达对未来数据中心的愿景基于其三款芯片:CPU、DPU 和 GPU。

“这三个支柱与最初在 Mellanox 开发并在 Nvidia 进一步开发的非常高效和高性能的网络相连,”他说。

BlueField DPU 的开发现在是 Nvidia 的重中之重。它是一种芯片上的数据中心基础设施,针对高性能计算进行了优化。它还卸载、加速和隔离各种网络、存储和安全服务。

“在数据中心,你无法控制你的客户是谁,”Kagan说。“客户很可能是一个坏人,想要侵入他的邻居或你的基础设施。你最好通过让一个隔离的或不同的计算平台运行操作系统来将你自己和其他客户彼此隔离开来,这基本上是基础设施管理、资源管理和供应。”

Kagan 对 Omniverse 感到特别兴奋,这是一种新的 Nvidia 产品,它使用皮克斯的通用场景描述软件来创建虚拟世界——这就是众所周知的元宇宙。Kagan 将 3D 平台描述为“通过收集数据和对世界进行物理上准确的模拟来创造一个世界”。

汽车制造商正在使用 Omniverse 来试驾自动驾驶汽车。无需在各种条件下在不同类型的道路上实际驾驶汽车,而是可以生成有关虚拟世界的数据来训练 AI 模型。

“你可以创造汽车必须在现实世界中处理但你不希望它在现实世界中遇到的情况,比如车祸,”Kagan说。“你不想让汽车撞车来训练模型,但你确实需要让模型能够处理道路上的危险情况。”

Omniverse 平台可以生成数百万公里的合成驾驶数据,速度比实际驾驶汽车快几个数量级。

Kagan说,英伟达正在大力投资自动驾驶汽车技术。

该公司还在建造它所谓的最强大的气候科学人工智能超级计算机:Earth-2,地球的数字双胞胎。Earth-2 旨在持续运行模型以预测区域和全球层面的气候和天气事件。

Kagan说,气候建模技术将使人们能够尝试减缓全球变暖的技术,并了解它们在 50 年后可能产生的影响。

该公司还与医疗保健行业密切合作,开发基于人工智能的技术。它的超级计算机通过生成合成数据来帮助识别癌症,使研究人员能够训练他们的模型以更好地识别肿瘤。Kagan说,它的人工智能和加速计算产品还有助于药物发现和基因组研究。

“我们实际上正在以相当不错的速度前进,”他说。“但问题是,你总是需要重新改造自己,更快更好地完成新事物,并且基本上以你拥有的东西取胜,而不是寻找无限的资源。这就是承诺的意义。

声明:本文版权归原作者所有,转发仅为更大范围传播,若有异议请联系我们修改或删除

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    449

    文章

    48550

    浏览量

    413023
  • DPU
    DPU
    +关注

    关注

    0

    文章

    315

    浏览量

    24002
  • 英伟达
    +关注

    关注

    22

    文章

    3512

    浏览量

    88995
收藏 人收藏

    评论

    相关推荐

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL,并推出基于该架构的超级芯片GB200,将助推数据处理、工程模拟、电子设计自动化、计算机辅助
    发表于 05-13 17:16

    英伟新显卡起售近1.3万元

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年12月29日 16:56:52

    《数据处理器:DPU编程入门》DPU计算入门书籍测评

    , 数据加速应用实践 。 分别介绍了DPU技术和英伟DPU技术: DPU的诞生 现代计算架构及问题 数据解耦及大带宽数据应用
    发表于 12-24 10:54

    《数据处理器:DPU编程入门》读书笔记

    关注计算能力的提升,通信基础设施的提升跟不上,那么数据中心的整体系统性能依然受限,无法发挥出真正的潜力。DPU的提出背景就是应对这些数据量和复杂性的指数级增长。未来,需要将计算移至接近数据的位置,这是
    发表于 12-21 10:47

    英伟将在越南设法人实体

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年12月12日 10:29:04

    英伟HBM4预计2026年推出

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年11月27日 15:15:17

    英伟为何放不下中国?

    英伟行业资讯
    深圳市浮思特科技有限公司
    发布于 :2023年11月27日 15:11:09

    #英伟 #显卡 英伟全新旗舰显卡RTX 5090性能暴涨70%

    显卡英伟
    深圳市浮思特科技有限公司
    发布于 :2023年11月20日 14:19:25

    什么是DPU

    什么是DPU? 相信很多人对于CPU(中央处理器)已经非常熟悉了。灵活、响应迅速的CPU多年来一直是大多数计算机中唯一的可编程元件。 近年来,GPU(图形处理单元)逐渐成为了计算的中心。最初GPU
    发表于 11-03 10:55

    【书籍评测活动NO.23】数据处理器:DPU编程入门

    栈式计算公司,其拥有的数据中心规模产品服务正在重塑行业。 专家推荐 这是一本由浅入深介绍NVIDIA BlueField系列DPU及NVIDIA DOCA软件框架的入门书籍,内容覆盖了DPU及其编程
    发表于 10-24 15:21

    #消费级显示被禁止出口 英伟RTX 4090显卡遭遇下架风波

    英伟
    深圳市浮思特科技有限公司
    发布于 :2023年10月19日 15:58:35

    英伟市值下跌看半导体行业的风云变幻

    半导体英伟
    北京中科同志科技股份有限公司
    发布于 :2023年10月19日 09:38:56

    全新一代Jetson Orin Nano来袭,40TOPS超强算力,刷新你的想象! #Jetson #英伟

    英伟
    学习电子知识
    发布于 :2023年07月02日 13:27:15

    00032 Jetson TX2 NX开发者套件!TX2的性能,NANO的尺寸! #英伟 #jetson

    英伟
    学习电子知识
    发布于 :2023年07月02日 13:21:19