0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用AI与数据中心规模的加速计算相结合的强大指数级算力

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2021-11-15 14:14 次阅读

科学界和工业界正开始利用 AI 与数据中心规模的加速计算相结合的强大指数级算力

研究人员正在寻找能使他们的工作所需计算性能提升百万倍的“燃料”。

不断增长的数据导致计算需求飞涨。面对此情况,他们无法完全依靠已是明日黄花的摩尔定律。

因此,他们利用三大“推进器”,获取所需的指数级加速。

纵向加速和横向扩展

加速计算是科技的三大现代驱动力之一。在过去的十年中,借助五代 GPU 的进步以及我们在这些 GPU 之上构建的完整软件栈,加速计算已实现了 1000 倍性能提升。

扩展能力是第二个驱动力,已取得近十万倍的性能提升。这是因为数据中心正在成为新的计算单元。

例如,在 2015 年,使用一个 Kepler GPU 训练 ResNet-50(热门的计算机视觉模型之一)花了将近一个月的时间。今天,我们在 Selene 上训练同样的模型只用了不到半分钟的时间。Selene 是世界上性能超强的工业超级计算机,其包含数千个 NVIDIA Ampere 架构 GPU。

我们开发了许多关键技术来实现这种扩展,例如 Megatron 软件、用于多 GPU 和多节点处理的 Magnum IO,以及用于网络计算的 SHARP。

开启深度学习的新时代

当今时代的第三个,也是最具变革性的驱动力是 AI。

去年,深度学习在一毫秒的时间尺度内对 3.05 亿个原子进行了模拟,揭示了新冠病毒 SARS-CoV-2 的内部结构。这项工作标志着与 15 年前在 20 秒内对 100 万个原子进行模拟的最先进技术相比,其效能增加了 1000 万倍以上。

这就是 AI 和高性能计算的结合正在席卷科学界的原因。研究人员去年在 arXiv 上发表了近 5000 篇关于利用 AI+HPC 进行工作的论文,而五年前此类论文还不到 100 篇。

最近的一篇论文来自 NVIDIA 的研究人员。它展示了一种将神经网络与经典物理方程式相结合的方法,可令传统模拟获得 1000 倍的速度提升。

加快药物研发

如今,加速计算、大规模扩展和 AI 的结合正在推动科学和工业计算的发展。

在疾病治疗领域,加速药物研发是一切工作的重中之重。这项工作颇具挑战,开发者需要解码 3D 蛋白质结构,了解其工作原理,然后发现能够阻止它们感染健康细胞的化合物。

使用 X 射线和电子显微镜的传统方法只解码了大约 25000 种人类蛋白质中的 17%。DeepMind 去年在其 AlphaFold 系统中使用了一套 AI 模型,实现了重大飞跃,预测了超过 20000 种人类蛋白质的 3D 结构。

无独有偶,NVIDIA 和美国加州理工学院的研究人员将机器学习和物理相结合,创造了 OrbNet,可加速多个数量级的分子模拟。初创公司 Entos 利用 OrbNet,令其蛋白质和候选药物之间的化学反应模拟速度提高了 1000 倍,在三个小时内就完成了原本需要超过三个月时间的工作量。

了解气候变化

类似情况在其他领域也屡屡发生。科学家希望尽快以千米级分辨率模拟全球气候,以帮助我们适应不断变化的天气模式,更好地为灾难做好准备。

但是,为了准确追踪云层和风暴的运动模式,科学家需要在一米的分辨率级别进行研究。这需要高达 1000 亿倍的计算能力。

按照摩尔定律,我们要到 2060 年才能获得这个能力。因此,寻求百万倍性能飞跃的科学家正在通过大规模加速计算和 AI 来构建我们星球的数字孪生。

多行业已应用数字孪生

研究人员已经在利用这些技术来构建工厂和城市的数字孪生。

例如,西门子能源公司使用在云中数十个 GPU 上运行的 NVIDIA Modulus AI 框架,模拟了整个发电厂。它可以预测蒸汽的腐蚀性影响造成的机械故障,减少宕机时间,节约成本并持续运作。

这种模拟技术可打造更高效的农场、医院,以及帮助任何行业转型。这就是我们开发 Modulus 原因:使创建 AI 驱动、物理级准确的模拟变得简单。

这是在当今新计算引擎的助力下,我们打造出的又一个工具,可实现下一个百万倍的飞跃。

数据中心规模的 AI 加速计算将带来百万倍的性能提升,从而解决诸如了解气候变化、研发药物和推动工业转型等问题。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6792

    浏览量

    88724
  • NVIDIA
    +关注

    关注

    14

    文章

    4843

    浏览量

    102697
  • AI
    AI
    +关注

    关注

    87

    文章

    29665

    浏览量

    267997

原文标题:GTC21 | 百万级因子:令计算能力实现Million-X 百万倍飞跃的三大驱动力

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI数据中心的能源危机,需要更高效的PSU

    电子发烧友网报道(文/梁浩斌)数据中心在近年AI的浪潮中得到极大的发展,需求的膨胀带动全球数据中心建设
    的头像 发表于 11-04 02:21 1093次阅读

    IaaS+on+DPU(IoD)+下一代高性能底座技术白皮书

    ,特别是在智领域,对系统大小有决定性作用;DPU负责数据在各种 CPU 之间、CPU 与 GPU、以及 GPU 与 GPU 之间高效
    发表于 07-24 15:32

    中心加速布局,上游计算、存储、互联都涉及哪些芯片技术

    电子发烧友网报道(文/李弯弯)智中心是承载人工智能计算需求的基础设施,专门用于处理AI算法和模型所需的大量计算任务。与传统的
    的头像 发表于 07-24 01:13 3988次阅读

    壁仞科技为中国移动呼和浩特智中心提供强大

    中心提供强大。该项目成功上线运营,标志着双方在智能计算领域的深度合作迈出了坚实的步伐。   中国移动智
    的头像 发表于 07-05 17:16 1192次阅读

    科华数据携手希姆计算,推动国产RISC-V开源AI快速发展

    近日,科华数据与希姆计算签署战略合作协议。依据协议,双方将利用各自的技术优势和资源,打造先进的国产化AI
    的头像 发表于 06-30 08:36 404次阅读
    科华<b class='flag-5'>数据</b>携手希姆<b class='flag-5'>计算</b>,推动国产RISC-V开源<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>快速发展

    科华数据携手希姆计算,推动国产RISC-V开源AI快速发展

    近日,科华数据与希姆计算签署战略合作协议。依据协议,双方将利用各自的技术优势和资源,打造先进的国产化AI
    的头像 发表于 06-26 08:36 470次阅读
    科华<b class='flag-5'>数据</b>携手希姆<b class='flag-5'>计算</b>,推动国产RISC-V开源<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>快速发展

    数据中心、智中心、超中心,有何区别?

    数据中心、智中心和超中心是当前计算机领域中比较重要的研究方向,三者虽然都属于
    的头像 发表于 06-22 08:27 4493次阅读
    云<b class='flag-5'>数据中心</b>、智<b class='flag-5'>算</b><b class='flag-5'>中心</b>、超<b class='flag-5'>算</b><b class='flag-5'>中心</b>,有何区别?

    苹果自研数据中心AI芯片

    据可靠消息透露,苹果公司正秘密研发一款全新的AI芯片,旨在为其数据中心提供强大支持。这款内部代号为ACDC(Apple Chips i
    的头像 发表于 05-07 14:44 339次阅读

    中心:数字经济发展的新引擎

    随着数字经济的快速发展,中心正逐渐成为推动经济发展的重要力量。中心是指能够提供大
    的头像 发表于 04-13 08:27 1503次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>中心</b>:数字经济发展的新引擎

    一图看懂星河AI数据中心网络,全面释放AI时代

    华为中国合作伙伴大会 | 一图看懂星河AI数据中心网络,以网强,全面释放AI时代
    的头像 发表于 03-22 10:28 678次阅读
    一图看懂星河<b class='flag-5'>AI</b><b class='flag-5'>数据中心</b>网络,全面释放<b class='flag-5'>AI</b>时代<b class='flag-5'>算</b><b class='flag-5'>力</b>

    STRADA Whisper Absolute高速背板连接器为112G数据中心全力提速

    随着云计算、人工智能、5G 网络等应用对数据量的需求不断呈指数增长,提供存储和
    的头像 发表于 02-22 17:20 787次阅读
    STRADA Whisper Absolute高速背板连接器为112G<b class='flag-5'>数据中心</b>全力提速

    AI应用中的光模块产品

    预测 光模块是数据中心内部互连和数据中心相互连接的核心部件。100G和400G是主流产品,800G过去主要用在超等领域。据LightCounting预计,2023年800G全球普及率仅0.62%。而以ChatGPT为代表的
    的头像 发表于 01-02 15:32 467次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>应用中的光模块产品

    AGI时代的奠基石:Agent++大模型是构建AI未来的三驾马车吗?

    AI Agent的训练离不开,服务器作为一个强大计算中心,为AI Agent提供
    的头像 发表于 12-21 13:34 1123次阅读
    AGI时代的奠基石:Agent+<b class='flag-5'>算</b><b class='flag-5'>力</b>+大模型是构建<b class='flag-5'>AI</b>未来的三驾马车吗?

    数据处理器:DPU编程入门》读书笔记

    。以DPU为技术代表的新架构,正在重新定义数据中心和云原生技术的基础架构。 DPU的出现,是随着数据中心的高速发展,通信能力和计算能力成
    发表于 12-21 10:47

    片上光互连:未来单芯片提升的重要路径

    电子发烧友网报道(文/梁浩斌)今年火爆的AI应用也带火了数据中心市场,AI服务器需求暴增。不仅是AI大模型的规模在不断扩张至千亿
    的头像 发表于 12-18 07:00 2036次阅读