利用AI与数据中心规模的加速计算相结合的强大指数级算力-电子发烧友网

科学界和工业界正开始利用 AI 与数据中心规模的加速计算相结合的强大指数级算力

研究人员正在寻找能使他们的工作所需计算性能提升百万倍的“燃料”。

不断增长的数据导致计算需求飞涨。面对此情况，他们无法完全依靠已是明日黄花的摩尔定律。

因此，他们利用三大“推进器”，获取所需的指数级加速。

纵向加速和横向扩展

加速计算是科技的三大现代驱动力之一。在过去的十年中，借助五代 GPU 的进步以及我们在这些 GPU 之上构建的完整软件栈，加速计算已实现了 1000 倍性能提升。

扩展能力是第二个驱动力，已取得近十万倍的性能提升。这是因为数据中心正在成为新的计算单元。

例如，在 2015 年，使用一个 Kepler GPU 训练 ResNet-50（热门的计算机视觉模型之一）花了将近一个月的时间。今天，我们在 Selene 上训练同样的模型只用了不到半分钟的时间。Selene 是世界上性能超强的工业超级计算机，其包含数千个 NVIDIA Ampere 架构 GPU。

我们开发了许多关键技术来实现这种扩展，例如 Megatron 软件、用于多 GPU 和多节点处理的 Magnum IO，以及用于网络计算的 SHARP。

开启深度学习的新时代

当今时代的第三个，也是最具变革性的驱动力是 AI。

去年，深度学习在一毫秒的时间尺度内对 3.05 亿个原子进行了模拟，揭示了新冠病毒 SARS-CoV-2 的内部结构。这项工作标志着与 15 年前在 20 秒内对 100 万个原子进行模拟的最先进技术相比，其效能增加了 1000 万倍以上。

这就是 AI 和高性能计算的结合正在席卷科学界的原因。研究人员去年在 arXiv 上发表了近 5000 篇关于利用 AI+HPC 进行工作的论文，而五年前此类论文还不到 100 篇。

最近的一篇论文来自 NVIDIA 的研究人员。它展示了一种将神经网络与经典物理方程式相结合的方法，可令传统模拟获得 1000 倍的速度提升。

加快药物研发

如今，加速计算、大规模扩展和 AI 的结合正在推动科学和工业计算的发展。

在疾病治疗领域，加速药物研发是一切工作的重中之重。这项工作颇具挑战，开发者需要解码 3D 蛋白质结构，了解其工作原理，然后发现能够阻止它们感染健康细胞的化合物。

使用 X 射线和电子显微镜的传统方法只解码了大约 25000 种人类蛋白质中的 17%。DeepMind 去年在其 AlphaFold 系统中使用了一套 AI 模型，实现了重大飞跃，预测了超过 20000 种人类蛋白质的 3D 结构。

无独有偶，NVIDIA 和美国加州理工学院的研究人员将机器学习和物理相结合，创造了 OrbNet，可加速多个数量级的分子模拟。初创公司 Entos 利用 OrbNet，令其蛋白质和候选药物之间的化学反应模拟速度提高了 1000 倍，在三个小时内就完成了原本需要超过三个月时间的工作量。

了解气候变化