0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

多所大学采用NVIDIA系统和网络拓展研究工作

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2021-11-18 09:45 次阅读

美国南方卫理公会大学使用 NVIDIA DGX SuperPOD 推动德克萨斯州北部地区进入 AI 时代;密西西比州立大学和德克萨斯农工大学准备使用 NVIDIA Quantum-2 网络;英国的一所大学则升级了其 InfiniBand 网络。

正如达拉斯/沃斯堡机场已成为全美旅行枢纽一样,南方卫理公会大学(SMU)将助力德克萨斯州北部地区在 AI 行业发展中处于领先地位。

南方卫理公会大学正在安装一台 NVIDIA DGX SuperPOD 超级计算机。该大学希望这台超级计算机为这个拥有 12000 多名学生和 2400 名教职员工的庞大社区推动机器学习项目的发展。

除了该大学之外,美国中南部还有两所大学也宣布计划使用 NVIDIA 技术以推动研究高速发展。

德克萨斯农工大学和密西西比州立大学均计划使用 NVIDIA 的 400 Gbit/s InfiniBand 网络平台,NVIDIA Quantum-2 将作为其最新高性能计算机的主干网。此外,英国的一台超级计算机刚刚升级了其 InfiniBand 网络。

德克萨斯州喜获 SuperPOD

提到今年早期在佛罗里达大学安装的另一个系统时,南方卫理公会大学首席信息官 Michael Hites 表示:“我们是美国第二所获得 DGX SuperPOD 系统的大学,它将助力本社区在使用 AI 技术推动学位课程,以及校企合作方面,均处于领先地位。”

9 月,一篇报导称,达拉斯地区因缺乏主要的 AI 研究而 “步履蹒跚”。巧合的是,报导登上当地报纸之时,也正是南方卫理公会大学敲定其 DGX SuperPOD 计划之日。

南方卫理公会大学在 3 月的一份计划预览报告中表示,AI 是 “数字化转型的核心……没有任何社会部门能够不受该技术的影响。AI 对 K-12 教育行业和劳动力发展具有巨大的改善潜力,这将有助于该地区经济的持续增长。”

一项 15 亿美元的筹款活动 —— SMU Ignite —— 于 9 月正式启动。SMU Ignite 将推动 AI 倡议,帮助南方卫理公会大学迈入全国顶级研究型大学的行列。该大学正在聘请一位首席创新官来协助指导此项工作。

打造一个计算炼金炉

南方卫理公会大学研究者 IT 支持团队主管 Jason Warner 表示,这项工作的核心是人才。因此,他为南方卫理公会大学福特研究与创新中心的一个新中心聘请了一批具有重大影响力的数据科学专家。Warner 将这座新中心称为南方卫理公会大学的 “计算炼金炉”。

这支团队由 Eric Godat 领导,他在南方卫理公会大学使用大型强子对撞机的数据为核结构建模,并因此获得了粒子物理学博士学位。

而今,他正协助南方卫理公会大学的学生了解 DGX SuperPOD 所带来的新机会。第一步,他邀请两名南方卫理公会大学的学生使用 NVIDIA Jetson 模块建造一个 DGX SuperPOD 的微型模型。

Godat 表示:“我们想让大家感受一下未来的工作会是什么样子的,尤其是那些没有做过 AI 方面工作的非技术领域人员。”

这台全尺寸超级计算机由建立在 NVIDIA Quantum InfiniBand 网络上的 20 个 NVIDIA DGX A100 系统组成。凭借其积木式的模块化结构,这台超级计算机最早可以在 1 月启动和运行。它将提供高达 100PFlops 的计算力,足以使其在全球最快超级计算机榜单 TOP500 上位居前列。

德克萨斯农工大学为其 ACES

使用 NVIDIA Quantum-2 InfiniBand 技术

位于南面约 200 英里的德克萨斯农工大学高性能计算中心,将成为首批接入 NVIDIA Quantum-2 InfiniBand 平台的机构之一。其 ACES 超级计算机由戴尔科技建造,将使用 400G InfiniBand 网络为研究者连接来自四家厂商的五个加速器。

NVIDIA Quantum-2 确保 “在 ACES 上单项工作即可以扩展到所有计算核和加速器。除了在吞吐量上比 NVIDIA Quantum-1 InfiniBand 的 200G 翻倍之外,它还具有更低的总拥有成本、更强大的网络计算功能和更高的扩展性 ”,ACES 首席研究员兼项目总监 Honggao Liu 表示。

德克萨斯农工大学已经为研究者提供了四套加速计算系统,这四套系统包含 600 多个 NVIDIA A100 Tensor Core 和上一代 GPU,其中两个系统使用了较早版本的 NVIDIA InfiniBand 技术。

密西西比州立大学乘上 400G 网速列车

密西西比州立大学也将使用 NVIDIA Quantum-2 InfiniBand 平台。它是构建 Orion 新系统的首选网络,Orion 是密西西比州立大学管理的四个集群中最大的一个集群,这四个集群全部使用较早版本的 InfiniBand 网络所构建。

Orion 和新系统均由美国国家海洋和大气管理局 (NOAA) 所资助,由戴尔科技建造。Orion 和新系统将承担 NOAA 的工作任务,以及密西西比州立大学的各项研究课题。

Orion 在 2019 年 6 月首次登上 TOP500 榜单,并被列为美国第四大学术超级计算机。

密西西比州立大学高性能计算总监 Trey Breckenridge 表示:“我们在密西西比州立大学的四代超级计算机中都使用了 InfiniBand,所以我们知道它既强大又成熟,可以可靠地运行我们需要的大型工作。”

他补充道:“我们正在添加一套使用 NVIDIA Quantum-2 的新系统,以保持在高性能计算领域的领先优势。”

Quantum 在英国掀起风潮

在大洋彼岸的英国,莱斯特大学的数据密集型超级计算机 —— DIaL 系统 —— 已经升级到 200G 版本的 NVIDIA Quantum InfiniBand。

莱斯特大学理论天体物理学教授兼高性能计算中心总监 Mark Wilkinson 表示:“ DIaL专为解决复杂的数据密集型问题而设计,我们需要解决这些问题,才能推进对周围宇宙的理解。”

“这些专业应用对带宽和延迟的要求都是前所未有的,只有 InfiniBand 能够满足要求,使研究工作有效开展。”

DIaL 是英国 DiRAC 设施中使用 InfiniBand 的四台超级计算机之一,另外还包括爱丁堡大学的 Tursa 系统。

InfiniBand 在技术评估上表现出色

在一次技术评估中,研究人员发现与使用另一种互连方式的纯 CPU 系统 Tesseract 相比,在由 Quantum 网络和 NVIDIA GPU 加速器构建的 Tursa 系统上运行应用性能可达 5 倍提升。

基准应用测试显示,Tursa 系统上 16 个节点的性能是 Tesseract 系统上 512 个节点性能的两倍。Tursa 系统的每个节点提供 10 TFlops 计算性能,使用 90% 的网络带宽,每千瓦性能相比 Tesseract 有显著的提高。

这也说明了为什么世界上大多数 TOP500 系统都在使用 NVIDIA 的技术。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10859

    浏览量

    211700
  • NVIDIA
    +关注

    关注

    14

    文章

    4985

    浏览量

    103027
  • 超级计算机
    +关注

    关注

    2

    文章

    462

    浏览量

    41945
  • AI
    AI
    +关注

    关注

    87

    文章

    30834

    浏览量

    268997

原文标题:SC21 | 多所大学采用 NVIDIA 系统和网络拓展研究工作

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA CEO黄仁勋对话香港科技大学毕业生

    NVIDIA 创始人兼首席执行官黄仁勋在香港科技大学获得工程学荣誉博士学位。黄仁勋在现场发表演讲并与香港科技大学校董会主席沈向洋教授展开了炉边对话。
    的头像 发表于 11-25 15:05 339次阅读

    日本企业借助NVIDIA产品加速AI创新

    日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。
    的头像 发表于 11-19 14:34 296次阅读

    SONiC网络操作系统中的安全启动

    NVIDIA 的技术可帮助组织构建和维护安全、可扩展和高性能的网络基础设施。NVIDIA 在引领 AI 技术的前沿,每天都在推动安全方面的进步,对保障网络安全采取的更直接的方法之一就是
    的头像 发表于 11-13 11:45 306次阅读
    SONiC<b class='flag-5'>网络</b>操作<b class='flag-5'>系统</b>中的安全启动

    SynSense时识科技与海南大学联合研究成果发布

    近日,SynSense时识科技与海南大学联合在影响因子高达7.7的国际知名期刊《Computers in Biology and Medicine》上发表了最新研究成果,展示了如何用低维信号通用类脑
    的头像 发表于 10-23 14:40 308次阅读
    SynSense时识科技与海南<b class='flag-5'>大学</b>联合<b class='flag-5'>研究</b>成果发布

    简单认识NVIDIA网络平台

    NVIDIA Spectrum-X800 平台是业界第一代 800Gb/s 的以太网网络平台,包括了 NVIDIA Spectrum SN5600 800Gb/s 以太网交换机和 NVIDIA
    的头像 发表于 09-09 09:22 426次阅读

    采用OpenUSD和NVIDIA NIM微服务创建精准品牌视觉

    全球领先的创意和制作服务机构率先采用 OpenUSD 和 NVIDIA NIM 微服务来创建精准的品牌视觉。
    的头像 发表于 08-01 14:33 419次阅读

    NVIDIA Spectrum-X 以太网网络平台已被业界广泛使用

    云服务提供商、GPU 云提供商和企业用户纷纷采用 Spectrum-X;NVIDIA 网络通过广大系统制造商进入各个市场。   NVIDIA
    的头像 发表于 06-03 18:20 968次阅读

    NVIDIA DPU编程入门开课仪式在澳门科技大学成功举办

    5 月 24 日,NVIDIA DPU 编程入门开课仪式在澳门科技大学成功举办。作为首个在中国开设 NVIDIA DPU 编程相关课程的高校,来自澳门科技大学不同院系的师生共同见证了本
    的头像 发表于 05-28 09:40 395次阅读

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2无法使用操作系统内置的网络管理器管理Wi-Fi如何解决?

    %E2%84%A2%20CYW5557.... 我们可以使用命令行指令成功连接互联网。 但是,我们无法使用操作系统内置的网络管理器管理 Wi-Fi。 网络管理器中与 Wi-Fi 相关的选项都是灰色
    发表于 05-23 06:47

    助力科学发展,NVIDIA AI加速HPC研究

    科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作
    的头像 发表于 05-14 09:17 412次阅读
    助力科学发展,<b class='flag-5'>NVIDIA</b> AI加速HPC<b class='flag-5'>研究</b>

    是德科技与NVIDIA携手推进6G研究云平台发展

    是德科技近日宣布与现已开启与全新NVIDIA 6G研究云平台的合作,加速推进6G技术研究。该平台集成了NVIDIA Aerial Omniverse数字孪生技术,这一开放且灵活的
    的头像 发表于 03-27 09:26 695次阅读

    NVIDIA发布专为大规模AI量身订制的全新网络交换机-X800系列

    NVIDIA Quantum-X800 InfiniBand 网络NVIDIA Spectrum™-X800 以太网络是全球首批高达 800Gb/s 端到端吞吐量的
    的头像 发表于 03-20 09:54 494次阅读

    英伟达推出6G研究平台,加速智能应用发展

     据英伟达介绍,NVIDIA 6G研究云端平台具备卓越的开放性、灵活性和联网功能,为研究工作献上了一整套齐全的工具,助推无线接入网(RAN)技术领域的AI进步。
    的头像 发表于 03-20 09:25 452次阅读

    亚利桑那大学和北亚利桑那大学正式达成协议,推动亚利桑那州半导体产业发展

    工程学院的微/纳米制造中心是该大学帮助发展半导体制造和研究工作的几个核心设施之一。 由于亚利桑那州希望帮助促进国家半导体制造业的发展,亚利桑那大学和北亚利桑那大学之间的一项新协议将尽可
    的头像 发表于 02-05 12:02 423次阅读

    艾伦人工智能研究所发布全球首个100%开源大模型

    艾伦人工智能研究所近日宣布,与多所大学合作,成功开发出全球首个100%开源大模型OLMo,包括权重、代码、数据集和训练全过程。这一创新性项目旨在推动人工智能领域的开放研究,为全球研究
    的头像 发表于 02-05 09:34 951次阅读