0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA联合构建大规模模拟和训练 AI 模型

科技绿洲 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-06-14 14:56 次阅读

Champollion 超级计算机位于格勒诺布尔,由慧与和 NVIDIA 联合构建,它将为全球科学和工业领域的用户创建大规模模拟和训练 AI 模型。

150 年前,一位法国语言学家破译了罗塞塔石碑。150 年后的今天,慧与(Hewlett Packard Enterprise)启用了能够帮助客户解决最棘手问题的工具。

Champollion AI 超级计算机的名称来自让-弗朗索瓦·商博良(Jean-François Champollion,1790-1832)。这位法国学者破译了古埃及象形文字,为研究古埃及文化奠定了基础。与商博良一样,这台位于法国格勒诺布尔的庞大系统将在慧与卓越中心“破译”海量数据集之中的规律。

这台超级计算机将要负责的工作包括开发和训练 AI 模型,以及为科学和工业领域的用户进行高级模拟

法国“人类的人工智能”(AI for Humanity)计划的研究人员将使用 Champollion 超级计算机推动行业发展,并通过机器学习促进经济增长,而他们只是该系统全球用户群中的一员。

探秘 AI 超级计算机

Champollion 超级计算机将帮助慧与的客户通过加速计算探寻新的机会。该系统基于由 20 个 HPE Apollo 6500 Gen10 Plus 系统组成的集群,来运行用于构建和训练大规模 AI 模型的软件栈—— HPE 机器学习开发环境。

这台超级计算机的部分算力由 160 个 NVIDIA A100 Tensor Core GPU 驱动,它们为集群提供 100 千万亿次级的峰值 AI 性能。这些 GPU 通过高吞吐量、低延迟的 NVIDIA Quantum InfiniBand 连接,实现了网络计算。

该系统可以访问 NVIDIA 的 HPC 和 AI 软件在线目录——NGC,包括编排 AI 部署的 NVIDIA Triton 推理服务器等工具,以及用于医疗行业的 NVIDIA Clara 等应用框架。

用户可以在 Champollion 超级计算机上对工作负载进行测试并与基准对标,以加快工作成果的投产速度。格勒诺布尔作为汇聚了能源、医药和高科技企业的研究中心,为这台超级计算机提供了绝佳的“用武之地”。

无限可能

该系统可以帮助研究人员找到分子模式,用于开发疗效更好的新药物或疗法,还可以用于构建数字孪生,为仓库或工厂规划效率更高的物流路线。

凡是能够善加运用高性能计算的行业和研究领域,都能通过这台超级计算机开辟新的可能性。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5109

    浏览量

    104527
  • 计算机
    +关注

    关注

    19

    文章

    7575

    浏览量

    89136
  • AI
    AI
    +关注

    关注

    87

    文章

    32504

    浏览量

    271712
  • 人工智能
    +关注

    关注

    1800

    文章

    48107

    浏览量

    242260
收藏 人收藏

    评论

    相关推荐

    训练好的ai模型导入cubemx不成功怎么处理?

    训练好的ai模型导入cubemx不成功咋办,试了好几个模型压缩了也不行,ram占用过大,有无解决方案?
    发表于 03-11 07:18

    小白学大模型构建LLM的关键步骤

    随着大规模语言模型(LLM)在性能、成本和应用前景上的快速发展,越来越多的团队开始探索如何自主训练LLM模型。然而,是否从零开始训练一个LL
    的头像 发表于 01-09 12:12 597次阅读
    小白学大<b class='flag-5'>模型</b>:<b class='flag-5'>构建</b>LLM的关键步骤

    GPU是如何训练AI模型

    AI模型训练过程中,大量的计算工作集中在矩阵乘法、向量加法和激活函数等运算上。这些运算正是GPU所擅长的。接下来,AI部落小编带您了解GPU是如何
    的头像 发表于 12-19 17:54 387次阅读

    NVIDIA与谷歌量子AI部门达成合作

    NVIDIA CUDA-Q 平台使谷歌量子 AI 研究人员能够为其量子计算机创建大规模的数字模型,以解决设计中面临的各种挑战
    的头像 发表于 11-20 09:39 378次阅读

    使用EMBark进行大规模推荐系统训练Embedding加速

    推荐系统是互联网行业的核心系统,如何高效训练推荐系统是各公司关注的核心问题。目前,推荐系统基本上都是基于深度学习的大规模 ID 类模型模型包含数十亿甚至数百亿级别的 ID 特征,典型
    的头像 发表于 10-31 14:46 379次阅读
    使用EMBark进行<b class='flag-5'>大规模</b>推荐系统<b class='flag-5'>训练</b>Embedding加速

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    、超大规模AI 工厂提供卓越性能而设计的 RDMA(Remote Direct Memory Access)网络。   Colossus 是世界上最大的 AI 超级计算机,目前正被用于训练
    发表于 10-30 09:33 218次阅读
    <b class='flag-5'>NVIDIA</b> 以太网加速 xAI <b class='flag-5'>构建</b>的全球最大 <b class='flag-5'>AI</b> 超级计算机

    AI模型训练数据来源分析

    AI模型训练数据来源广泛且多元化,这些数据源对于构建和优化AI模型至关重要。以下是对
    的头像 发表于 10-23 15:32 2337次阅读

    如何训练自己的AI模型

    训练自己的AI模型是一个复杂且耗时的过程,涉及多个关键步骤。以下是一个详细的训练流程: 一、明确需求和目标 首先,需要明确自己的需求和目标。不同的任务和应用领域需要不同类型的
    的头像 发表于 10-23 15:07 3954次阅读

    NVIDIA NIM助力企业高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等厂商的开源 Kubernetes 平台集成了 NVIDIA NIM,将允许用户通过 API 调用来大规模地部署大语言模型
    的头像 发表于 10-10 09:49 515次阅读

    NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据

    Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励模型,以及一个用于生成式
    的头像 发表于 09-06 14:59 458次阅读
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B<b class='flag-5'>模型</b>帮助开发者生成合成<b class='flag-5'>训练</b>数据

    NVIDIA携手Meta推出AI服务,为企业提供生成式AI服务

    NVIDIA近日宣布了一项重大举措,正式推出NVIDIA AI Foundry服务与NVIDIA NIM(NVIDIA Inference
    的头像 发表于 07-25 16:57 643次阅读

    NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

    借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对,来
    发表于 07-24 09:39 780次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 为全球企业打造自定义 Llama 3.1 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>

    大规模语言模型:从理论到实践】- 每日进步一点点

    非常推荐大家去读 【大规模语言模型:从理论到实践】这本书,系统的讲解了大模型的前世今生,对各个环节知识进行了普及。 今天跟我一起学习归一化的部分。 大模型
    发表于 05-31 19:54

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    芯片的扩展,以满足大规模AI模型训练和推理需求。 DGX SuperPOD配备智能控制平面,能够监控数千个数据点,确保系统连续运行、数据完整性,并自动重新配置集群以避免停机。每个DG
    发表于 05-13 17:16

    【大语言模型:原理与工程实践】大语言模型的预训练

    增长。DeepMind在相关论文中指出,模型大小和训练Token数应以相似速率增长,以确保最佳性能。因此,构建模型规模相匹配的预
    发表于 05-07 17:10