0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Mistral AI与NVIDIA推出全新语言模型Mistral NeMo 12B

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2024-07-27 11:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Mistral NeMo 处理和生成高度准确内容的能力为企业带来了新机遇。

Mistral AI 和 NVIDIA 于近日共同发布了一款全新的领先语言模型Mistral NeMo 12B。开发者可以轻松定制和部署该模型,令其适用于支持聊天机器人、多语言任务、编码和摘要的企业应用。

Mistral NeMo 模型结合了 Mistral AI 在训练数据领域的专业知识与 NVIDIA 经过优化的软硬件生态系统,能够为各种应用提供高性能。

Mistral AI 联合创始人兼首席科学家 Guillaume Lample 表示:“我们十分幸运能与 NVIDIA 团队合作,并充分利用他们的顶尖硬件和软件。得益于NVIDIA AI Enterprise的部署,我们共同开发了一个具有前所未有的准确性、灵活性、高效率以及企业级支持和安全性的模型。”

Mistral NeMo 是在NVIDIA DGX CloudAI 平台上所训练而成,该平台提供对最新 NVIDIA 架构的专用可扩展访问。

另外,为了推进和优化进程,还使用了用于加速大语言模型推理性能的NVIDIA TensorRT-LLM和用于构建自定义生成式 AI 模型的NVIDIA NeMo开发平台。

此次合作突显了 NVIDIA 致力于支持模型构建生态系统的决心。

实现前所未有的准确性、

灵活性和效率

这款企业级 AI 模型在多轮对话、数学、常识推理、世界知识和编码方面表现出色,能够在各种任务中提供精确、可靠的性能。

Mistral NeMo 具有 128K 的上下文长度,能够更加连贯、准确地处理大量复杂信息,确保输出结果与上下文的关联性。

Mistral NeMo 是一个拥有 120 亿个参数的模型,以 Apache 2.0 许可证发布,该许可证旨在促进创新并支持更广泛的人工智能社区。此外,该模型使用 FP8 数据格式进行模型推理,在不降低准确性的前提下减少了内存大小并加快了部署速度。

这意味着该模型能够更好地了解任务,并更加有效地处理各种场景,是企业用例的理想选择。

Mistral NeMo 被打包成NVIDIA NIM 推理微服务,借助 NVIDIA TensorRT-LLM 引擎提供性能优化的推理。

这种容器化格式便于在任何地方进行部署,为各种应用带来了更大的灵活性。

因此,该模型可以部署到任何位置,而且时间也从原来的几天缩短到几分钟。

NIM 使用 NVIDIA AI Enterprise 中的企业级软件,提供专门的功能分支、严格的验证流程以及企业级安全和支持。

NIM 包含全方位的支持、与 NVIDIA AI 专家的直接连线以及明确的服务水平协议,保证了可靠、一致的性能。

由于使用的是开放模型许可证,企业可以将 Mistral NeMo 无缝集成到商业应用中。

Mistral NeMo NIM 适用于NVIDIA Ada Lovelace架构 RTX 40 系列独立 GPU,如NVIDIA GeForce RTX 4090 D或NVIDIA RTX 4500 GPU的显存,具有高效率、低计算成本以及更高的安全性和隐私性。

先进的模型开发和定制

Mistral AI 与 NVIDIA 工程师结合双方的专业知识,优化了 Mistral NeMo 的训练和推理。

该模型使用 Mistral AI 的专业知识(尤其是多语言、代码和多轮内容方面的专业知识)训练,并从 NVIDIA 全栈加速训练中获益。

它采用了具有最佳性能的设计,通过Megatron-LM实现了高效的模型并行技术、可扩展性和混合精度。

该模型使用 NVIDIA NeMo 中的 Megatron-LM 以及 DGX Cloud 上的 3072 个 80GB Tensor Core GPU 训练而成。DGX Cloud 由 NVIDIA AI 架构组成,包括加速计算、网络编织结构、软件等,可提高训练的效率。

可用性和部署

Mistral NeMo 可以灵活地在云、数据中心或 RTX 工作站等任何地方运行,随时随地为各种平台上的 AI 应用带来变革。

立刻通过https://developer.nvidia.cn/nim 了解以 NVIDIA NIM 形式提供的 Mistral NeMo。可下载的 NIM 也即将推出。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5721

    浏览量

    110219
  • AI
    AI
    +关注

    关注

    91

    文章

    41834

    浏览量

    302983
  • 模型
    +关注

    关注

    1

    文章

    3861

    浏览量

    52322

原文标题:Mistral AI 与 NVIDIA 宣布推出领先的企业 AI 模型 Mistral NeMo 12B

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA黄仁勋与行业领导者畅谈AI的未来

    Mistral、Perplexity、Cursor、Reflection AI 和 Thinking Machines Lab 的首席执行官等 AI 领导者一致认为,开放模型领域取得的
    的头像 发表于 04-01 09:20 831次阅读

    NVIDIA CEO黄仁勋在GTC大会上汇聚AI开放模型先锋

    Mistral、Perplexity、Cursor、Thinking Machines Lab 等公司的首席执行官与黄仁勋一起登上舞台,共同勾勒了开放前沿时代的未来。
    的头像 发表于 03-23 15:28 449次阅读

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    新闻摘要: ● NVIDIA Nemotron Coalition 是模型构建者和 AI 实验室的首个此类全球合作项目,致力于通过共享专业知识、数据和计算来推进开放前沿基础模型的发展。
    的头像 发表于 03-17 11:14 395次阅读
    <b class='flag-5'>NVIDIA</b> 成立由全球领先 <b class='flag-5'>AI</b> 实验室组成的 Nemotron Coalition,推动开放前沿<b class='flag-5'>模型</b>发展

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron、
    的头像 发表于 03-16 16:27 763次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能<b class='flag-5'>AI</b>在边缘端落地

    NVIDIA推出代理式AI蓝图与电信推理模型

    借助全新开源大型电信模型NVIDIA Blueprint,电信运营商能够利用自有数据训练 AI 智能体,构建自主网络。
    的头像 发表于 03-06 17:37 3152次阅读

    谷歌推出TranslateGemma全新开放翻译模型系列

    我们已正式推出 TranslateGemma,这一全新的开放翻译模型系列基于 Gemma 3 构建,并提供 4B12B 和 27
    的头像 发表于 02-26 10:22 813次阅读

    NVIDIA携手Mistral AI发布全新开源大语言模型系列

    全新 Mistral 3 系列涵盖从前沿级到紧凑型模型,针对 NVIDIA 平台进行了优化,助力 Mistral
    的头像 发表于 12-13 09:58 1568次阅读

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Rea
    的头像 发表于 12-13 09:50 1639次阅读

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展
    的头像 发表于 11-06 11:49 1374次阅读

    NVIDIA ACE现已支持开源Qwen3-8B语言模型

    为助力打造实时、动态的 NPC 游戏角色,NVIDIA ACE 现已支持开源 Qwen3-8B语言模型(SLM),可实现 PC 游戏中的本地部署。
    的头像 发表于 10-29 16:59 1502次阅读

    Votee AI借助NVIDIA技术加速方言小语种LLM开发

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 数据处理软件、NeMo Framework 模型训练框架及
    的头像 发表于 08-20 14:21 1078次阅读

    NVIDIA通过全新 Omniverse库、Cosmos物理AI模型AI计算基础设施,为机器人领域开启新篇章

    NVIDIA 通过全新 Omniverse 库、Cosmos 物理 AI 模型AI 计算基础设施,为机器人领域开启新篇章   · 
    的头像 发表于 08-12 11:29 2083次阅读
    <b class='flag-5'>NVIDIA</b>通过<b class='flag-5'>全新</b> Omniverse库、Cosmos物理<b class='flag-5'>AI</b><b class='flag-5'>模型</b>及<b class='flag-5'>AI</b>计算基础设施,为机器人领域开启新篇章

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 开源其物理 AI 平台 NVIDIA Cosmos 中的关键模型——NVIDIA Cosmos Reason-1-7
    的头像 发表于 07-09 10:17 1078次阅读

    NVIDIA推出全新智慧城市AI Blueprint

    面向智慧城市 AINVIDIA Omniverse Blueprint 集成了 NVIDIA Omniverse、Cosmos、NeMo 和 Metropolis,已被多家领先的
    的头像 发表于 06-16 14:21 1414次阅读

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI
    的头像 发表于 06-12 15:42 1447次阅读