英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神经架构搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具备更准确和更高效的运算效率;能够大幅降低运行成本。
通过NAS技术微调;大幅降低了内存消耗、计算复杂性;Llama-3.1-Nemotron-51B AI 模型在单个H100 GPU上的表现非常优秀,在推理过程中可以在单个 GPU 上运行 4 倍以上的工作负载。这使得单片H100 GPU即可处理更大型的推理任务;这无疑是显著的降低了训练成本。这为AI提供了高效、经济的方案。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
英伟达
+关注
关注
22文章
3872浏览量
92403 -
AI大模型
+关注
关注
0文章
334浏览量
380
发布评论请先 登录
相关推荐
IBM在watsonx.ai平台推出DeepSeek R1蒸馏模型
IBM近日宣布了一项重要更新,为其企业级AI开发平台watsonx.ai引入了DeepSeek R1的Llama 3.1 8B和
英伟达发布Nemotron-CC大型AI训练数据库
近日,英伟达在其官方博客上宣布了一项重大进展,推出了一款名为Nemotron-CC的大型英文AI训练数据库。这一数据库的发布,标志着
NVIDIA推出开放式Llama Nemotron系列模型
作为 NVIDIA NIM 微服务,开放式 Llama Nemotron 大语言模型和 Cosmos Nemotron 视觉语言模型可在任何
Llama 3 与开源AI模型的关系
在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的
Llama 3 模型与其他AI工具对比
Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3
英伟达震撼发布:全新AI模型参数规模跃升至80亿量级
8月23日,英伟达宣布,其全新AI模型面世,该模型参数规模高达80亿,具有精度高、计算效益大等优势,适用于GPU加速的数据中心、云及工作站环
Meta Llama 3.1系列模型可在Google Cloud上使用
我们很高兴宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,这包括全新的 405B,即 Meta 迄
Meta发布全新开源大模型Llama 3.1
科技巨头Meta近期震撼发布了其最新的开源人工智能(AI)模型——Llama 3.1,这一举措标志着Meta在
NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型
借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron
发表于 07-24 09:39
•772次阅读

Meta即将发布超强开源AI模型Llama 3-405B
在人工智能领域的激烈竞争中,Meta公司再次掷出重磅炸弹,宣布将于7月23日正式发布其最新力作——Llama 3-405B,一个拥有惊人4050亿参数的开源大模型。这一举措不仅标志着M
英伟达开源Nemotron-4 340B系列模型,助力大型语言模型训练
近日,英伟达宣布开源了一款名为Nemotron-4 340B的大型模型,这一壮举为开发者们打开了通往高性能大型语言
英伟达首席执行官黄仁勋:AI模型推动英伟达AI芯片需求
近来,以ChatGPT为代表的AI聊天机器人已经导致英伟达AI芯片供应紧张。然而,随着能够创造视频并进行近似人类交流的新型AI
评论