英伟达公司宣布推出 Llama-3.1-Nemotron-51B AI 模型,这个AI大模型是源自 Meta 公司的 Llama-3.1-70B大模型,基于使用了神经架构搜索(NAS)方法,推理速度比原70B大模型提升2.2倍,具备更准确和更高效的运算效率;能够大幅降低运行成本。
通过NAS技术微调;大幅降低了内存消耗、计算复杂性;Llama-3.1-Nemotron-51B AI 模型在单个H100 GPU上的表现非常优秀,在推理过程中可以在单个 GPU 上运行 4 倍以上的工作负载。这使得单片H100 GPU即可处理更大型的推理任务;这无疑是显著的降低了训练成本。这为AI提供了高效、经济的方案。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
英伟达
+关注
关注
22文章
3727浏览量
90758 -
AI大模型
+关注
关注
0文章
307浏览量
280
发布评论请先 登录
相关推荐
Llama 3 与开源AI模型的关系
在人工智能(AI)的快速发展中,开源AI模型扮演着越来越重要的角色。它们不仅推动了技术的创新,还促进了全球开发者社区的合作。Llama 3,作为一个新兴的
Llama 3 模型与其他AI工具对比
Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3
NVIDIA Nemotron-4 340B模型帮助开发者生成合成训练数据
Nemotron-4 340B 是针对 NVIDIA NeMo 和 NVIDIA TensorRT-LLM 优化的模型系列,该系列包含最先进的指导和奖励模型,以及一个用于生成式
英伟达震撼发布:全新AI模型参数规模跃升至80亿量级
8月23日,英伟达宣布,其全新AI模型面世,该模型参数规模高达80亿,具有精度高、计算效益大等优势,适用于GPU加速的数据中心、云及工作站环
Meta Llama 3.1系列模型可在Google Cloud上使用
我们很高兴宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,这包括全新的 405B,即 Meta 迄
Meta发布全新开源大模型Llama 3.1
科技巨头Meta近期震撼发布了其最新的开源人工智能(AI)模型——Llama 3.1,这一举措标志着Meta在
NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型
借助 NVIDIA AI Foundry,企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron
发表于 07-24 09:39
•676次阅读
Meta即将发布超强开源AI模型Llama 3-405B
在人工智能领域的激烈竞争中,Meta公司再次掷出重磅炸弹,宣布将于7月23日正式发布其最新力作——Llama 3-405B,一个拥有惊人4050亿参数的开源大模型。这一举措不仅标志着M
英伟达开源Nemotron-4 340B系列模型,助力大型语言模型训练
近日,英伟达宣布开源了一款名为Nemotron-4 340B的大型模型,这一壮举为开发者们打开了通往高性能大型语言
英伟达首席执行官黄仁勋:AI模型推动英伟达AI芯片需求
近来,以ChatGPT为代表的AI聊天机器人已经导致英伟达AI芯片供应紧张。然而,随着能够创造视频并进行近似人类交流的新型AI
Meta Llama 3基础模型现已在亚马逊云科技正式可用
亚马逊云科技近日宣布,Meta公司最新发布的两款Llama 3基础模型——Llama 3 8B和Llam
Meta推出最新版AI代码生成模型Code Llama70B
Meta近日宣布了其最新版本的AI代码生成模型Code Llama70B,并称其为“目前最大、最优秀的模型”。这一更新标志着Meta在AI代
【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B
和语法规则,将这些词汇串联起来,形成一个完整的回答
关于LLaMA及LLaMA.cpp
LLaMA全称是Large Language Model Meta AI,是由Meta
发表于 12-22 10:18
评论