英伟达联手推出StarCoder2 LLM系列模型，成代码生成领域新标杆-电子发烧友网

英伟达联手推出StarCoder2 LLM系列模型，成代码生成领域新标杆

近期，英伟达与Hugging Face及ServiceNow携手推出新品StarCoder2系列LLMs模型，致力于在代码生成领域建立新的行业标杆，凭借诸多优势凸显性能、透明度以及经济性。

此系列共包含三款模型，其中ServiceNow负责训练的30亿参数模型、Hugging Face训练的70亿参数模型以及英伟达训练的150亿参数模型。

新一代模型得以实现，借助Stack v2代码集，该数据集容量是上一代Stack v1的7倍之多。此外，创新性的训练技术使其能够更精准地解析低资源编程语言、数学和程序源代码讨论等内容。

经过619门编程语言的训练后，StarCoder2支持多种专业任务，例如源代码生成、工作流创建以及文本摘要等。英伟达承诺，开发者可借此进行代码填充、高层次代码摘要以及代码片段搜索等操作，以提升工作效率。

相比初版StarCoder LLM，这款30亿参数的最新模型对优质参数进行了更为精确的筛选，性能相当于初版150亿参数模型的StarCoder。

特别值得关注的是，StarCoder2特许使用BigCode Open RAIL-M许可证，无需支付任何版权费用即可享受使用权。IT之家建议有需用户前往BigCode项目GitHub页面下载源代码，同时亦可在Hugging Face获取模型信息。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

编程语言

编程语言

+关注

关注
10

文章
1947

浏览量
34824
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24742
英伟达

英伟达

+关注

关注
22

文章
3800

浏览量
91351

NaVILA：加州大学与英伟达联合发布新型视觉语言模型

日前，加州大学的研究人员携手英伟达，共同推出了一款创新的视觉语言模型——NaVILA。该模型在机器人导航

发表于 12-13 10:51 •294次阅读

微软携手英伟达与GitHub推出生成式AI加速器

近日，微软宣布在英国推出一项重大合作项目——生成式人工智能加速器。这一项目由微软、英伟达和GitHub三家科技巨头强强联手，旨在加速

发表于 11-05 14:58 •420次阅读

英伟达推出归一化Transformer，革命性提升LLM训练速度

英伟达团队近日在AI领域投下了一枚震撼弹，他们提出了一种全新的神经网络架构——归一化Transformer(nGPT)。这一创新架构基于超球面(hypersphere)进行表示学习，为AI领域

发表于 10-23 11:30 •401次阅读

英伟达推出Eagle系列模型

英伟达最新推出的Eagle系列模型，以其1024×1024像素的高分辨率处理能力，重新定义了视觉信息处理的边界。该

发表于 09-03 16:13 •481次阅读

大模型LLM与ChatGPT的技术原理

与机器的交互方式。这些技术通过深度学习和自然语言生成（Natural Language Generation, NLG）的结合，实现了对复杂语言任务的高效处理。本文将深入探讨大模型LLM和ChatGPT的技术原理，并通过

发表于 07-10 10:38 •910次阅读

llm模型有哪些格式

：基于Transformer的模型 Transformer是一种基于自注意力机制的模型，广泛应用于NLP领域。基于Transformer的LLM模

发表于 07-09 09:59 •662次阅读

llm模型和chatGPT的区别

LLM（Large Language Model）是指大型语言模型，它们是一类使用深度学习技术构建的自然语言处理（NLP）模型。LLM模型可

发表于 07-09 09:55 •1158次阅读

LLM模型的应用领域

在本文中，我们将深入探讨LLM（Large Language Model，大型语言模型）的应用领域。LLM是一种基于深度学习的人工智能技术，它能够理解和

发表于 07-09 09:52 •632次阅读

英伟达开源Nemotron-4 340B系列模型，助力大型语言模型训练

近日，英伟达宣布开源了一款名为Nemotron-4 340B的大型模型，这一壮举为开发者们打开了通往高性能大型语言模型（LLM）训练的新天地

发表于 06-17 14:53 •581次阅读

英伟达推出AI模型推理服务NVIDIA NIM

英伟达近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程，为全球的2800万

发表于 06-04 09:15 •693次阅读

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

30 倍，能源效率提高了 25 倍。这些提升使得它能够更快地处理大规模的人工智能任务，加速模型的训练和推理过程。 **2. **超级计算机英伟达

发表于 05-13 17:16

了解大型语言模型 (LLM) 领域中的25个关键术语

的GPT系列、Google的Gemini、AnthropicAI的Claude、Meta的Llama模型等LLMs的发展，标志着自然语言处理领域的重大进步。2.训练训练

发表于 05-10 08:27 •1277次阅读

英伟达将推出生成式AI专业认证

在人工智能日益成为技术发展的核心领域的今天，英伟达在近日举行的GTC大会上将推出生成式AI专业认证。这一创新举措旨在帮助开发者、职场人士以及其他相关人员更好地证明和展示自己在

发表于 03-19 11:44 •910次阅读

ServiceNow、Hugging Face和NVIDIA发布StarCoder2助力生成式AI构建企业应用

与 BigCode 社区共同创建的 StarCoder2 是在 600 多种编程语言上训练而成，它将推进代码生成、透明度、治理和创新。

发表于 03-01 10:28 •465次阅读

ServiceNow、Hugging Face 和 NVIDIA 发布全新开放获取 LLM，助力开发者运用生成式 AI 构建企业应用

2024 年 2 月 28 日 - ServiceNow（NYSE：NOW）、Hugging Face 和 NVIDIA 于今日发布 StarCoder2，其为一系列用于代码

发表于 02-29 11:12 •256次阅读

搜索历史

英伟达联手推出StarCoder2 LLM系列模型，成代码生成领域新标杆

评论

NaVILA：加州大学与英伟达联合发布新型视觉语言模型

微软携手英伟达与GitHub推出生成式AI加速器

英伟达推出归一化Transformer，革命性提升LLM训练速度

英伟达推出Eagle系列模型

大模型LLM与ChatGPT的技术原理

llm模型有哪些格式

llm模型和chatGPT的区别

LLM模型的应用领域

英伟达开源Nemotron-4 340B系列模型，助力大型语言模型训练

英伟达推出AI模型推理服务NVIDIA NIM

进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

了解大型语言模型 (LLM) 领域中的25个关键术语

英伟达将推出生成式AI专业认证

ServiceNow、Hugging Face和NVIDIA发布StarCoder2助力生成式AI构建企业应用

ServiceNow、Hugging Face 和 NVIDIA 发布全新开放获取 LLM，助力开发者运用生成式 AI 构建企业应用