ServiceNow、Hugging Face和NVIDIA发布StarCoder2助力生成式AI构建企业应用-电子发烧友网

与 BigCode 社区共同创建的 StarCoder2 是在 600 多种编程语言上训练而成，它将推进代码生成、透明度、治理和创新。

ServiceNow、Hugging Face 和 NVIDIA 于今日发布 StarCoder2，其为一系列用于代码生成的开放获取大语言模型（LLM），将为性能、透明度和成本效益树立新标准。

StarCoder2 的联合开发者 BigCode 社区是由 ServiceNow 和 Hugging Face 共同管理。前者是一家领先的数字工作流公司，致力于为每个人创造更好的工作环境；后者则是最常用的开源平台，机器学习社区在该平台上就模型、数据集和应用程序开展合作。

在 619 种编程语言上训练而成的 StarCoder2，可接受进一步的训练并嵌入到企业应用中，以执行应用源代码生成、工作流生成、文本摘要等特定任务。开发者可以使用它的代码补全、高级代码摘要、代码片段检索等功能，加快创新速度及提高工作效率。

StarCoder2 提供三种规模的模型：由 ServiceNow 训练的 30 亿参数模型、由 Hugging Face 训练的 70 亿参数模型，以及由 NVIDIA 使用 NVIDIA NeMo 构建并在 NVIDIA 加速基础设施上训练的 150 亿参数模型。规模较小的模型由于参数较少，在推理过程中所需的计算量较少，可在提供强大性能的同时节省计算成本。实际上，新的 30 亿参数模型在性能上与原有的 StarCoder 150 亿参数模型不相上下。

ServiceNow 的 StarCoder2 开发团队负责人兼 BigCode 联合负责人 Harm de Vries 表示：“StarCoder2 证明了将开放式科学协作和负责任的 AI 实践与道德数据供应链相结合所产生的力量。这一极其先进的开放获取模型将提高已有生成式 AI 的性能和开发者的生产力，为开发者提供平等的机会，获得代码生成式 AI 的优势。这使任何规模的企业都能更加轻松地激发其全部业务潜力。”

Hugging Face 机器学习工程师兼 BigCode 联合负责人 Leandro von Werra 表示：“在 Hugging Face、ServiceNow 和 NVIDIA 的共同努力下，这套功能强大的基础模型终于问世。在数据和训练完全透明的情况下，社区能够更加高效地构建各种应用。StarCoder2 证明了开源和开放式科学的潜力，我们正在努力实现负责任 AI 的全民化。”

NVIDIA 应用研究副总裁 Jonathan Cohen 表示：“由于每个软件生态系统都有专门的编程语言，代码 LLM 可以推动各行业效率和创新方面的突破。NVIDIA 与 ServiceNow 和 Hugging Face 的合作带来了安全且负责任的模型，让更多人能够用上负责任的生成式 AI，我们相信这将使全球社区受益。”

StarCoder2 模型

为自定义应用开发增添强大助力

StarCoder2 模型均使用来自 BigCode 的先进架构和精心挑选的数据源。为了实现负责任的大规模创新，数据源的透明度和开放治理被放在第一位。

StarCoder2 提升了未来由 AI 驱动的编码应用的潜力，包括各种文本-代码和文本-工作流转换功能。通过更加广泛、深入的编程训练，它可以提供资源库上下文，从而实现准确的上下文感知预测。无论是经验丰富的软件工程师还是业余开发者等，都能利用这些进步提升业务价值和推动数字化转型。

StarCoder2 的基础是一个名为 Stack v2 的新代码数据集，该数据集规模比 Stack v1 大 7 倍多。除了先进的数据集之外，新的训练技术也有助于模型理解低资源编程语言（如 COBOL 等）、数学和程序源代码讨论。

使用特定业务数据对先进功能进行微调

用户可以使用 NVIDIA、NeMo 或 Hugging Face TRL 等开源工具，利用特定行业或组织的数据，对开放获取的 StarCoder2 模型进行微调。可以创建高级聊天机器人来处理更复杂的摘要或分类任务、开发能够快速且轻松地完成编程任务的个性化编码助手、检索相关代码片段，并实现文本-工作流转换功能。

为创建适合自身业务的特定任务功能，各企业已经开始对 StarCoder 基础模型进行微调。

ServiceNow 的文本-代码 Now LLM 就是在 150 亿参数 StarCoder LLM 的专用版本上构建而成的，并针对其工作流模式、用例和流程进行了微调和训练。Hugging Face 也使用该模型创建了自己的 StarChat 助手。

BigCode 促进 AI 领域的开放式科学协作

BigCode 是一个由 Hugging Face 和 ServiceNow 领导的开放式科学协作社区，致力于负责任的代码 LLM 开发。

BigCode 社区以工作组和特别任务组的形式积极参与 StarCoder2 项目的技术工作，分别使用 ServiceNow 的 Fast LLM 框架来训练 30 亿参数模型、使用 Hugging Face 的 nanotron 框架来训练 70 亿参数模型，以及 NVIDIA NeMo 云原生框架和 NVIDIA TensorRT-LLM 软件来训练和优化 150 亿参数模型。

BigCode 的核心宗旨是促进负责任的创新，其开放的治理、透明的供应链、开源软件的使用，以及让开发者选择数据不用于训练等做法都体现了这一点。StarCoder2 是在获得 Inria 托管的 Software Heritage 数字共享许可下，使用负责任的数据构建而成的。

Software Heritage 总监 Roberto Di Cosmo 表示：“StarCoder2 是首个使用 Software Heritage 源代码存档开发的代码生成式 AI 模型，其构建方式符合我们负责任地开发代码模型的政策。ServiceNow、Hugging Face 和 NVIDIA 的这一合作体现了对道德 AI 开发的共同承诺，引领技术朝着更崇高的利益发展。”

StarCoder2 与其前代一样，将在 BigCode Open RAIL-M 许可下免费提供访问和使用。为进一步促进透明度和协作，该模型的支持代码将继续保留在 BigCode 项目的 GitHub 页面上。

所有 StarCoder2 模型还可以在 Hugging Face 上下载。StarCoder2 150 亿参数模型通过 NVIDIA AI Foundation 模型提供，开发者可以直接在浏览器上或通过 API 端点进行试用。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4940

浏览量
102815
机器学习

机器学习

+关注

关注
66

文章
8377

浏览量
132407
大模型

大模型

+关注

关注
2

文章
2328

浏览量
2481
生成式AI

生成式AI

+关注

关注
0

文章
488

浏览量
459

原文标题：ServiceNow、Hugging Face和NVIDIA发布全新开放获取LLM，助力开发者运用生成式AI构建企业应用

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

NVIDIA助力Amdocs打造生成式AI智能体

正在使用NVIDIA DGX Cloud 与 NVIDIA AI Enterprise软件开发和交付基于商用大语言模型（LLM）和领域适配模型的解决方案。该公司还在使用NVIDIA

发表于 11-19 14:48 •234次阅读

NVIDIA AI助力SAP生成式AI助手Joule加速发展

在美国佛罗里达州奥兰多举行的 SAP Sapphire 大会上，NVIDIA 与这家企业软件公司公布了搭载NVIDIA AI Enterprise软件的

发表于 09-09 09:37 •386次阅读

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

NVIDIA近日宣布了一项重大举措，正式推出NVIDIA AI Foundry服务与NVIDIA NIM（NVIDIA Inference

发表于 07-25 16:57 •493次阅读

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

借助 NVIDIA AI Foundry，企业和各国现在能够使用自有数据与 Llama 3.1 405B 和 NVIDIA Nemotron 模型配对，来

发表于 07-24 09:39 •681次阅读

<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry 为全球<b class='flag-5'>企业</b>打造自定义 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 模型

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

关系进一步深化。助力生成式 AI 的企业级应用与发展加速驶入快车道。 HPE Private Cloud

发表于 06-20 17:36 •678次阅读

NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服务

采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服务，以加速新一代数字人的发展，并将在平台上推出全新的

发表于 06-04 10:18 •618次阅读

NVIDIA发布数字人微服务，为制作生成式AI数字化身铺平未来之路

COMPUTEX—2024年6月2日— NVIDIA宣布全面推出NVIDIA ACE生成式AI

发表于 06-03 17:43 •171次阅读

亚马逊云携手AI新创企业Hugging Face，提升AI模型在定制芯片计算性能

Hugging Face作为一家估值为45亿美元的公司现已成为了众多AI研究员和开发者分享Chatbot和相关软件的核心平台，受到亚马逊、谷歌、英伟达等巨头的青睐。

发表于 05-23 14:24 •380次阅读

SAP与NVIDIA携手加速生成式AI在企业应用中的普及

SAP SE 和 NVIDIA 宣布深化合作，致力于加速企业客户在 SAP 云解决方案和应用组合中利用数据和生成式 AI 的变革力量。

发表于 03-22 10:02 •568次阅读

NVIDIA推出微服务，助力企业迈向生成式AI

NVIDIA 的 AI 平台适用于任何高瞻远瞩的企业使用，而且比以往任何时候都更加易于应用。

发表于 03-21 09:39 •367次阅读

NVIDIA即将推出一项新的生成式AI专业认证

NVIDIA 即将推出一项新的生成式 AI 专业认证，助力开发者在这一重要领域证明自身技术实力。

发表于 03-14 09:43 •516次阅读

ServiceNow、Hugging Face 和 NVIDIA 发布全新开放获取 LLM，助力开发者运用生成式 AI 构建企业应用

2024 年 2 月 28 日 - ServiceNow（NYSE：NOW）、Hugging Face 和 NVIDIA 于今日

发表于 02-29 11:12 •232次阅读

英伟达与ServiceNow合作推出通信行业专用生成式AI解决方案

英伟达，全球知名的图形处理器（GPU）制造商，以及企业级IT服务管理和运营管理云端平台供应商ServiceNow，近日宣布将进一步深化合作，为通信行业推出专用的生成式

发表于 02-28 10:13 •471次阅读

NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

微服务，支持企业将自定义大语言模型与企业数据相连接，使其 AI 应用能够提供高度准确的响应。 NVIDIA NeMo Retriever 是 NV

发表于 11-29 21:05 •592次阅读

NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

。 NVIDIA NeMo™ Retriever 是 NVIDIA NeMo（一个用于构建、自定义和部署生成式

发表于 11-29 14:37 •267次阅读

搜索历史

ServiceNow、Hugging Face和NVIDIA发布StarCoder2助力生成式AI构建企业应用

评论

NVIDIA助力Amdocs打造生成式AI智能体

NVIDIA AI助力SAP生成式AI助手Joule加速发展

NVIDIA携手Meta推出AI服务，为企业提供生成式AI服务

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服务

NVIDIA发布数字人微服务，为制作生成式AI数字化身铺平未来之路

亚马逊云携手AI新创企业Hugging Face，提升AI模型在定制芯片计算性能

SAP与NVIDIA携手加速生成式AI在企业应用中的普及

NVIDIA推出微服务，助力企业迈向生成式AI

NVIDIA即将推出一项新的生成式AI专业认证

ServiceNow、Hugging Face 和 NVIDIA 发布全新开放获取 LLM，助力开发者运用生成式 AI 构建企业应用

英伟达与ServiceNow合作推出通信行业专用生成式AI解决方案

NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能