0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达联手推出StarCoder2 LLM系列模型,成代码生成领域新标杆

微云疏影 来源:综合整理 作者:综合整理 2024-02-29 10:14 次阅读

近期,英伟达与Hugging Face及ServiceNow携手推出新品StarCoder2系列LLMs模型,致力于在代码生成领域建立新的行业标杆,凭借诸多优势凸显性能、透明度以及经济性。

此系列共包含三款模型,其中ServiceNow负责训练的30亿参数模型、Hugging Face训练的70亿参数模型以及英伟达训练的150亿参数模型。

新一代模型得以实现,借助Stack v2代码集,该数据集容量是上一代Stack v1的7倍之多。此外,创新性的训练技术使其能够更精准地解析低资源编程语言、数学和程序源代码讨论等内容。

经过619门编程语言的训练后,StarCoder2支持多种专业任务,例如源代码生成、工作流创建以及文本摘要等。英伟达承诺,开发者可借此进行代码填充、高层次代码摘要以及代码片段搜索等操作,以提升工作效率。

相比初版StarCoder LLM,这款30亿参数的最新模型对优质参数进行了更为精确的筛选,性能相当于初版150亿参数模型的StarCoder。

特别值得关注的是,StarCoder2特许使用BigCode Open RAIL-M许可证,无需支付任何版权费用即可享受使用权。IT之家建议有需用户前往BigCode项目GitHub页面下载源代码,同时亦可在Hugging Face获取模型信息

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编程语言
    +关注

    关注

    10

    文章

    1937

    浏览量

    34588
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24635
  • 英伟达
    +关注

    关注

    22

    文章

    3739

    浏览量

    90790
收藏 人收藏

    评论

    相关推荐

    微软携手英伟与GitHub推出生成式AI加速器

    近日,微软宣布在英国推出一项重大合作项目——生成式人工智能加速器。这一项目由微软、英伟和GitHub三家科技巨头强强联手,旨在加速
    的头像 发表于 11-05 14:58 324次阅读

    英伟推出归一化Transformer,革命性提升LLM训练速度

    英伟团队近日在AI领域投下了一枚震撼弹,他们提出了一种全新的神经网络架构——归一化Transformer(nGPT)。这一创新架构基于超球面(hypersphere)进行表示学习,为AI领域
    的头像 发表于 10-23 11:30 338次阅读

    英伟推出Eagle系列模型

    英伟最新推出的Eagle系列模型,以其1024×1024像素的高分辨率处理能力,重新定义了视觉信息处理的边界。该
    的头像 发表于 09-03 16:13 411次阅读

    模型LLM与ChatGPT的技术原理

    与机器的交互方式。这些技术通过深度学习和自然语言生成(Natural Language Generation, NLG)的结合,实现了对复杂语言任务的高效处理。本文将深入探讨大模型LLM和ChatGPT的技术原理,并通过
    的头像 发表于 07-10 10:38 691次阅读

    llm模型有哪些格式

    : 基于Transformer的模型 Transformer是一种基于自注意力机制的模型,广泛应用于NLP领域。基于Transformer的LLM
    的头像 发表于 07-09 09:59 543次阅读

    llm模型和chatGPT的区别

    LLM(Large Language Model)是指大型语言模型,它们是一类使用深度学习技术构建的自然语言处理(NLP)模型LLM模型
    的头像 发表于 07-09 09:55 909次阅读

    LLM模型的应用领域

    在本文中,我们将深入探讨LLM(Large Language Model,大型语言模型)的应用领域LLM是一种基于深度学习的人工智能技术,它能够理解和
    的头像 发表于 07-09 09:52 512次阅读

    英伟开源Nemotron-4 340B系列模型,助力大型语言模型训练

    近日,英伟宣布开源了一款名为Nemotron-4 340B的大型模型,这一壮举为开发者们打开了通往高性能大型语言模型LLM)训练的新天地
    的头像 发表于 06-17 14:53 535次阅读

    英伟推出AI模型推理服务NVIDIA NIM

    英伟近日宣布推出一项革命性的AI模型推理服务——NVIDIA NIM。这项服务将极大地简化AI模型部署过程,为全球的2800万
    的头像 发表于 06-04 09:15 636次阅读

    进一步解读英伟 Blackwell 架构、NVlink及GB200 超级芯片

    30 倍,能源效率提高了 25 倍。这些提升使得它能够更快地处理大规模的人工智能任务,加速模型的训练和推理过程。 **2. **超级计算机 英伟
    发表于 05-13 17:16

    了解大型语言模型 (LLM) 领域中的25个关键术语

    的GPT系列、Google的Gemini、AnthropicAI的Claude、Meta的Llama模型等LLMs的发展,标志着自然语言处理领域的重大进步。2.训练训练
    的头像 发表于 05-10 08:27 1214次阅读
    了解大型语言<b class='flag-5'>模型</b> (<b class='flag-5'>LLM</b>) <b class='flag-5'>领域</b>中的25个关键术语

    英伟推出生成式AI专业认证

    在人工智能日益成为技术发展的核心领域的今天,英伟在近日举行的GTC大会上将推出生成式AI专业认证。这一创新举措旨在帮助开发者、职场人士以及其他相关人员更好地证明和展示自己在
    的头像 发表于 03-19 11:44 828次阅读

    Anthropic发布Claude3系列模型

    近日,人工智能领域的创新者 Anthropic 宣布推出其备受瞩目的 Claude 3 系列大型语言模型LLM)。这一
    的头像 发表于 03-06 09:56 559次阅读

    ServiceNow、Hugging Face和NVIDIA发布StarCoder2助力生成式AI构建企业应用

    与 BigCode 社区共同创建的 StarCoder2 是在 600 多种编程语言上训练而成,它将推进代码生成、透明度、治理和创新。
    的头像 发表于 03-01 10:28 399次阅读

    ServiceNow、Hugging Face 和 NVIDIA 发布全新开放获取 LLM,助力开发者运用生成式 AI 构建企业应用

    2024 年 2 月 28 日 - ServiceNow(NYSE:NOW)、Hugging Face 和 NVIDIA 于今日发布 StarCoder2,其为一系列用于代码
    发表于 02-29 11:12 231次阅读
    ServiceNow、Hugging Face 和 NVIDIA 发布全新开放获取 <b class='flag-5'>LLM</b>,助力开发者运用<b class='flag-5'>生成</b>式 AI 构建企业应用