0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一套开源的大型语言模型(LLM)—— StableLM

OSC开源社区 来源:OSC开源社区 2023-04-24 10:07 次阅读

Stability AI 是 Stable Diffusion 图像生成工具背后的公司,如今他们不再局限于开发图像 / 视频生成方面的 AI,于今天正式发布了一套开源的大型语言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。

StableLM 跟 ChatGPT、Bard 这些一样,被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的,这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过,Stability AI 在 the Pile 的基础上进行了扩展,所使用的数据集大小是标准 the Pile 的 3 倍。

Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上,开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段,它的参数也比较少,只有 30 亿和 70 亿个参数,之后他们还会推出有 150 亿到 650 亿参数的模型。

e9cfbea8-df9c-11ed-bfe3-dac502259ad0.png

对于 AI 可能会产生的风险,Stability AI 也给出了提醒:

对于任何没有额外微调和强化学习的预训练大型语言模型来说,用户得到的回应质量可能参差不齐,并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

e9ff4f24-df9c-11ed-bfe3-dac502259ad0.jpg

除了将代码托管在 GitHub 上,Stability AI 还在 Hugging Face 上发布了一个演示版本,经过测试 StableLM 会说中文,但只会一点点(回复内容对应不上,语句也不通顺)。

ea1836ba-df9c-11ed-bfe3-dac502259ad0.png

在 Stable Diffusion 发布后,Stability AI 遭到了很多艺术家的投诉和起诉,指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具,侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下,如今推出 StableLM 不知道是否还会引发更多的诉讼。

Stability AI 在去年 10 月融资了 1 亿美元,公司估值也超过了 10 亿美元。但 AI 是一个投入非常高,可能短期也很难产生收益的领域,也不知道这 1 亿美金现在还剩多少,为了在这个领域持续发展,Stability AI 会不会继续融资,亦或是投入某个大型公司的怀抱呢?

项目地址:https://github.com/Stability-AI/StableLM

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    504

    浏览量

    10244
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24636
  • GitHub
    +关注

    关注

    3

    文章

    466

    浏览量

    16381
  • LLM
    LLM
    +关注

    关注

    0

    文章

    272

    浏览量

    304

原文标题:AI作画鼻祖Stability AI推出大型语言模型,会一点点中文

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是LLMLLM在自然语言处理中的应用

    随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了革命性的进步。其中,大型语言模型LLM)的出现,标志着我们对
    的头像 发表于 11-19 15:32 277次阅读

    如何训练自己的LLM模型

    训练自己的大型语言模型LLM)是个复杂且资源密集的过程,涉及到大量的数据、计算资源和专业知识。以下是训练
    的头像 发表于 11-08 09:30 320次阅读

    LLM模型推理加速的关键技术

    LLM大型语言模型)大模型推理加速是当前人工智能领域的个研究热点,旨在提高
    的头像 发表于 07-24 11:38 765次阅读

    基于CPU的大型语言模型推理实验

    随着计算和数据处理变得越来越分散和复杂,AI 的重点正在从初始训练转向更高效的AI 推理。Meta 的 Llama3 是功能强大的公开可用的大型语言模型LLM)。本次测试采用
    的头像 发表于 07-18 14:28 475次阅读
    基于CPU的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>推理实验

    富士通与Cohere合作,专注于开发和提供大型语言模型(LLM)

    富士通(Fujitsu)与总部位于多伦多与旧金山的顶尖安全及数据隐私人工智能企业Cohere Inc.携手宣布建立深度战略合作伙伴关系,共同致力于大型语言模型LLM)的创新与开发,旨
    的头像 发表于 07-16 16:55 457次阅读

    llm模型本地部署有用吗

    在当今的人工智能领域,LLM(Large Language Model,大型语言模型)已经成为了种非常受欢迎的技术。它们在自然
    的头像 发表于 07-09 10:14 394次阅读

    llm模型训练般用什么系统

    LLM(Large Language Model,大型语言模型)是近年来在自然语言处理领域取得显著成果的
    的头像 发表于 07-09 10:02 346次阅读

    llm模型有哪些格式

    LLM(Large Language Model,大型语言模型)是种深度学习模型,主要用于处理
    的头像 发表于 07-09 09:59 543次阅读

    llm模型和chatGPT的区别

    LLM(Large Language Model)是指大型语言模型,它们是类使用深度学习技术构建的自然
    的头像 发表于 07-09 09:55 909次阅读

    LLM模型的应用领域

    在本文中,我们将深入探讨LLM(Large Language Model,大型语言模型)的应用领域。LLM
    的头像 发表于 07-09 09:52 513次阅读

    英伟达开源Nemotron-4 340B系列模型,助力大型语言模型训练

    近日,英伟达宣布开源款名为Nemotron-4 340B的大型模型,这壮举为开发者们打开了通往高性能大型
    的头像 发表于 06-17 14:53 535次阅读

    语言模型(LLM)快速理解

    自2022年,ChatGPT发布之后,大语言模型(LargeLanguageModel),简称LLM掀起了波狂潮。作为学习理解LLM的开始
    的头像 发表于 06-04 08:27 897次阅读
    大<b class='flag-5'>语言</b><b class='flag-5'>模型</b>(<b class='flag-5'>LLM</b>)快速理解

    LLM之外的性价比之选,小语言模型

    。然而在些对实时性要求较高的应用中,比如AI客服、实时数据分析等,大语言模型并没有太大的优势。   在动辄万亿参数的LLM下,硬件需求已经遭受了不小的挑战。所以面对
    的头像 发表于 06-03 05:15 2177次阅读
    <b class='flag-5'>LLM</b>之外的性价比之选,小<b class='flag-5'>语言</b><b class='flag-5'>模型</b>

    了解大型语言模型 (LLM) 领域中的25个关键术语

    1.LLM(大语言模型大型语言模型(LLMs)是先进的人工智能系统,经过大量文本数据集的训练,
    的头像 发表于 05-10 08:27 1215次阅读
    了解<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b> (<b class='flag-5'>LLM</b>) 领域中的25个关键术语

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM
    的头像 发表于 04-28 10:36 480次阅读