一套开源的大型语言模型（LLM）—— StableLM-电子发烧友网

Stability AI 是 Stable Diffusion 图像生成工具背后的公司，如今他们不再局限于开发图像 / 视频生成方面的 AI，于今天正式发布了一套开源的大型语言模型（LLM）—— StableLM，首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。

StableLM 跟 ChatGPT、Bard 这些一样，被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的，这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过，Stability AI 在 the Pile 的基础上进行了扩展，所使用的数据集大小是标准 the Pile 的 3 倍。

Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上，开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段，它的参数也比较少，只有 30 亿和 70 亿个参数，之后他们还会推出有 150 亿到 650 亿参数的模型。

对于 AI 可能会产生的风险，Stability AI 也给出了提醒：

对于任何没有额外微调和强化学习的预训练大型语言模型来说，用户得到的回应质量可能参差不齐，并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。

除了将代码托管在 GitHub 上，Stability AI 还在 Hugging Face 上发布了一个演示版本，经过测试 StableLM 会说中文，但只会一点点（回复内容对应不上，语句也不通顺）。

在 Stable Diffusion 发布后，Stability AI 遭到了很多艺术家的投诉和起诉，指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具，侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下，如今推出 StableLM 不知道是否还会引发更多的诉讼。

Stability AI 在去年 10 月融资了 1 亿美元，公司估值也超过了 10 亿美元。但 AI 是一个投入非常高，可能短期也很难产生收益的领域，也不知道这 1 亿美金现在还剩多少，为了在这个领域持续发展，Stability AI 会不会继续融资，亦或是投入某个大型公司的怀抱呢？

项目地址：https://github.com/Stability-AI/StableLM

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

语言模型

语言模型

+关注

关注
0

文章
504

浏览量
10244
数据集

数据集

+关注

关注
4

文章
1205

浏览量
24636
GitHub

GitHub

+关注

关注
3

文章
466

浏览量
16381
LLM

LLM

+关注

关注
0

文章
272

浏览量
304

原文标题：AI作画鼻祖Stability AI推出大型语言模型，会一点点中文

文章出处：【微信号：OSC开源社区，微信公众号：OSC开源社区】欢迎添加关注！文章转载请注明出处。

什么是LLM？LLM在自然语言处理中的应用

随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了革命性的进步。其中，大型语言模型（LLM）的出现，标志着我们对

发表于 11-19 15:32 •277次阅读

如何训练自己的LLM模型

训练自己的大型语言模型（LLM）是一个复杂且资源密集的过程，涉及到大量的数据、计算资源和专业知识。以下是训练

发表于 11-08 09:30 •320次阅读

LLM大模型推理加速的关键技术

LLM（大型语言模型）大模型推理加速是当前人工智能领域的一个研究热点，旨在提高

发表于 07-24 11:38 •765次阅读

基于CPU的大型语言模型推理实验

随着计算和数据处理变得越来越分散和复杂，AI 的重点正在从初始训练转向更高效的AI 推理。Meta 的 Llama3 是功能强大的公开可用的大型语言模型（LLM）。本次测试采用

发表于 07-18 14:28 •475次阅读

基于CPU的<b class='flag-5'>大型</b><b class='flag-5'>语言</b><b class='flag-5'>模型</b>推理实验

富士通与Cohere合作,专注于开发和提供大型语言模型(LLM)

富士通（Fujitsu）与总部位于多伦多与旧金山的顶尖安全及数据隐私人工智能企业Cohere Inc.携手宣布建立深度战略合作伙伴关系，共同致力于大型语言模型（LLM）的创新与开发，旨

发表于 07-16 16:55 •457次阅读

llm模型本地部署有用吗

在当今的人工智能领域，LLM（Large Language Model，大型语言模型）已经成为了一种非常受欢迎的技术。它们在自然

发表于 07-09 10:14 •394次阅读

llm模型训练一般用什么系统

LLM（Large Language Model，大型语言模型）是近年来在自然语言处理领域取得显著成果的

发表于 07-09 10:02 •346次阅读

llm模型有哪些格式

LLM（Large Language Model，大型语言模型）是一种深度学习模型，主要用于处理

发表于 07-09 09:59 •543次阅读

llm模型和chatGPT的区别

LLM（Large Language Model）是指大型语言模型，它们是一类使用深度学习技术构建的自然

发表于 07-09 09:55 •909次阅读

LLM模型的应用领域

在本文中，我们将深入探讨LLM（Large Language Model，大型语言模型）的应用领域。LLM是

发表于 07-09 09:52 •513次阅读

英伟达开源Nemotron-4 340B系列模型，助力大型语言模型训练

近日，英伟达宣布开源了一款名为Nemotron-4 340B的大型模型，这一壮举为开发者们打开了通往高性能大型

发表于 06-17 14:53 •535次阅读

大语言模型(LLM)快速理解

自2022年，ChatGPT发布之后，大语言模型（LargeLanguageModel），简称LLM掀起了一波狂潮。作为学习理解LLM的开始

发表于 06-04 08:27 •897次阅读

LLM之外的性价比之选，小语言模型

。然而在一些对实时性要求较高的应用中，比如AI客服、实时数据分析等，大语言模型并没有太大的优势。在动辄万亿参数的LLM下，硬件需求已经遭受了不小的挑战。所以面对

发表于 06-03 05:15 •2177次阅读

了解大型语言模型 (LLM) 领域中的25个关键术语

1.LLM（大语言模型）大型语言模型(LLMs)是先进的人工智能系统，经过大量文本数据集的训练，

发表于 05-10 08:27 •1215次阅读

NVIDIA加速微软最新的Phi-3 Mini开源语言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一

发表于 04-28 10:36 •480次阅读

搜索历史

一套开源的大型语言模型（LLM）—— StableLM

评论

什么是LLM？LLM在自然语言处理中的应用

如何训练自己的LLM模型

LLM大模型推理加速的关键技术

基于CPU的大型语言模型推理实验

富士通与Cohere合作,专注于开发和提供大型语言模型(LLM)

llm模型本地部署有用吗

llm模型训练一般用什么系统

llm模型有哪些格式

llm模型和chatGPT的区别

LLM模型的应用领域

英伟达开源Nemotron-4 340B系列模型，助力大型语言模型训练

大语言模型(LLM)快速理解

LLM之外的性价比之选，小语言模型

了解大型语言模型 (LLM) 领域中的25个关键术语

NVIDIA加速微软最新的Phi-3 Mini开源语言模型