大语言模型的炒作曲线-电子发烧友网

最近几个月，大型语言模型成为了全球的热门词汇，频频登上各大新闻头条。这些复杂的模型，比如 OpenAI 的 GPT-4 和 Meta 的 LLaMA，激发了研究人员、开发人员和公众的想象力。

然而，无异于任何一门具有变革性的技术，大型语言模型也经历过炒作，随之而来的预期波动以及恐惧。2022 年底，随着人们对人工智能与生成式 AI 的期望达到高潮，Gartner 发布了一份炒作周期报告。随着 GPT-4 宣布后，新 AI 产品的开发呈爆炸式增长，时隔不到一年，如今我们处于大型语言模型炒作曲线的什么位置？

大型语言模型究竟是什么？在讨论炒作曲线之前，我们先来介绍一下大型语言模型究竟是什么。这种模型是生成式 AI 的一个子集，生成文本的能力得以优化，特别是在给定提示和相关上下文的情况下预测句子中的下一个单词。这些模型接受了在非常大的数据集上的训练，使用的参数超过十亿个，而且经过了人类（或其他大型语言模型）的微调。这类模型包括 BERT、GPT 和 T5 等。说到底，大型语言模型就是文本计算器，知道如何根据给定的提示，创建人类可以理解的文本。

炒作曲线：从兴奋到现实主义在某种新技术出现时，经常能够观察到炒作曲线。初期阶段，受到崇高的承诺和有远见的预测的驱使，人们会产生极大的兴奋和期待。就大型语言模型而言，生成连贯且与上下文紧密相关的文本的能力带动了最初的炒作。媒体报道了这些模型的惊人功能，激发了各行各业无数人的想象力。同时，对于这类工具的误解而产生的恐惧也引发了很多争议。

过高期望的峰值期随着大型语言模型受到的关注越来越多，对其能力的期望也膨胀至前所未有的高度。人们设想未来人工智能生成的内容将彻底改变新闻业、客户服务、内容创作，乃至个人助理等行业。然而，在这个高峰阶段，我们必须谨记这些模型还远非完美，并且有其局限性。

泡沫化的底谷期在期望峰值过后，大型语言模型的实际情况逐步浮出水面，并由此而进入一段底谷期。虽然这些模型可以生成令人印象深刻的文本或图像，但它们也有可能生成不准确、带有偏见或无意义的输出。此外，在此阶段，围绕人工智能的伦理问题和对此类技术的潜在滥用被放大。结果是，热情消退，公众情绪向怀疑和恐惧倾斜。我认为，如今我们就处于这个阶段，而且我们已经加速通过了过高期望的峰值期！虽然许多个人和公司利用这项技术创造了巨大的价值，但只是少数个例，而且很多人仍处于泡沫化的底谷期。

稳步爬升的光明期随着最初的炒作消退，人们对大型语言模型的理解开始更加真实。研究人员和开发人员积极致力于解决与这些模型相关的局限性和挑战。在微调技巧、数据质量和减少偏差等方面进行了改进。人们的关注从过高的期望过渡到实际应用的改进技术。在稳步爬升的光明期，大型语言模型的真正潜力和价值开始具体化。大型语言模型并不能解决所有的问题，但可以非常接近。根据帕累托法则（又名80/20法则，约仅有20%的因素影响80%的结果），这些工具只有20%的概率帮助你创造80%的价值，具体取决于用例。这些模型以人与机器之间前所未有的方式释放创造力。不仅可以加快构思的过程，而且还可以消除解决问题的许多障碍。

实质生产的高原期 ‍最终，大型语言模型将找到各自的立足之地，并为多个行业做出有意义的贡献。改进部署战略，更好地理解自己的优势和局限性，再加上适当的道德考量，这些模型都能成为有价值的工具。大型语言模型不仅能帮助我们完成内容创建、语言翻译、聊天机器人等任务，甚至能够辅助研究人员的研发工作。实质生产的高原期标志着大型语言模型的成熟阶段，它们将无缝融入我们的生活，并成为提供支持的工具。这一切何时会实现还有待观察，但可能比我们想象的要早！

总结 ‍毫无疑问，大型语言模型在人工智能领域引起了轰动。围绕这些模型的炒作曲线是一个自然而然的过程，任何变革性的技术都会经历。虽然最初过高的期望可能会引发低谷期，但必须承认这些模型具有巨大的潜力。随着技术的不断成熟，难题的攻克，以及应用程序的改进，大型语言模型有望成为加强人类的创造力以及解决问题的宝贵资产。理解和管理炒作曲线，可以帮助我们负责任地利用这些强大的工具，并利用它们改善社会。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1792

文章
47425

浏览量
238948
语言模型

语言模型

+关注

关注
0

文章
530

浏览量
10297

原文标题：大语言模型的炒作曲线

文章出处：【微信号：AI科技大本营，微信公众号：AI科技大本营】欢迎添加关注！文章转载请注明出处。

语言模型管理的作用

要充分发挥语言模型的潜力，有效的语言模型管理非常重要。以下，是对语言模型管理作用的分析，由AI部

发表于 01-02 11:06 •85次阅读

大语言模型开发框架是什么

大语言模型开发框架是指用于训练、推理和部署大型语言模型的软件工具和库。下面，AI部落小编为您介绍大语言模

发表于 12-06 10:28 •138次阅读

大语言模型开发语言是什么

在人工智能领域，大语言模型（Large Language Models, LLMs）背后，离不开高效的开发语言和工具的支持。下面，AI部落小编为您介绍大语言

发表于 12-04 11:44 •147次阅读

大语言模型如何开发

大语言模型的开发是一个复杂且细致的过程，涵盖了数据准备、模型架构设计、训练、微调和部署等多个阶段。以下是对大语言模型开发步骤的介绍，由AI部

发表于 11-04 10:14 •164次阅读

【《大语言模型应用指南》阅读体验】+ 俯瞰全书

上周收到《大语言模型应用指南》一书，非常高兴，但工作项目繁忙，今天才品鉴体验，感谢作者编写了一部内容丰富、理论应用相结合、印刷精美的著作，也感谢电子发烧友论坛提供了一个让我了解大语言模型

发表于 07-21 13:35

大语言模型的预训练

随着人工智能技术的飞速发展，自然语言处理（NLP）作为人工智能领域的一个重要分支，取得了显著的进步。其中，大语言模型（Large Language Model, LLM）凭借其强大的语言

发表于 07-11 10:11 •448次阅读

大语言模型(LLM)快速理解

自2022年，ChatGPT发布之后，大语言模型（LargeLanguageModel），简称LLM掀起了一波狂潮。作为学习理解LLM的开始，先来整体理解一下大语言模型。一、发展历史大

发表于 06-04 08:27 •1010次阅读

大语言模型：原理与工程时间+小白初识大语言模型

解锁我理解的是基于深度学习，需要训练各种数据知识最后生成自己的的语言理解和能力的交互模型。对于常说的RNN是处理短序列的数据时表现出色，耳真正厉害的是Transformer，此框架被推出后直接

发表于 05-12 23:57

【大语言模型：原理与工程实践】大语言模型的应用

，它通过抽象思考和逻辑推理，协助我们应对复杂的决策。相应地，我们设计了两类任务来检验大语言模型的能力。一类是感性的、无需理性能力的任务，类似于人类的系统1，如情感分析和抽取式问答等。大语言

发表于 05-07 17:21

【大语言模型：原理与工程实践】大语言模型的评测

大语言模型的评测是确保模型性能和应用适应性的关键环节。从基座模型到微调模型，再到行业模型和整体能

发表于 05-07 17:12

【大语言模型：原理与工程实践】大语言模型的预训练

大语言模型的核心特点在于其庞大的参数量，这赋予了模型强大的学习容量，使其无需依赖微调即可适应各种下游任务，而更倾向于培养通用的处理能力。然而，随着学习容量的增加，对预训练数据的需求也相应

发表于 05-07 17:10

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》2.0

《大语言模型“原理与工程实践”》是关于大语言模型内在机理和应用实践的一次深入探索。作者不仅深入讨论了理论，还提供了丰富的实践案例，帮助读者理解如何将理论知识应用于解决实际问题。书中的案

发表于 05-07 10:30

【大语言模型：原理与工程实践】大语言模型的基础技术

全面剖析大语言模型的核心技术与基础知识。首先，概述自然语言的基本表示，这是理解大语言模型技术的前提。接着，详细介绍自然

发表于 05-05 12:17

【大语言模型：原理与工程实践】揭开大语言模型的面纱

大语言模型（LLM）是人工智能领域的尖端技术，凭借庞大的参数量和卓越的语言理解能力赢得了广泛关注。它基于深度学习，利用神经网络框架来理解和生成自然语言文本。这些

发表于 05-04 23:55

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》

《大语言模型》是一本深入探讨人工智能领域中语言模型的著作。作者通过对语言模型的基本概念、基础技术

发表于 04-30 15:35

搜索历史

大语言模型的炒作曲线

评论

语言模型管理的作用

大语言模型开发框架是什么

大语言模型开发语言是什么

大语言模型如何开发

【《大语言模型应用指南》阅读体验】+ 俯瞰全书

大语言模型的预训练

大语言模型(LLM)快速理解

大语言模型：原理与工程时间+小白初识大语言模型

【大语言模型：原理与工程实践】大语言模型的应用

【大语言模型：原理与工程实践】大语言模型的评测

【大语言模型：原理与工程实践】大语言模型的预训练

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》2.0

【大语言模型：原理与工程实践】大语言模型的基础技术

【大语言模型：原理与工程实践】揭开大语言模型的面纱

【大语言模型：原理与工程实践】探索《大语言模型原理与工程实践》