从词语意义到关系推断，ChatGPT是如何理解人类语言的？-电子发烧友网

导语：这是一个革命性的技术，对于许多知识工作者来说，从市场营销到工程师，从招聘人员到社会工作者，GPT将改变一切。

现在，你可能已经听说过OpenAI的ChatGPT，或者任何一个替代品GPT-3、GPT-4、微软的Bing Chat、Facebook的LLaMa甚至谷歌的Bard。

它们是可以参与对话的人工智能程序。它们非常聪明，很容易被误认为是人类，并能熟练完成各种任务，从写论文到创建网站。

一台电脑怎么能进行这样的对话呢？让我们来看看它是如何工作的。

一种概率性的方法

自然语言最简单的模型是一个天真的概率模型，也被称为马尔可夫链 1 。这个想法很简单：取一个参考文本，越长越好，然后学习单词序列的概率。例如，给定一个句子：

The cat eats the rat. 猫吃了老鼠。

该模型将了解到，在 “猫 ”之后，总是有 “吃”，然后是“的”。但是在“the”之后，有50%的机会出现“猫”，50%的机会出现 “老鼠”。

我们可以用这个模型来问一个不完整的句子后的下一个词是什么。如果我们重复这个过程，我们可以生成整个句子。

如果我们要求模型生成一个句子，我们可以得到与训练文本完全相同的东西：

The cat eats the rat. 猫吃了老鼠。

We could also get:我们也可以得到：

The rat.

The cat eats the cat eats the cat eats the rat.

猫吃猫，猫吃猫，猫吃老鼠。

每当我们到达“the”这个词时，模型可以在 “老鼠”或 “猫 ”之间进行选择。

当然，我们用来训练模型的文本会更长，但你已经可以看到一些问题。如果我们在整个维基百科网站上进行训练，我们可以得到这样的结果：

解释他的行为，并因戴维斯的强烈语言和文化而被送入精神病院。

这个句子更复杂，词汇更丰富，但它没有任何意义，因为这个模型缺乏上下文：它只使用最新的词来生成下一个词。

我们可以扩展这个模型，以考虑到2、3或4个语境词（“吃了”后面是“老鼠”），但那样我们可能只是在重复输入文本的整个部分：维基百科上有多少次完全相同的4个词的序列？

从文字到意义

到目前为止，问题之一是，我们把单词当作一堆没有意义的字母。这个模型不理解 “the ”和 “a”之间的关系，“king”和“queen”之间的关系，等等。

我们怎样才能从单词中提取意义呢？试图向计算机解释意义和定义这些词是一个死胡同，这个任务太复杂了（人们已经尝试了几十年）。

你甚至怎么能代表一个词的含义呢？好吧，有一样东西计算机可以完全理解：数字。如果我们将单词的含义表示为沿着几个轴的数字，会怎么样呢？

For instance: on a scale of -1 (masculine) to 1 (feminine), how do you evaluate this word?

例如：在-1（男性化）到1（女性化）的范围内，你如何评价这个词？

king: -1

queen: 1

table: 0

mustache: -0.9

或者：在-1（卑鄙）到1（美好）的范围内，你如何评价这个词？

wolf: -0.8

princess: 0.9

table: 0.1

gift: 1

或者甚至：在-1（名词）到1（动词）的范围内，你如何评价这个词？

king: -1

speak: 1

pretty: 0

以此类推。有了足够的轴来评估单词，我们应该能够得到一个单词的近似含义。问题就在于：你如何选择轴，以及你如何评估所有的词？

再一次，这项任务是如此复杂，以至于我们将让计算机做艰苦的工作：我们只是告诉它，一起出现的词有一个相关的含义。

有了足够的文本，计算机就可以确定轴线和它们的评价。在我们的猫的例子中，猫和老鼠都是动物（近义词），知道 “吃 ”是动物做的事情是很有用的。但是在数学教科书中，不会有猫或老鼠，因为它们的含义与教科书中的用词相去甚远。

我们得到的轴线往往难以解释：我们可能会发现一些预期的轴，如男性/女性，但大多数会更复杂，要么只有在与其他轴结合时才有意义，要么同时代表几个概念。

这种方法被称为 “单词嵌入”，将单词表示为一个数字矢量。

从意义到关系

现在我们有了作为数字的意义，我们可以使用有趣的属性：比如说我们可以把它们加起来。这意味着什么呢？好吧，比如把 “美国 ”和 “货币”相加（或者说把它们的数字表示相加）就会得到 "美元"（或者说与 "美元 "的数字表示接近的数字）。“美国 ”+“首都”=“华盛顿”，“吃”+“名词”=“餐”，等等。

我们也可以做减法：例如，“国王”--“男人”+“女人”=“女王”，或者 “华盛顿”--“美国 ”+“英格兰”=“伦敦”。

我们还可以用它来寻找密切相关的词，同义词。

我们可以学习这些关系吗？

通过使用这种数字单词表示法，我们可以回到我们的初始模型，但这次是学习关系而不是单词。

然而，由于关系更加复杂，我们需要更多的背景。值得庆幸的是，现在我们有了数字，我们可以使用近似值。

与其学习 “在'猫'后面有'吃'”，我们可以学习这样的关系：“在一个冠词和一个名词之后，往往有一个动词”，“动物经常吃、喝和跑”，“老鼠比猫小”，以及 "你只能吃比你小的东西"。当然，一切都用数字表示。

这些关系很复杂，所以我们需要大量的文本来训练模型。它们被表示为一个方程式：设想 y=a⋅x1+b⋅x2+c，但有更多的输入 (不同的x1) 和参数(a、b和c)。

现在，不是按照概率从一个词到另一个词，而是每个轴（如男性/女性）都有一个方程式。这个模型总共有几千亿，甚至几万亿的参数。这使得它能够考虑到一个非常复杂的问题。这使它能够考虑到更大的背景：

20个字可以让它建立具有正确结构的简单句子。

100个字可以让它在一个小段落中发展一个简单的想法。

有了千言万语，它可以进行对话而不至于失去方向。

最大的模型有20000字左右，这使它们能够阅读整篇文章、一个短篇故事或进行长时间的对话，同时在生成下一个字之前仍然考虑整个背景。

归根结底，一切都是一个规模问题：一个更大的模型可以学习更多的关系，并考虑到更多的背景。

GPT的优势和劣势是什么？

GPT能够熟练地生成看起来像人类所写的文本。它能够有逻辑地连接各种想法，为它们辩护，适应环境，进行角色扮演，并且（尤其是最新的GPT-4）避免自相矛盾。

不幸的是，它很可能会撒谎，或者说在没有数据的情况下，让它的想象力肆意发挥。询问一个数学问题的结果，有可能得到一个近似的甚至是完全错误的答案。

鉴于训练数据在2021年9月停止，当被问及当前事务时，它将编造一些东西。为了避免这种情况，Bing Chat和Google Bard将模型连接到搜索引擎（Bing或Google），让它请求最新的信息。

为了有效地使用GPT，必须将其应用于模糊和容错的任务（生成营销电子邮件），或容易验证的任务，无论是由（非AI）程序还是由循环中的人类。

这个模型能思考吗？

现在我们知道了它的工作原理，第一个答案是否定的：该模型是一个美化的数学方程，可以生成下一个单词的概率。

然而，这值得考虑我们自己的大脑：我们有一个相互连接的神经元网络（1000亿）（每个神经元有10 000个连接），对环境作出反应，从经验中学习，并产生一个适当的（但往往很难准确预测）答案。

换句话说，除了我们的算法是化学的而不是数字的之外，结构是相似的。

What are the differences then? 那么有什么不同呢？

3个数量级的复杂性：人类大脑的连接比GPT-4的参数多1000倍。因此，它可以处理更复杂的情况。

持续的学习：大脑一直在学习，包括在对话期间，而GPT在对话开始之前就已经完成了训练。

限于字数：GPT接口仅限于单词。然而，正如我们所看到的，里面有一个语义系统，只是在最后一步才被转化为单词。可以想象，训练这样一个模型来控制机器人（给定足够的训练数据）是可行的。

有限的输入：GPT知道的关于对话的唯一事情是文本。高达60%的人类交流是非语言的：语气、声音的节奏、面部表情，甚至一些潜意识的因素，如气味，都起着一定的作用。GPT错过了所有这些。

我们可以提到的其他差异是在行为层面：

GPT很难一致地应用逻辑规则，它更像是一种尽力而为的情况。具有讽刺意味的是，它不知道如何进行数学运算。但这与一个小孩子相当。

GPT没有情绪：人类的情绪涉及大量的腺体和荷尔蒙，与大脑有复杂的相互作用。然而，GPT从人类之间的对话中学到了与情感状态相关的行为。

它能够表现得像有情绪一样，这算不算是什么？一些对话记录显示，GPT的行为就像它意识到自己是一个程序一样，有时会问一些存在性问题。

你可以说GPT不是有意识的。意识的定义经常发生变化，取决于人，但它经常被定义为只有人类才有资格获得意识。如果一个程序的行为方式与人类无异，我们会同意它是有意识的吗？

中国房间论证 3 持相反意见：如果有可能在自己不懂中文的情况下，通过遵循指令来冒充讲中文的人，那就意味着只是 "遵循程序 "的计算机并不懂中文，因此也就没有意识。

对社会有什么影响？

我无法预测未来，尤其是在一个革命性技术的黎明，但要知道：这是一个革命性的技术。对于许多知识工作者来说，从市场营销到工程师，从招聘人员到社会工作者，GPT将改变一切。

就像装配线改变了手工业者的工作，计算器和计算机改变了会计，大众传媒改变了政治一样，GPT将改变知识工作者的世界。

诚然，所有这些工作不会在一夜之间消失：我们仍然有工匠和会计师，但在你的营销部门曾经需要一个由10个人组成的团队，也许一两个配备GPT的员工就可以填补这个角色。

就像很多科学或工业进步一样，这种变化会影响到很多人：有些人将不得不改变职业或学习将GPT融入他们的职业；有些人将失去他们的工作。

新的职位将由GPT直接创造（如Prompt工程师，可以 “与机器对话 ”的人）或间接地使产品和公司更容易创建。

很难知道确切的后果，但我们正处于一个新阶段的开始，许多事情将发生变化，拥有技术技能的人处于优势地位，企业家有一个全新的机会领域。

另一方面，许多没有准备好改变的人、没有技能的人或没有能力再教育的人受到了威胁。

GPT会破坏社会吗？

有些人因为人工智能而担心世界末日：从《黑客帝国》到《终结者》，这是在反乌托邦科幻小说中常见的特例。一般来说，这两种情况是：

终结者的情景：人工智能是为了赢得一场战争而制造的，并获得了军事资源，也许是由一个独裁者制造的，并被赋予了生存本能。人类试图阻止它，并将其视为一种威胁，人工智能做出了激烈的反应。

回形针优化器：在这个寓言中，人工智能的任务是创造尽可能多的回形针。在耗尽了地球上的可用资源后，它转向了下一个最可用的碳源：人类。

另一个版本是人类试图阻止机器；人工智能意识到，要想和平地制造回形针，它必须摆脱人类。它就像邪恶的精灵，扭曲了你的愿望，给了你所要求的东西，而不是你真正想要的东西。

需要认识到的一点是，（目前）GPT只能产生文本。当然，单纯的文本在错误的手中可能是危险的（毕竟，一个独裁者 “只是说话”），但就其本身而言，GPT不能做任何事情。

然而，它可以成为迈向更有能力的系统的第一步：将GPT的衍生物用于控制机器人、军事决策助手等。

我们将需要谨慎行事，如果进展证明是不可控制的，或者至少是无法控制的，我们就会介入。

从积极的方面看，一些人工智能专家积极研究防范这些情况的方法，因此可能有一些安全的前进方式。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人工智能

人工智能

+关注

关注
1791

文章
47137

浏览量
238116
模型

模型

+关注

关注
1

文章
3217

浏览量
48801
ChatGPT

ChatGPT

+关注

关注
29

文章
1558

浏览量
7585

原文标题：从词语意义到关系推断，ChatGPT是如何理解人类语言的？

文章出处：【微信号：alpworks，微信公众号：阿尔法工场研究院】欢迎添加关注！文章转载请注明出处。

大语言模型：原理与工程实践+初识2

的一系列变革。大语言模型是深度学习的应用之一，可以认为，这些模型的目标是模拟人类交流，为了理解和生成人类语言。为此，模型需要在大量文本数据

发表于 05-13 00:09

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

ChatGPT为起点，从入门到精通的AI实践教程（全彩）》一书将帮助大家更好地理解和使用大语言模型，即使你对人工智能技术或编程技术一窍不通

发表于 06-03 11:39

NLPIR语义分析是对自然语言处理的完美理解

帮助理解句子的意思，通过分析找出词义、结构意义及其结合意义，从而确定句子所表达的真正含义，而语义信息的标记需要包含概念完全集与关系图的支持，需要对句法成分做出细致的语义分类，它一般应包

发表于 10-19 11:34

不到1分钟开发一个GPT应用！各路大神疯狂整活，网友：ChatGPT就是新iPhone

这个说法并不准确。尽管ChatGPT等语言模型已经在一定程度上改变了我们获取信息、学习知识的方式，但它们并不能替代人类进行创造性思考和创造性活动。虽然一些人可能会利用ChatGPT等

发表于 11-19 12:06

利用机器视觉技术处理语意理解将会有效提高指令周期

机器存在的目的无非是协助人类进行各式工作，将人类从无聊繁琐的事物中解放。由于没有一个行业不需要语言，每一个行业也都有特殊的文字与行话，因此，语意理

发表于 01-29 12:58 •563次阅读

Google推出新的搜索算法，可以更好地理解人类语言

谷歌将该技术称为BERT（双向神经网络编码器）。之前，搜索引擎将每次搜索理解为一组词语，得出相关的词语结果。那么利用新技术，它不仅可以分析搜索中的主要词语，还可以分析辅助

发表于 10-31 17:21 •2230次阅读

如何使用计算机让机器人理解人类语言以及含义

和文化背景的复杂性，让机器很难理解和解释客户提供的观点性数据，因此提取见解极具挑战性。自然语言处理（NLP）和机器学习（ML）等工具使计算机能够理解人类语言以及含义。此外，情感分析是

发表于 05-17 16:19 •3239次阅读

手势识别帮助计算机理解人体语言

电子发烧友网站提供《手势识别帮助计算机理解人体语言.zip》资料免费下载

发表于 10-28 10:16 •0次下载

chatgpt是什么

chatgpt是什么 ChatGPT，美国OpenAI 。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类的

发表于 02-10 14:05 •4w次阅读

chatgpt怎么用

chatgpt怎么用 chatgpt怎么用？chatgpt 简介 ChatGPT是一种语言模型，它被训练来对对话进行建模。它能够通过学习和

发表于 02-10 14:22 •5.8w次阅读

三张图告诉你的ChatGPT是什么

最近火热的ChatGPT，是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列

发表于 02-13 16:15 •8.2w次阅读

ChatGPT研究框架：生成式AI拐点来临，商用落地前景分析

从市场概况看，ChatGPT已能覆盖较多能力域，被视为AI平民化的里程碑，将带动新一轮AI发展浪潮；从技术路径层面看，ChatGPT核心技术优势在于，其提升了

发表于 02-15 13:49 •4230次阅读

和ChatGPT聊聊SiC

ChatGPT是由OpenAI开发的一种全新聊天机器人，它能够通过学习和理解人类的语言跟人对话，还能根据聊天的上下文跟人互动，并协助人类完成一系列任务。

发表于 02-26 09:26 •1404次阅读

ChatGPT 是什么

应用。 ChatGPT基于自然语言处理技术和神经网络模型，可以学习和理解人类语言的语法和语义，并能够生成具有连贯性和逻辑性的自然语言文本，从

发表于 06-27 13:55 •2471次阅读

chatgpt是什么意思 ChatGPT背后的技术原理

　　今天我们为大家带来的文章，深入浅出地阐释了ChatGPT背后的技术原理，没有NLP或算法经验的小伙伴，也可以轻松理解ChatGPT是如何工作的。　　ChatGPT是一种机器学习自然

发表于 07-18 17:12 •0次下载

搜索历史

从词语意义到关系推断，ChatGPT是如何理解人类语言的？

评论

大语言模型：原理与工程实践+初识2

名单公布！【书籍评测活动NO.34】大语言模型应用指南：以ChatGPT为起点，从入门到精通的AI实践教程

NLPIR语义分析是对自然语言处理的完美理解

不到1分钟开发一个GPT应用！各路大神疯狂整活，网友：ChatGPT就是新iPhone

利用机器视觉技术处理语意理解将会有效提高指令周期

Google推出新的搜索算法，可以更好地理解人类语言

如何使用计算机让机器人理解人类语言以及含义

手势识别帮助计算机理解人体语言

chatgpt是什么

chatgpt怎么用

三张图告诉你的ChatGPT是什么

ChatGPT研究框架：生成式AI拐点来临，商用落地前景分析

和ChatGPT聊聊SiC

ChatGPT 是什么

chatgpt是什么意思 ChatGPT背后的技术原理