ChatGPT的潜力和局限-电子发烧友网

今天为大家分享一篇研究，当ChatGPT穿越到口袋妖怪世界，是否会理解并应用这个虚构世界的知识呢？

熟悉口袋妖怪的朋友们一定知道，这些可爱的生物们有着各种不同的属性、类别和技能。它们生活的世界也是一个完整的环境：你可以收集口袋妖怪、培养它们的实力，然后让它们在战斗中一展身手。每一个系统都有详细的、明确的规定。

而现在，我们把这个酷炫的口袋妖怪世界作为评估ChatGPT知识和推理能力的环境！我们可以检查ChatGPT对口袋妖怪世界的了解程度，并向它输入新的知识，让它在妖怪们的战斗中进行推理，预测战斗结果。

通过在口袋妖怪世界的实验，我们能更好地评估ChatGPT的潜力和局限，看看它是否能够学习新知识，基于特定情境的特征组合进行推理，从而做出更准确的判断。

为了评估ChatGPT，作者引入了一个分阶段的对话框架（如下图），包括三个明确定义的阶段：

阶段1：Audit knowledge

首先，ChatGPT具有口袋妖怪世界的背景知识吗？

作者通过询问一般性问题，如有关口袋妖怪类型和物种的描述，来审核ChatGPT对口袋妖怪世界的先验知识。这些检索到的知识被存储在local memory中，作为对话的上下文，以便在接下来的步骤中构建合理的场景。同时，这些知识还可以提高后续模型的回应准确性，减少虚构情况的发生。

在阶段一，作者从一些初步的一般性问题开始。这个阶段对于随后创建有效的沟通至关重要。我们区分global memory和local memory。前者是在训练期间获得的，包括ChatGPT的先验知识。local memory仅限于我们之前的相互作用，并作为后验相互作用的参考点。ChatGPT对口袋妖怪类型等问题上有很强的抵抗能力。但在Q1.4中的对抗提问中失败了。

下面是一个例子：注意ChatGPT的答案用颜色标记，如果提供准确的知识，则用绿色，如果提供虚假陈述(幻觉)，则用红色，如果陈述模糊或不相关，则用黄色。

阶段2：Use of knowledge in context

作者呈现了特定的战斗场景，其中口袋妖怪们的类型、等级、招式和状态相互作用并导致特定的结果。ChatGPT将用于预测战斗的结果，并逐步解释其推理过程。这个阶段将评估模型是否能够基于特定情境（上下文）组合特征（组合性），从而确定战斗结果。

在阶段二，作者呈现了口袋妖怪的简单战斗场景，并逐渐增加复杂性(不同级别、天气和状态条件)，并要求ChatGPT预测战斗的结果并解释其推理。这一阶段将帮助我们理解模型是否可以基于决定其结果的特定场景(上下文)组合特征(组合性)。

结果发现，大多数回答都是准确的。ChatGPT了解口袋妖怪的类型、移动(攻击)和等级如何影响战斗匹配。ChatGPT能够预测，也可以全面地解释其推理。但是，不同类型的问题上，ChatGPT的准确性差异较大。

作者总共测试了24场战斗：6场涉及不同类型(准确率为83.3%)，6场涉及不同级别(100%)，7场涉及4种天气条件(85.7%)，6场涉及4种状态效果(100%)。

作者介绍了具有正式规格（名称、外观、类型、招式）的新妖怪。然后，要求ChatGPT验证对这些新概念的掌握，并将其与其先前知识进行比较。注意，ChatGPT将新引入的知识存储在local memory中，但它将无法长时间引用它。

下面是一个测试例子：注意ChatGPT的答案用颜色标记，如果提供准确的知识，则用绿色，如果提供虚假陈述(幻觉)，则用红色，如果陈述模糊或不相关，则用黄色。

尽管在问题4.1中出现了部分幻觉，ChatGPT给出了相当好的类比。作者进一步评估新知识在语境中的整合，测试了新的与已知的口袋妖怪的战斗。结果表明，ChatGPT能够重用先验和新引入的知识来预测结果，即使涉及的两个口袋妖怪都是新引入的。在这种情况下，模型给出了可靠的预测。

通过与ChatGPT在对话框架下的互动，可以得出以下结论：首先，模型所呈现的事实的准确性取决于之前讨论的内容；其次，对抗性攻击可能是成功的，但并不总是成功的，但一般来说，对话预处理(知识检索)和协作反馈可以纠正先前模型的错误。
责任编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

存储

存储

+关注

关注
13

文章
4342

浏览量
86034
模型

模型

+关注

关注
1

文章
3286

浏览量
49008
ChatGPT

ChatGPT

+关注

关注
29

文章
1566

浏览量
7886

原文标题：在口袋妖怪世界中理解ChatGPT的思维

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

【国产FPGA+OMAPL138开发板体验】（原创）6.FPGA连接ChatGPT 4

OMAP-L138（定点/浮点DSP C674x+ARM9）+ FPGA处理器的开发板。编写一个用于FPGA访问ChatGPT 4的程序代码是一个相当复杂的任务，涉及到硬件设计、网络通信、数据处理等多个

发表于 02-14 21:58

在FPGA设计中是否可以应用ChatGPT生成想要的程序呢

当下AI人工智能崛起，很多开发领域都可看到ChatGPT的身影，FPGA设计中，是否也可以用ChatGPT辅助设计呢？

发表于 03-28 23:41

OpenAI 深夜抛出王炸 “ChatGPT- 4o”， “她” 来了

无缝切换的场景为特色，高精度处理细微的查询。 · 实时数据分析和报告：在特别引起业务分析师共鸣的演示中，ChatGPT-4o处理了大型数据集，以提取可操作的见解，具备显著加快决策的潜力。新功能摘要

发表于 05-27 15:43

让chatGPT帮我写硬件代码，是懂行的，好助手！#chatgpt #物联网开发 #python开发板

ChatGPT

苏州煜瑛微电子科技有限公司

发布于 :2023年02月17日 15:27:42

ChatGPT对话语音识别

ChatGPT

YS YYDS

发布于 :2023年05月30日 22:13:10

栅漏电流噪声有哪几种模型？这几种模型具有什么特性和局限性？

栅漏电流噪声特性是什么？栅漏电流噪声有哪几种模型？这几种模型具有什么特性和局限性？

发表于 04-14 06:53

科技大厂竞逐AIGC，中国的ChatGPT在哪？

最近，AI（人工智能）圈一股以“ChatGPT”为核心的热潮从美国“硅谷”涌入中国。 2022年11月底，初创公司OpenAI发布了名为ChatGPT的对话式聊天机器人模型，一经推出，便在网络上

发表于 03-03 14:28

不到1分钟开发一个GPT应用！各路大神疯狂整活，网友：ChatGPT就是新iPhone

人类。总之，虽然ChatGPT等语言模型的应用在一定程度上改变了我们的生活和学习方式，但它们并不能完全替代人类进行创造性思考和创造性活动。我们不能将它们简单地视为新iPhone之类的产品，而是应该理性看待它们的应用价值和技术局限性。

发表于 11-19 12:06

基于微控制器的LED驱动器拓扑、权衡和局限

本文主要探讨基于微控制器的LED驱动器。它考察了以微控制器作为系统核心所能采用的各种不同拓扑结构。它还详细讨论了各种拓扑的权衡，着重于它们的主要特性和局限：通讯、电压

发表于 10-26 14:17 •925次阅读

基于微控制器的LED驱动器拓扑、权衡<b class='flag-5'>和局限</b>

法国研究超薄太阳能电池的潜力和局限性，未来应用将不受限制

法国的一项新研究强调了超薄光伏电池的潜力，但商业化生产的道路将充满挑战。研究人员提出了一系列整合光子和电子元素的新型细胞结构。

发表于 11-16 17:02 •1768次阅读

ChatGPT在自然语言处理中的局限性和挑战

，ChatGPT在自然语言处理中仍然存在着一些局限性和挑战。本文将探讨ChatGPT在自然语言处理中的局限性和挑战，并分析其背后的原因。

发表于 04-18 16:25 •1525次阅读

碳化硅二极管的优点和局限性分析

碳化硅二极管的优点和局限性分析碳化硅（SiC）二极管是一种新型半导体材料，在高频电源电子装置中得到了广泛应用。与传统的硅（Si）材料相比，碳化硅二极管具有许多优点和局限性。下面是对碳化硅二极管

发表于 12-21 11:31 •2840次阅读

超导材料在输电领域的应用前景、优势和局限性

超导材料适合作为输电导线的潜力一直备受瞩目。与传统的金属材料相比，超导材料具有低电阻和高电流载流能力的独特优势。本文将深入探讨超导材料在输电领域的应用前景、优势和局限性。在高科技时代，全球对电能

发表于 01-17 11:29 •1784次阅读

WDM技术的缺点和局限性

和效率。然而，尽管WDM技术具有诸多优势，但它也存在一些缺点和局限性。以下是对WDM技术缺点和局限性的详细分析：

发表于 08-09 11:42 •943次阅读

ChatGPT 适合哪些行业

ChatGPT 是一种基于人工智能的自然语言处理技术，它能够理解和生成人类语言。这种技术在多个行业中都有广泛的应用潜力。以下是一些ChatGPT特别适合的行业，以及它在这些行业中可能的应用方式

发表于 10-25 16:11 •487次阅读

搜索历史

ChatGPT的潜力和局限

评论