近日,最新一期的《自然-人类行为》杂志发表了一项AI研究成果。该研究显示,在一组实验中,两款AI大语言模型在某些情境下展现出与人类相似甚至胜过人类的心理状态感知能力。
心理状态感知能力,又称心智理论,对于人类社交至关重要。来自德国汉堡-埃彭多夫大学医学中心的James W. A. Strachan及其团队设计了一系列测试,以评估AI模型在发现错误观念、理解间接言辞以及辨识不敬等多个维度的表现。
值得注意的是,他们使用了GPT和LLaMA2这两款模型进行实验,并将其与1907名参与者进行比较。
实验结果表明,GPT在识别间接请求、错误观念和误导信息时,有时甚至超过了人类的平均水平;然而,在辨识不敬信息方面,LLaMA2优于人类,而GPT表现欠佳。
对此,Strachan解释说,LLaMA2的成功可能源于其较低的偏见程度,而非真正对不敬信息敏感;至于GPT的表现不佳,他认为主要原因在于它过于保守地坚持自己的结论,而非推理出错。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
AI
+关注
关注
87文章
30106浏览量
268394 -
模型
+关注
关注
1文章
3171浏览量
48711 -
GPT
+关注
关注
0文章
351浏览量
15311
发布评论请先 登录
相关推荐
NVIDIA AI助力初创企业为心理治疗师提供AI工具
NVIDIA AI 助力初创企业为心理治疗师提供 AI 工具,以此来优化和提升心理健康服务水平,为人们的心理健康保驾护航。
心智理论测试:人工智能击败人类
测试结果并不一定意味着人工智能可以“理解”人。 心智理论是指可以理解他人心理状态的能力,正是它驱使着人类社会运转。它帮助你决定在紧张的情况下该说什么、猜测其他车辆的驾驶员将要做什么,以
AI大模型在自然语言处理中的应用
AI大模型在自然语言处理(NLP)中的应用广泛且深入,其强大的语义理解和生成能力为NLP任务带来了显著的性能提升。以下是对AI大模型在NLP
人工智能的定义和发展过程
、识别、生成和交互等类人智能的能力,从而执行各种复杂任务,甚至在某些方面超越人类的智能表现。随着科技的飞速发展,人工智能已经渗透到我们生活的
边缘AI网关,将具备更强大的计算和学习能力
电子发烧友网报道(文/李弯弯)网关又称网间连接器、协议转换器。网关在网络层以上实现网络互连,是复杂的网络互连设备,仅用于两个高层协议不同的网络互连。 边缘AI网关是指在边缘计算环境中,负责处理
Meta AI主管杨立昆:大语言模型尚未到达人类智能水平
他明确提出,虽然此类模型在特定任务中展现出优越性能,但其内在局限性使其难以媲美人类的智慧,如推理与规划能力等方面的不足。
阿里云发布通义千问2.5大模型,多项能力超越GPT-4
阿里云隆重推出了通义千问 2.5 版,宣称其“技术进步,全面超越GPT-4”,尤其是在中文环境中的多种任务(如文本理解、文本生成、知识问答及生活建议、临时聊天及对话以及安全风险评估)方面表现出色,
【大语言模型:原理与工程实践】大语言模型的应用
操作。所谓零样本提示(Zero-Shot Prompt),指的是在提示词中不包含与指令任务相似的任何示例。
当大语言模型训练完成后,它便具备了分析情绪和识别命名实体等常见任务的
发表于 05-07 17:21
谷歌发布Axion新款数据中心AI芯片,性能超越x86及云端
谷歌预计将通过Google Cloud提供Axion AI芯片给客户。谷歌强调这款基于ARM的CPU产品具有优越的性能表现,甚至超越了传统的x86芯片及云端通用ARM芯片。
马斯克预测明年或2026年AI将超越最聪明的人类
马斯克认为,如果将 AGI 界定为超越最聪明的人类智力水平,那么这可能发生在明年或两年内。AGI 研究务求打造出具备类似人类般的智能决策与自学能力
NanoEdge AI的技术原理、应用场景及优势
硬件设计则是为了确保设备在执行这些任务时能够保持低能耗,从而提高其续航能力。
2、应用场景
NanoEdge AI 可以广泛应用于各种物联网设备和传感器,如智能家居、工业自动化、智能交通、医疗健康
发表于 03-12 08:09
谷歌发布ASPIRE训练框架,提升AI选择性预测能力
该框架分为三步骤:“特定任务调整”、“答案采样”以及“自我评估学习”。首先,“特定任务调整”阶段针对基本训练的大型语言模型进一步深化训练,重点提高预测
AI Agent爆发在即!深剖AI Agent技术原理及发展趋势
电子发烧友网报道(文/李弯弯)AI Agent指人工智能代理,是一种能够感知环境、进行决策和执行动作的智能实体。AI Agent通常基于机器学习和人工智能技术,具备自主性和自适应性,在特定
评论