计算语言学的发展趋势、不足与挑战-电子发烧友网

引言

NAACL 会议是 ACL 的北美分会，每年举办一次，也是 NLP 领域备受关注的顶会之一。NAACL 主要涉及对话、信息抽取、信息检索、语言生成、机器翻译、多模态、统计机器学习等多个方面。

本篇文章的作者Antoine SIMOULIN协助了NAACL 2022，他结合今年一些论文的情况，就大规模预训练语言模型的应用、表现、期望等做了概述，总结并思考了当今计算语言学的发展趋势、不足与挑战。

2.1大规模预训练语言模型数量增多

人们越来越乐观地看待大规模预训练语言模型的潜在应用，这使人们的注意力从它们为什么以及如何工作转移到如何确保它们在现实世界中可以更好地工作。

对话是语言模型的直接应用。Amazon Alexa AI高级首席科学家Dilek Hakkani-Tur表示，由于公共数据集、语言模型和产品的蓬勃发展，对话研究正处于激动人心的阶段。她还概述了剩余的挑战：基于知识的回复生成、开放域对话中产生的事实响应、知识摄取以及收集跨长文档或多源信息。

2.2 开放对话

通过给定恰当格式的输入文本并提供相关上下文，模型可以产生符合条件的输出。这种交互对话范式可以应用在很多任务上，如问答（Sanagavarapu et al. 2022 （opens new window）， Qian et al. 2022 （opens new window）， You et al. 2022 （opens new window））或摘要总结（Fang et al. 2022 （opens new window）， Zhao et al. 2022 （opens new window）， Asi et al. 2022 （opens new window））。此外，对话数据可用于学习高效的语言表示（Zhou et al. 2022 （opens new window））。

2.3 结构融合和常识知识

我们期望大规模预训练语言模型能够准确回答事实问题，让模型拥有如“百科全书”一般的知识。知识图谱提供了可以与神经网络一起使用的硬结构信息。可以在命名实体及其关系之间进行显式通信（Ayoola et al. 2022 （opens new window）），或者将符号和显式知识提炼成模型参数的隐式编码知识（Moiseev et al. 2022 （opens new window））。

我们还希望大规模预训练语言模型拥有我们所有人拥有的日常知识。例如，我们希望模型不会生成“狗正在从喷气式飞机上经过”这样的句子（Seo et al. 2022 （opens new window）），或牙刷在空间上应与浴室相关而不是与客厅相关（Henlein and Mehler 2022 （opens new window））。

最后，这些事实取决于时间。如果是在模型训练后发生的事件，例如新冠肺炎大流行，那么模型并不会将其考虑在内，否则会导致时间错位（Luu et al. 2022 （opens new window））。

2.4 推理

我们希望模型可以校对事实并推断它们之间的关系。（Sun et al. 2022 （opens new window））提出了JointLK，这是一个在LM（语言模型）和KG（知识图谱）之间进行多步联合推理的模型，可以解决问答任务。多跳问答任务也涉及推理，因为它需要推断多个间接引用来连接询问（query）中提到的实体。（Kinet al. 2022 （opens new window））提出了一种方法：对这种特定类型的问答使用知识库。

2.5 超越语言本身

模型不仅仅需要精通语言，它们还需要捕捉语言背后的含义和意图，捕捉真实世界的一些直观表述，并对实体和现有的关系进行复杂的推断。要推动大规模预训练的语言模型向前发展，关键是：仅凭文本可以训练高效且有意义的模型吗？

2.6 多模态、多语言、对比学习

我们是否需要在训练过程中引入其他模态，例如音频信息或者图像信息？事实上，婴儿在学习时会受到多种类型信息的刺激。关于多模态学习，（Zhang et al.2022 （opens new window））使用文本和图像混合信息的对比框架来构建句子编码。（Wang et al. 2022 （opens new window））提出将文本和图像结合起来，以更好地确认命名实体识别。

2.7 语言学和符号结构的地位

计算语言学见证了大规模预训练语言模型的广泛使用，但大规模预训练语言模型对语言学和符号的假设很少。在激动人心的小组会议上，Chitta Baral、Dilek Hakkani-Tür、Emily Bender和Chris Manning研究了这一观察可能如何影响未来的研究方向。科研资金通常流向研究神经网络的工作，因此人们对利用语言学进行分析并不感兴趣。但神经网络是我们应该追逐的唯一趋势吗？

Chris Manning根据经验观察到，孩子们可以在没有任何语言学专业知识的情况下学习语言。我们或许可以从语言理论和概念中汲取灵感，如复合性、系统概括、符号的稳定意义和校对相关。但是，我们应该关注意义的直接表征，而不是语言本身，因为语言是一种间接表征。

Emily Bender认为如果没有语言学，包括结构语言学、形态学、语法学、语义学、语言语用学、儿童语言习得、语言类型学和社会语言学，那么NLP就不应该作为一个领域而存在。

2.8 文本内涵的定义

在SemEval研讨会上，Jacob Andreas讨论了语言模型在文本内涵表示方面的潜力，以及是否可以单独从文本中学习到文本的内涵。会议期间多次提到关于文本的内涵。文本内涵是指世界上的外部参考，人们脑海中的内部思想，还是用语言表达的观念？更广泛地说，我们可以期望一个模型在没有任何形式的社交互动或实际经验的情况下，只凭借文本训练就展示人类的行为吗？

2.9 巨大的能力带来巨大的责任

随着大规模预训练语言模型变得越来越可行和广泛采用，工程师们对他们的观念变得更加负责。

2.10 价值敏感设计

Batya Friedman就道德和技术想象力应该如何塑造技术发表了公开演讲。除了安全、可靠性、效率或成本等工程标准外，还应考虑其他标准，包括专注和身体完整性。为了使技术和社会结构和谐发展，我们应该衡量大规模语言模型带来的的影响，例如规模、时间、结构以及应用人类价值观作为评估系统性能的标准。

2.11 拓宽NLP

众所周知，自然语言处理是一个快速发展的领域，但这个领域的演变非常多样化，研究资源也非常集中。科技公司拥有巨大的行动力，使学者难以跟上步伐。此外，研究资源在地理上分布不均，例如Manuel Montes-y-Gómez展示了墨西哥西班牙语NLP社区研究现状，该研究不如美式英语先进。

2.12 NLP未来的一些挑战：组成性、基础或解释

尽管大规模预训练语言模型非常令人兴奋，并且我们对它们的可靠性和效率实现任务自动化的能力越来越乐观，但一些挑战仍然存在。

一个挑战是跟踪模型为什么产生一个给定的输出。（Tan 2022 （opens new window））区分了几种我们能从模型或人类所期望的概念解释和挑战。

根据许多研究，模型在系统推广和显式组成方面是失败的，因为它们依赖于虚假的相关性。在这方面，（Weißenhorn et al. 2022 （opens new window））使用复合语义解析器来解决COGS数据集上的成分概括。（Qui et al. 2022 （opens new window））提出了一种基于上下文无关语法主干的数据增强方法。

审核编辑：彭静

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4767

浏览量
100663
计算

计算

+关注

关注
2

文章
448

浏览量
38770
语言模型

语言模型

+关注

关注
0

文章
517

浏览量
10261

原文标题：结合NAACL2022对计算语言学趋势的思考与分析

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

未来物流发展趋势与TMS的关系

随着全球化的加速和电子商务的蓬勃发展，物流行业正经历着前所未有的变革。未来物流的发展趋势不仅影响着供应链的效率和成本，也对企业的竞争力产生深远影响。运输管理系统（Transportation

发表于 11-26 09:40 •362次阅读

NPU的市场前景与发展趋势

随着人工智能技术的快速发展，神经网络处理器（Neural Processing Unit，简称NPU）作为AI领域的关键硬件，其市场前景和发展趋势备受关注。一、NPU市场前景分析市场需求

发表于 11-15 09:14 •679次阅读

边缘计算的未来发展趋势

边缘计算的未来发展趋势呈现出多元化和高速增长的态势，以下是对其未来发展趋势的分析：一、技术融合与创新与5G、AI技术的深度融合随着5G技术的普及，其大带宽、低延迟的特性为边缘计算

发表于 10-24 14:21 •661次阅读

云计算技术的未来发展趋势

云计算技术的未来发展趋势呈现出多元化和高度集成的特点，以下是对其未来发展趋势的介绍：一、市场规模持续增长全球范围：根据权威机构发布的数据，全球云计算市场规模近年来持续增长，20

发表于 10-24 09:20 •1020次阅读

智能驾驶技术发展趋势

智能驾驶技术是当前汽车行业的重要发展趋势之一，它融合了传感器技术、人工智能、大数据和云计算等多种先进技术，旨在实现车辆的自主驾驶和智能化管理。以下是对智能驾驶技术发展趋势的分析：一、技术突破与进展

发表于 10-23 15:41 •575次阅读

未来AI大模型的发展趋势

未来AI大模型的发展趋势将呈现多元化和深入化的特点，以下是对其发展趋势的分析：一、技术驱动与创新算法与架构优化：随着Transformer架构的广泛应用，AI大模型在特征提取和并行计算效率

发表于 10-23 15:06 •531次阅读

变阻器的未来发展趋势和前景如何？是否有替代品出现？

变阻器是一种用于调节电路中电阻值的电子元件，广泛应用于各种电子设备和系统中。随着科技的不断进步和应用领域的扩展，变阻器的未来发展趋势和前景备受关注。未来变阻器将趋向于智能化和多功能化，随着物联网

发表于 10-10 14:35

智能制造行业现状与发展趋势

智能制造行业作为现代制造业的重要组成部分，正经历着快速的发展与变革。以下是对智能制造行业现状与发展趋势的详细分析：

发表于 09-15 14:26 •1250次阅读

仓颉语言书籍申请

楼主，您好！我是一名接触开发语言不久，对语言学习充满热情的开发者小白，近期对华为推出的仓颉语言产生了浓厚的兴趣。为了更深入地了解和学习这种语言，我希望能申请一本关于仓颉

发表于 08-06 08:37

工业控制计算机的发展趋势有哪些

工业控制计算机是工业自动化系统中的核心设备，其发展趋势对于整个工业自动化领域的发展具有重要意义。本文将从以下几个方面对工业控制计算机的发展趋势

发表于 06-16 11:41 •1012次阅读

智慧灯杆发展趋势

智慧灯杆不仅具备了传统的照明功能，还集成了监控、通信、信息发布等多种功能，通过物联网、大数据、云计算等先进技术的运用，实现了对城市环境的智能感知和管理。本文将从多个方面探讨智慧灯杆的发展趋势。

发表于 04-30 16:30 •466次阅读

DC电源模块的发展趋势和前景展望

BOSHIDA DC电源模块的发展趋势和前景展望随着电子产品的普及和多样化，对电源模块的需求也越来越大。其中，DC电源模块作为一种重要的电源供应方式，在各个领域有着广泛的应用。在过去的几十年

发表于 04-18 13:37 •491次阅读

中国网络交换芯片市场发展趋势

中国网络交换芯片市场的发展趋势受多种因素影响，包括技术进步、政策推动、市场需求以及全球产业链的变化等。以下是对该市场发展趋势的一些分析。

发表于 03-18 14:02 •847次阅读

静压主轴的应用、优势及发展趋势？|深圳恒兴隆机电a

静压主轴是用于机械加工中的一种设备，它通过静压平衡的原理，实现高速旋转并保持较高的精度和稳定性。本文将介绍静压主轴的应用、优势及发展趋势，并整理相关知识。接下来就跟着深圳恒兴隆机电小编一起来看下吧

发表于 01-22 10:32

配网故障定位装置：未来发展趋势与挑战

在电力系统中，恒峰智慧科技设计的配网故障定位装置是一个至关重要的设备，它可以帮助我们快速准确地找到故障发生的位置，从而进行有效的维修。随着科技的发展，这种设备也在不断地进步和改进。本文将探讨配网故障定位装置的未来发展趋势与挑战。

发表于 01-18 10:24 •448次阅读

搜索历史

计算语言学的发展趋势、不足与挑战

评论

未来物流发展趋势与TMS的关系

NPU的市场前景与发展趋势

边缘计算的未来发展趋势

云计算技术的未来发展趋势

智能驾驶技术发展趋势

未来AI大模型的发展趋势

变阻器的未来发展趋势和前景如何？是否有替代品出现？

智能制造行业现状与发展趋势

仓颉语言书籍申请

工业控制计算机的发展趋势有哪些

智慧灯杆发展趋势

DC电源模块的发展趋势和前景展望

中国网络交换芯片市场发展趋势

静压主轴的应用、优势及发展趋势？|深圳恒兴隆机电a

配网故障定位装置：未来发展趋势与挑战