Richard Socher：NLP领域的发展要过三座大山-电子发烧友网

“我的飞机什么时候到？”把这个问题抛给智能机器人助手。几乎可以肯定，机器立马就懵逼了。“我”是谁？“飞机”是航班还是淘宝上订的模型玩具呢？“到”又是到哪呢？如果是人类来回答这个问题，即使在情景不明确的情况下也能在快速澄清后给出回答，但对机器来说，除非依赖大量人为制定的规则，回答这样的问题难度堪比“哥德巴赫猜想”。

面对自然语言处理发展（NLP）存在的诸多难题，该领域的大牛、Salesforce的首席科学家Richard Socher在近日指出：NLP领域的发展要过三座大山。

困扰NLP领域的这三座大山究竟是什么？一起来听大佬说。

一直以来，语言都被认为是人类的独特能力，是智慧的表现。但最近，自然语言处理技术的发展似乎也将语言能力赋予给了机器。

帮你打电话订餐，给你讲故事，解决各种刁钻的冷知识问答…机器的语言能力已经无限接近人类水平。

现在你可以走进昏暗的客厅，让Alexa把智能灯的亮度提高到75%。你也可以询问他世界另一边的天气情况。在Google最近的Duplexde，AI助理已经能够给理发店打电话，为你预约剪发。

曾经被视为科幻的场景现在变为了现实，但为了维持真正的人机关系，机器必须能够与人进行更直观、理解上下文和自然的对话--这仍然是一个挑战。我致力于研究NLP，但是就像AI一样，我们还在这个旅程的开始阶段。

语言是分享信息和与周围连接的一种机制，但是机器需要理解语言的复杂性以及作为人类是如何使用语言进行交流的。情感分析、问题回答和联合多任务学习方面的进步使AI能够真正理解人类以及我们的交流方式。

情感分析

语言本身就是复杂的。它不断发展，而且细致入微，一般人需要数年才能掌握。通过情绪分析，我们可以使用AI来理解特定内容，比如品牌或电影评价是正面的、负面的还是中性的。

我们也能弄清楚演讲者的态度和意图(她是生气，高兴，惊讶还是准备好要买东西了？)。从客户服务到在线社区调节再到算法交易，能够即时分析数千条推特和数百条产品评论来理解公众对一个品牌的看法，这对于企业来说是非常有价值的。

情感分析技术已经存在了一段时间，但并不总是非常精准。随着NLP的进展，这种情况正在发生变化。在我担任首席科学家的Salesforce，我们的AI（叫做Einstein）允许品牌能够通过电子邮件，社交媒体，和聊天短信得到实时的情感分析，为客户提供更好的体验。

准确的情感分析，例如，服务代理可帮助了解应优先服务哪些不满意的客户，或者应向谁提供优惠。也可识别产品缺陷，衡量产品满意度，通过社交平台改变人们对品牌的认知。其他科技公司也提供类似服务。

对于情感分析来说，理解上下文也是很重要的。假设你有一家肥皂公司，有人在推特上说：“这种肥皂对婴儿来说真的很棒。”这可以是对儿童肥皂的积极支持，也可能是暗讽这对孩子来说很可怕。

这句陈述可能包含很多上下文，但又很简单！使用AI分析某一句子结构的所有可能性，并理解一个人在特定语境下的用意，是NLP研究的重大挑战。它既需要标记数据来改进模型培训，也需要新的模型在学习上下文的同时在许多不同类型的任务之间共享知识。

问答

随着NLP更好地解析文本的含义，帮助管理我们生活的数字助理智能将会提高。Siri和Google Assistant等应用程序可为常见问题提供优质答案，并执行简单的命令。理想情况下，我们应该能够问电脑任意问题，并且得到好的答案。

提供更好答案的一种方式是确保计算机理解问题。如果你问“我的飞机什么时候到达？”计算机怎么知道是在谈论你的航班还是从亚马逊订购的木工工具呢？

通过对语义的更深入理解，再加上对上下文数据的更好使用，计算机在判断语义这方面正变得越来越好。我们正在研究如何使用NLP学习每一层上下文，这样AI就可以同时处理所有内容，而不会错过重要的信息。

例如，动态共聚焦网络（dynamic coattentionnetworks可以根据不同的问题对单个文档进行不同的解释，比如，面对一篇体育报道，在回答“哪位运动员获得了冠军？”和“最年轻的参赛者是几岁？”这两个问题是，机器就能对这篇报道作出不同的理解，从而反复假设多个答案，最终得到最好、最准确的结果。

联合多任务学习

科学界善于构建能很好地执行单个任务的人工智能模型。但是，更直观、会话式的并联系上下文的界面则需要一个不断学习的AI模型，它能够将新任务与旧任务集成起来，并在这个过程中学习执行更加复杂的任务。总体上来说，这对所有AI都是适用的，但在语言方面尤其如此，因为语言需要灵活性。

“谁是我的客户？”这是一个十分简单的任务：创建客户列表。但是，“谁是太平洋西北地区对某一特定产品的最佳潜在客户呢”？这样的问题增加了一层复杂性，需要大量的集成任务来提供答案，例如：如何定义“最佳”？客户定位在哪里？是什么因素导致客户对产品感兴趣的？每增加一个因素，问题的复杂性都会急剧增加。

Salesforce研究公司最近进行了一项名为“自然语言十项全能”的研究，该研究将多个任务转化为问答的形式，从而在一个单模型中解决了NLP最困[1]难的10项任务：问题回答，机器翻译，摘要，自然语言推理，情感分析，语义角色标注，关系提取，目标导向对话，数据库查询生成，代词消解。

使用多任务问答模型，将每个任务作为一种问答形式，单个模型在没有任何特定参数或模块的情况下共同学习和处理不同的任务。这不仅意味着数据科学家不再需要为每项任务建立、训练和优化单个模型，而且还意味着该模型具有零射击（zero-shot）学习能力---换句话说就是该模型可以处理以前从未见过或专门训练过的任务。

随着研究人员继续改进这样的模型，我们会看到AI界面在承担更复杂任务时变得更聪明。

虽然我们已经研究NLP很长时间了，但我们要走的路还长着呢。希望随着NLP技术的提升，人类与机器的交互形式最终能够迎来质的飞跃。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

自然语言

自然语言

+关注

关注
1

文章
288

浏览量
13365
nlp

nlp

+关注

关注
1

文章
489

浏览量
22059

原文标题：语言处理想突破，三座大山必须过

文章出处：【微信号：AItists，微信公众号：人工智能学家】欢迎添加关注！文章转载请注明出处。

甲骨文规划三座小型核电站赋能AI数据中心

甲骨文公司近日宣布了一项重大能源战略，已获得授权建设三座小型模块化核反应堆，旨在为旗下庞大的AI数据中心提供清洁、稳定的电力支持。这一创新举措由公司董事长拉里·埃里森亲自披露，彰显了甲骨文在可持续发展与AI技术融合方面的前瞻视野。

发表于 09-19 18:18 •651次阅读

基于望获实时Linux和飞腾E2000Q CPU的全国产工控解决方案

随着智能制造和工业4.0浪潮的席卷，工业生产对控制系统提出了前所未有的挑战——高精度、高实时性和高可靠性的需求如同三座大山，横亘在行业发展之路上。然而，环顾当前市场，高性能的国产化工业控制解决方案仍

发表于 08-08 13:48 •661次阅读

nlp自然语言处理框架有哪些

自然语言处理（Natural Language Processing，简称NLP）是计算机科学和人工智能领域的一个重要分支，它致力于使计算机能够理解和处理人类语言。随着技术的发展，NLP

发表于 07-09 10:28 •585次阅读

nlp自然语言处理的主要任务及技术方法

自然语言处理（Natural Language Processing，简称NLP）是人工智能和语言学领域的一个分支，它研究如何让计算机能够理解、生成和处理人类语言。NLP技术在许多领域

发表于 07-09 10:26 •1210次阅读

nlp自然语言处理模型怎么做

自然语言处理（Natural Language Processing，简称NLP）是人工智能领域的一个重要分支，它涉及到计算机对人类语言的理解和生成。随着深度学习技术的发展，NLP

发表于 07-05 09:59 •668次阅读

nlp自然语言处理的应用有哪些

自然语言处理（Natural Language Processing，简称NLP）是人工智能领域的一个分支，它致力于使计算机能够理解和生成自然语言。随着技术的发展，NLP已经在许多

发表于 07-05 09:55 •2689次阅读

NLP技术在机器人中的应用

人类语言的能力，还使得机器人能够以更加自然、流畅的方式与人类进行交互，从而在服务、教育、医疗、娱乐等多个领域展现出巨大的潜力和价值。本文将从NLP技术在机器人中的应用现状、核心技术、应用场景、面临的挑战及未来发展趋势等方面进行深

发表于 07-04 16:04 •526次阅读

NLP技术在人工智能领域的重要性

智能的桥梁，其重要性日益凸显。本文将从NLP的定义、发展历程、核心技术、应用领域以及对人工智能领域的深远影响等多个维度，深入探讨NLP技术在

发表于 07-04 16:03 •590次阅读

什么是自然语言处理 (NLP)

自然语言处理（Natural Language Processing, NLP）是人工智能领域中的一个重要分支，它专注于构建能够理解和生成人类语言的计算机系统。NLP的目标是使计算机能够像人类一样

发表于 07-02 18:16 •1230次阅读

台积电高雄P3厂用地变更获批，迈向第三座2nm厂建设

近日，台积电在高雄市的P3厂项目取得了重要进展。据可靠消息，6月24日，台积电高雄P3厂通过了高雄市都市计划委员会的用地变更申请，该地块将被正式变更为甲种工业区。这一里程碑式的进展意味着，台积电距离其第三座2nm厂的建设动工又近了一步。

发表于 06-26 10:21 •1380次阅读

天合光能供货的巴西三座光伏电站（Solar Park）成功并网运行

近日，由天合光能供货的巴西三座光伏电站（Solar Park）成功并网运行。这三座电站均位于巴西南部的巴拉那州，全部采用天合光能至尊N型720W系列组件和至尊670W组件，总装机量达21MW，为这座热情之都输入更多绿色能量。

发表于 05-14 10:32 •512次阅读

台积电将在美国凤凰城建设第三座芯片工厂

立第三座芯片工厂，将其在亚利桑那州的总投资增加至 650 亿美元。第三座晶圆厂将使用 2nm 或更先进的工艺生产芯片，并于本世纪末开始生产。美国总统拜登表示，这些设施将生产世界上最先进的芯片，促使美国有望在2030 年生产出全球 20% 的尖端半导体。他表示，

发表于 04-10 16:19 •402次阅读

台积电将建第3座晶圆厂台积电5/3nm涨定

近日，全球半导体制造巨头台积电宣布将进一步扩大在美国的投资版图，计划在亚利桑那州增设第三座工厂。

发表于 04-09 15:03 •708次阅读

印度批准三座半导体工厂投资，金额达1.26万亿卢比

达到2700亿卢比，预计日产能力可达4800万颗芯片。　　而第三座封装测试工厂则由CG Power与日本瑞萨电子、泰国Stars Microelectronics合作运营，预计每日封装测试能力

发表于 03-01 09:09 •535次阅读

MLCC龙头村田三座工厂继续停工

据报道，作为MLCC（多层陶瓷电容器）行业的领军企业，村田制作所于17日发布了关于旗下工厂受日本能登半岛地震影响的最新公告。在这次地震中，共有13座工厂受到了不同程度的影响。

发表于 01-19 14:39 •889次阅读

搜索历史

Richard Socher：NLP领域的发展要过三座大山

评论

甲骨文规划三座小型核电站赋能AI数据中心

基于望获实时Linux和飞腾E2000Q CPU的全国产工控解决方案

nlp自然语言处理框架有哪些

nlp自然语言处理的主要任务及技术方法

nlp自然语言处理模型怎么做

nlp自然语言处理的应用有哪些

NLP技术在机器人中的应用

NLP技术在人工智能领域的重要性

什么是自然语言处理 (NLP)

台积电高雄P3厂用地变更获批，迈向第三座2nm厂建设

天合光能供货的巴西三座光伏电站（Solar Park）成功并网运行

台积电将在美国凤凰城建设第三座芯片工厂

台积电将建第3座晶圆厂台积电5/3nm涨定

印度批准三座半导体工厂投资，金额达1.26万亿卢比

MLCC龙头村田三座工厂继续停工