浅析Uber的一键式聊天架构-电子发烧友网

通过机器学习和自然语言理解结束，Uber实现了一套智能的聊天系统，从而有效的提升司机和乘客之间的沟通效率，减少对司机的打扰。

想象一下站在路边等待你的优步车过来接你时，在你的应用程序上，你会看到车子几乎没有移动。于是你向司机发送消息了解发生了什么事。

你不知道的是，你的司机在前往接你的途中遇到了交通堵塞。他们会收到你的消息并希望回复。这种情况是优步的司机伙伴们告诉我们的一个痛点。所以我们开始思考，如果有可能的话，司机可以通过一个简单的点击就可以与乘客进行沟通。

我们提出了一种新的智能回复功能，称为一键式聊天（OCC）。借助OCC，在开始行程前乘客和司机之间的协调更快、更无缝。利用机器学习和自然语言处理（NLP）技术来预测对一般乘客信息的响应，优步开发了OCC让司机更容易回复app内的消息。

OCC 是UberChat最新的关键的增强功能之一，旨在通过提供最相关的回复，为优步的司机伙伴提供一键式聊天体验。

图1：通过一键式聊天，司机可以更轻松地回复乘客的消息。

一键式聊天架构

一键式聊天（OCC）利用Uber的机器学习平台Michelangelo在乘客聊天消息上执行NLP，并生成适当的回复。如下面的图2所示，该体系结构遵循五个步骤：

1.发送方（乘客app）发送消息。

2.一旦我们的后端服务收到消息，后端就会将消息发送给Michelangelo的机器学习服务。

3.机器学习模型对消息进行预处理和编码，为每个可能的意图生成预测分数，并将它们发送回后端服务。

4.一旦后端服务收到预测，它将遵循回复检索策略以找到最佳回复（在这种情况下，生成前四个最佳回复）。

5.接收方（司机应用程序）接收建议并将其呈现在应用程序上供司机点击。

图2：优步智能回复系统OCC的架构由五步工作流程组成。

为了找到对每个接收消息的最佳回复，我们将任务制定为具有两个主要组件的机器学习解决方案：1）意图检测和2）回复检索。

如下面的图3所示，思考这个例子，以更好地理解机器学习如何实现OCC体验：

图3：机器学习算法赋予OCC体验流程。涉及两个关键步骤：1）意图检测和2）回复检索。

司机收到一条乘客的信息：“你现在在哪里？”，这在司机前往接乘客的途中非常常见的。OCC系统首先将消息的意图检测为“你在哪里？”这一步称为意图检测。然后，系统会向司机发出前四个最相关的回复，分别是“ 是的，我在路上 ”，“ 抱歉，堵车了 ”，“ 我在您的上车地点 ”，以及“ 请给我打电话“。这是回复检索步骤。现在，司机可以选择这四个回复中的一个，并通过一次点击将其发送给乘客。

在UberChat中实现OCC

我们的UberChat系统允许Uber平台上的司机，乘客，消费者和派送员在app内进行通信。当前流程遵循标准消息传递系统：我们希望发送者输入他们的消息，然后将消息发送给接收者。下面的图4显示了具有典型消息流的UberChat系统的概述：

图4：UberChat后端服务管理发送者和接收者之间的消息流。

对于用户发送的每条消息，Uber的消息传递平台（UMP）执行以下操作（如上图4所示）：

1.将Sender的消息发送到Uber的Edge Gateway

2.将消息路由到Uber的Messaging Platform

3.将消息添加到推送通知服务

4.向Uber的Cassandra数据库存放持久化消息

5.推送远程和本地的表层消息给Receiver

6.收到消息后，从Messaging Platform获取消息正文

为了支持智能回复，我们要能够使用机器学习模型以足够低的延迟实时评估回复。为了满足这一需求，我们利用Uber的内部机器学习平台Michelangelo的机器学习的训练和服务流水线。

在UberChat中通过机器学习提供智能回复

根据设计，OCC旨在为司机伙伴们在前往接乘客期间（即Uber特定的场景和主题领域）提供简单的聊天体验。然而，它与所有其他试图理解普通文本信息的尝试一样都有一个技术挑战：它们不仅简短，而且还包含缩写、拼写错误和口语。我们在设计机器学习系统时考虑到了这一挑战。

从外部看，OCC接收到最新传入的消息并返回可能的回复，但在后台还有更多事情要做。有两个主要的工作流为OCC ML系统、离线训练和在线服务提供服务，如图5所示：

图5：OCC的背后，我们的机器学习系统依赖于两个工作流程，离线训练和在线服务。

离线训练

在离线训练期间，我们使用以下基于嵌入的ML和NLP流水线来处理这些文本消息：

预处理器

为了准备文本嵌入模型的训练数据，我们利用了匿名的UberChat消息。我们首先按语言（语言检测）对聊天消息进行划分，然后进行长度截断（长度<= 2）。最后，我们对每条消息进行标记。

文本和消息的嵌入

在预处理之后，我们使用Doc2vec模型进行消息嵌入，它从可变长度的文本片段（例如句子，段落和文档）中学习固定长度的特征表示。我们在数百万个匿名的、聚集的UberChat消息中训练Doc2vec模型，并使用该训练将每个消息映射到一个密集的向量嵌入空间。满足我们需求的Doc2vec的两个主要优点是它可以捕获单词的顺序和语义。下面的图6使用t-SNE图在二维投影中可视化单词向量。由于它捕获了单词的语义，因此模型可以将相似的单词聚集在一起。例如，“Toyota”接近““Prius”和“Camry”，但与“chihuahua”相距很远。

图6：Doc2vec单词嵌入的这种二维t-SNE投影显示了模型自动组织概念和隐式地学习单词之间的关系的能力，并基于语义对它们进行聚类。

意图检测

为了理解用户的意图，我们在嵌入过程之后训练了我们的意图检测模型。与Gmail的智能回复功能类似，我们将意图检测任务定义为分类问题。

为什么我们需要意图检测？因为人类语言丰富。有很多方式会提出同样的问题，比如“你要去什么地方？”，“你俩要去哪里？”，“你的目的地是什么？”拼写错误和缩写会增加更多排列，所以聊天消息增加了一定程度的复杂性。

创建一个需要对数百万个问题进行回复的系统将无法扩展，因此我们需要一个系统来识别每个问题背后的意图或主题，从而对有限的意图进行回复。下面的图7说明了不同的消息如何根据检测到的意图聚集在一起：

图7：在这种二维t-SNE的句子嵌入的投影中，模型围绕意图聚类消息。

意图-回复映射

我们利用匿名和聚集的历史对话来查找每个意图的最常见的回复。之后，我们的通信内容策划师和法律团队进行一轮又一轮扩充，使回复尽可能的容易理解和准确。然后，我们为回复检索创建意图 - 回复映射。

在线服务

一旦我们完成模型的离线训练，在线服务就相对简单了。我们获取最新的输入消息并通过与离线相同的预处理器发送它们。预处理的消息将通过预先训练的Doc2vec模型编码为固定长度的向量表示，之后我们使用向量和意图检测分类器来预测消息的可能意图。

最后，通过利用我们的意图 - 回复映射，我们根据检测到的意图检索最相关的回复，并将它们显示给接收消息的司机伙伴。此外，一些极端情况将由规则而不是算法所掩盖，包括非常短的消息（预处理阶段中被截断的消息），表情符号和低置信度预测（多意图用例）。

下一步

我们计划继续在全球市场中将一键式聊天功能扩展到其他语言。我们还在研究更多特定于Uber的上下文功能，如地图和交通信息，并计划将它们合并到我们现有的模型中。这些更新将增加我们更准确地识别用户意图和展示定制回复的可能性，从而更好地协助司机伙伴们：简而言之，让优步体验变得更加神奇。

此外，虽然当前系统使用静态意图 – 回复映射来检索回复，但我们计划构建一个回复检索模型以进一步提高OCC系统的精度。

在高层次上，OCC是一个多回合对话系统的自然应用，因为司机伙伴们和乘客们可以在他们找到对方之前进行多次对话。利用OCC和其他功能，构建一个对话系统改善化成功接到乘客和聊天体验的这个长期过程，最终在我们的平台上带来更好的用户体验。

OCC只是Uber中众多不同的NLP / Conversational AI计划中的一个。例如，NL也被用于提高Uber[1，2]的客户服务，同时也处于免提乘车的核心位置，这一块我们将很快开始测试声控命令。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132575
Uber

Uber

+关注

关注
0

文章
411

浏览量
36245
自然语言

自然语言

+关注

关注
1

文章
288

浏览量
13347

原文标题：Uber的一键式聊天智能回复系统

文章出处：【微信号：livevideostack，微信公众号：LiveVideoStack】欢迎添加关注！文章转载请注明出处。

开关柜一键顺控在化工领域的应用

蜀瑞创新为大家分享：在化工生产线中，电气控制系统是保障生产顺利进行的关键。一键顺控技术可以应用于生产线上的电气控制，实现设备的自动启停、顺序控制等功能，提高生产线的自动化水平和生产效率。通过一键顺控操作，可以实现对配电室内多个开关柜的快速、准确控制，提高配电室的运行效率和

发表于 11-29 10:50 •109次阅读

在中压开关柜上使用微机五防锁是否可以实现一键顺控

蜀瑞创新为大家科普：虽然微机五防锁是实现“一键顺控”的重要组成部分之一，但它本身并不能单独完成整个过程。需要结合其他自动化控制技术和设备，以及合适的软件平台来实现真正的“一键顺控”。

发表于 11-06 11:58 •122次阅读

在中压开关柜上使用微机五防锁是否可以实现<b class='flag-5'>一键</b>顺控

人机界面在开关柜一键顺控中起到什么作用？

人机界面在一键顺控系统中发挥着操作指令输入、状态显示与反馈、参数设置与配置以及提升操作便利性和安全性等重要作用。它是实现一键顺控功能不可或缺的关键组成部分。蜀瑞创新专注智能开关柜一键顺控

发表于 11-05 10:02 •140次阅读

人机界面在开关柜<b class='flag-5'>一键</b>顺控中起到什么作用？

10KV开关柜一键顺控和110KV变电站一键顺控哪些地方不同

蜀瑞创新为大家科普：10KV开关柜一键顺控和110KV变电站一键顺控在多个方面存在不同，这些差异主要体现在应用范围、功能侧重、控制对象以及系统复杂性等方面。

发表于 10-16 10:29 •269次阅读

10KV开关柜<b class='flag-5'>一键</b>顺控和110KV变电站<b class='flag-5'>一键</b>顺控哪些地方不同

LoRa无线一键报警安防建设系统

SOS紧急呼叫按钮具有紧急情况下一键报警的功能，可与报警主机配合使用，支持标准LoRaWAN协议。 lora紧急按钮具有紧急情况下一键报警功能，可与报警主机配合使用，支持标准LoRaWAN协议。如遇

发表于 09-25 17:08

一键断电开关的种类有哪些

一键断电开关的种类主要可以从其功能和实现方式上进行分类。以下是一些常见的一键断电开关种类： 1. 继电器式一键断电开关定义：这种开关通过

发表于 09-13 16:45 •974次阅读

一键断电开关的安装方法是什么

一键断电开关，也称为紧急断电开关或紧急停止开关，是一种安全装置，用于在紧急情况下迅速切断电源，以防止事故或进一步的损害。这种开关通常在工业设备、实验室、医疗设备等需要快速断电的场合中使用。安装前

发表于 09-13 16:33 •816次阅读

一键断电开关的控制原理是什么

一键断电开关，也被称为紧急断电开关或紧急停止开关，是一种安全装置，用于在紧急情况下迅速切断电源，以防止事故的发生或扩大。这种开关的设计和应用在工业、实验室、医疗设备以及任何需要快速断电的场合都

发表于 09-13 16:28 •1077次阅读

变电站一键顺控系统和开关柜一键顺控有区别吗？

变电站一键顺控系统和开关柜一键顺控技术虽然都涉及到“一键顺控”的概念，但它们在应用范围和具体实现上有所不同，因此变电站一键顺控系统和开关柜一键

发表于 07-31 13:34 •562次阅读

开关柜一键顺控的技术难点和优势、发展趋势？

开关柜一键顺控技术的核心在于将复杂的人工操作流程转化为自动化、智能化的控制流程，蜀瑞开关柜一键顺控系统多年技术经验

发表于 07-23 11:41 •441次阅读

智能开关柜能如何实现“可视化一键顺控”？

智能开关柜能如何实现“可视化一键顺控”和“开关柜健康状态管理”？蜀瑞创新推出智能开关柜一键顺控测解决方案。建设主要包括柜内无线温度监测、断路器机械特性和电气特性监测、分合闸线圈/储能电机监测、电动机构设备等，并能通过装置实现开关柜基于AI识别的

发表于 07-08 09:45 •485次阅读

宝塔面板一键免费部署LobeChat聊天机器人开发自己私有的ChatGPT

宝塔面板部署一键免费部署LobeChat自己的私有聊天机器人支持市场主流AId api调用；宝塔面板Docker 部署LobeChat步骤首先确保宝塔面板安装了“Docker管理器

发表于 06-26 17:03 •1165次阅读

简析智慧灯杆一键告警功能的实用场景

智慧路灯杆是一种兼具智能化和多功能的新型物联网基础设施，通过搭载一键告警对讲盒，能够大大丰富安防及报警求助资源，对提升城市的安全性和管理效能具有重要的作用。本篇就结合城市中的不同场景，简析智慧灯杆一键告警功能的实用功能。

发表于 04-28 16:42 •368次阅读

智慧杆一键报警连入网关后无法对讲是什么原因？

一键式对讲报警盒是智慧路灯杆上常见的挂载外设之一，能够为公共安全提供即时支持，增强城市管理的智能化和应急反应能力。本篇就为大家简单介绍一下在智慧路灯杆上部署

发表于 03-28 17:25 •394次阅读

一键式影像测量仪1125-C02

优可测一键式影像测量仪FM系列：随意摆放被测对象、一键即可测量300个尺寸，可100个产品同时摆放；超清成像、灯光丰富、分割至0.005亚像素处理、纳米级别测量平台。

发表于 03-05 14:05 •0次下载