Facebook采用无监督机器学习翻译其平台上内容-电子发烧友网

【概要】脸书公司开始使用无监督机器学习来为其用户提供翻译服务。

由于缺少从一种语言到另一种语言的很多翻译示例——例如从英语到乌尔都语（Urdu），Facebook（脸书）公司已经开始使用无监督的机器学习来翻译其平台上的内容。

Facebook人工智能研究院（FacebookAI Research，FAIR）巴黎实验室的主任Antoine Bordes表示：该方法由FAIR设计，并由FAIR和Facebook的应用机器学习部门合作用于其平台。在实验中，该方法的表现与经过10万次翻译训练的有监督模型相当，并且在翻译示例很少的情况下，其表现优于Facebook的语言匹配系统。Bordes说：“当你处理像英语到乌尔都语这样的案例很少的翻译任务时，我们系统的表现超过了有监督的系统。因此，在没有足够数据的时候，训练无监督系统比有监督系统更好。”

由Facebook人工智能研究人员Guillaume Lample和Marc'Aurelio Ranzato领导的这项工作的成果将于今年秋季在EMNLP 2018上公布。作为FAIR的一名老员工，Bordes表示这项研究是他见过的最好的翻译系统。Bordes说：“我们现在可以去一个使用未知语言的星球—或者说，跟外星人交谈—你可以尝试对他们所说的内容进行合理的翻译。你也可以从一本古老的手稿上找到尚未破译的语言，你可以真正了解它的含义，因此这项工作真的在这些方面取得了突破，而这就是我如此兴奋的原因。”

与FAIR的其他项目一样，该AI系统将是开源的，可以在GitHub上下载。今年早些时候，Facebook将Translate做了开源，这是目前Facebook用来辅助翻译的人工智能系统。Translate等系统需要大量的标记数据。例如，完成从法语到英语的翻译需要数百万个样本句子来创建一个能够理解这两种语言的系统。因此，在缺少翻译示例时，翻译工作是非常困难的。

当前用于处理这种案例的人工智能系统结合了三个要素：逐字翻译、语言模型和反向翻译。逐字翻译的训练原理为：根据一个句子中某个字的前面五个单词和后面五个单词来推测其上下文含义，然后对该单词进行预测。这个嵌入词语的方法是在2017年秋天Lample和Ranzato共同撰写的一篇论文中提出的。然后，使用大量数据（如书籍或其他书面文本）训练的语言模型被用于按照英语或乌尔都语使用者能够理解的结构来安排句子。最后，使用反向翻译来改进通过逐字翻译和语言模型获得的翻译结果。这些方法并不新鲜，但三者的结合的确是有效的。

Bordes称：“使用这两个系统，并在两种语言之间进行双向翻译，我可以将它们进行同时训练以获得相互促进，所以真正核心思想是使用这些词语（翻译模型），利用该语言模型做第一次翻译，然后用反向翻译的方法尝试进行改进。”

Facebook将在未来探索将这种人工智能系统用于其他形式的翻译，但需要更多的数据，并需要与专业翻译人员合作来验证结果。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Facebook

Facebook

+关注

关注
3

文章
1432

浏览量
55068
机器学习

机器学习

+关注

关注
66

文章
8453

浏览量
133166

原文标题：脸书采用无监督机器学习提供翻译服务

文章出处：【微信号：AI_News，微信公众号：人工智能快报】欢迎添加关注！文章转载请注明出处。

如何选择云原生机器学习平台

当今，云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势，逐渐成为企业构建和部署机器学习应用的首选。然而，市场上的云原生

发表于 12-25 11:54 •182次阅读

构建云原生机器学习平台流程

构建云原生机器学习平台是一个复杂而系统的过程，涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。

发表于 12-14 10:34 •192次阅读

HAL库在Arduino平台上的使用

HAL库在Arduino平台上的使用 Arduino平台是一个开源的电子原型平台，它包括硬件（基于微控制器的电路板）和软件（Arduino IDE）。Arduino平台因其简单易用而受

发表于 12-02 14:04 •534次阅读

什么是机器学习？通过机器学习方法能解决哪些问题？

来源：Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛

发表于 11-16 01:07 •544次阅读

什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>？通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题？

深度学习算法在嵌入式平台上的部署

随着人工智能技术的飞速发展，深度学习算法在各个领域的应用日益广泛。然而，将深度学习算法部署到资源受限的嵌入式平台上，仍然是一个具有挑战性的任务。本文将从嵌入式平台的特点、深度

发表于 07-15 10:03 •1802次阅读

神经网络如何用无监督算法训练

神经网络作为深度学习的重要组成部分，其训练方式多样，其中无监督学习是一种重要的训练策略。无监督学习

发表于 07-09 18:06 •932次阅读

深度学习中的无监督学习方法综述

应用中往往难以实现。因此，无监督学习在深度学习中扮演着越来越重要的角色。本文旨在综述深度学习中的无监督学

发表于 07-09 10:50 •1010次阅读

机器学习算法原理详解

机器学习作为人工智能的一个重要分支，其目标是通过让计算机自动从数据中学习并改进其性能，而无需进行明确的编程。本文将深入解读几种常见的

发表于 07-02 11:25 •1436次阅读

基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

STDP 无监督学习算法，可运用于图像的无监督分类。从平台设计角度： (1)本设计搭建的基于 PYNQ 集群的通用低功耗的大规

发表于 06-25 18:35

开源项目！设计一款智能手语翻译眼镜

这个项目是一款创新的智能手语翻译眼镜，它能够实时地将手语转换为听得见的语音。这款眼镜采用了VIAM平台和树莓派Zero 2 W，能够帮助聋人或听力受损的人士更自由、独立地与他人交流，减少对第三方

发表于 05-20 15:59

机器学习怎么进入人工智能

，人工智能已成为一个热门领域，涉及到多个行业和领域，例如语音识别、机器翻译、图像识别等。在编程中进行人工智能的关键是使用机器学习算法，这是一类基于样本数据和模型训练来进行预测和判断的算法。下面将介绍使用

发表于 04-04 08:41 •412次阅读

广和通发布机器人开发平台

广和通近日隆重发布了其全新研发的具身智能机器人开发平台——Fibot。该平台旨在满足客户在验证Mobile ALOHA协同学习与简单示教操作

发表于 03-29 09:34 •735次阅读

能在Meteor Lake平台上使用SDK 3.5吗？

SDK 是 3.6 版，不支持 CYPD6127 部件。那么，我能在 Meteor Lake 平台上使用 SDK 3.5 吗？ SDK 3.5 - 平台选择有"MTL" 关键字：

发表于 03-04 06:32

把CY8C4146平台上工程移植到CY8C4147平台上，用户程序没运行的原因？

客户现在想把CY8C4146平台上工程移植到CY8C4147平台上，在topdesign重新选择4147，管脚也调整了一下，编译重新生成底层代码，creator4.2IDE编译没报错，同时同步更新

发表于 02-21 06:04

Meta发布新型无监督视频预测模型“V-JEPA”

Meta，这家社交媒体和科技巨头，近日宣布推出一种新型的无监督视频预测模型，名为“V-JEPA”。这一模型在视频处理领域引起了广泛关注，因为它通过抽象性预测生成视频中缺失或模糊的部分来进行学习，提供了一种全新的视频处理方法。

发表于 02-19 11:19 •1112次阅读

搜索历史

Facebook采用无监督机器学习翻译其平台上内容

评论

如何选择云原生机器学习平台

构建云原生机器学习平台流程

HAL库在Arduino平台上的使用

什么是机器学习？通过机器学习方法能解决哪些问题？

深度学习算法在嵌入式平台上的部署

神经网络如何用无监督算法训练

深度学习中的无监督学习方法综述

机器学习算法原理详解

基于FPGA的类脑计算平台 —PYNQ 集群的无监督图像识别类脑计算系统

开源项目！设计一款智能手语翻译眼镜

机器学习怎么进入人工智能

广和通发布机器人开发平台

能在Meteor Lake平台上使用SDK 3.5吗？

把CY8C4146平台上工程移植到CY8C4147平台上，用户程序没运行的原因？

Meta发布新型无监督视频预测模型“V-JEPA”