Facebook 2018 AI研究全回顾-电子发烧友网

在过去的一年，Facebook经历了很多波折和困难，但是在研究方面依旧涌现出了很多高质量的工作。近日，Facebook发文总结了去年在长期研究项目、高性能工具开发和平台开发以及AI的实际应用等各个方面的工作。

随着研究和工程实践的深入，实现了更强大的智能系统、更优秀的开源工具、更稳定高效的开源平台，诸多的研究论文和模型代码为深度学习研究做出了众多贡献。同时，还将AI应用到了医学和社会生活等领域，让技术真正造福人类。那么，就让我们一起看下这些工作都有哪些吧！

基于半监督和无监督学习的先进AI技术

实现人类水平的人工智能是每个从业者和研究人员最终的目标。在过去的一年，Facebook的研究人员利用更少的数据实现了更复杂的功能，让人工智能的目标又近了一步。目前大多数机器学习都基于大量标记数据通过监督学习的方式来实现特定的任务，但耗时的数据标记工作极大地限制了技术的发展。所以如何充分释放半监督和无监督学习的潜力，减少智能系统对于数据量的需求至关重要。在多语言理解和翻译系统中，研究人员提出一种新的方法，基于无监督数据实现自然机器翻译模型自动训练迁移，并达到了与监督数据相比拟的效果。通过减少对于大规模标记数据的依赖，这一系统打开了向更多语言迁移的技术大门，甚至可以用于像乌尔都语一样标记数据十分有限的语言。

多种语言的二维词向量嵌入空间可以通过简单的变换实现匹配。

此外，对于数据集资源有限的语言来说，需要用多种技术手段来实现。使用多语言模型融合同一语系多种方言间的相似性。通过多种技术的综合，研究人员在自动翻译系统中成功的新增了24种语言。同时在与纽约大学的合作中，在MutilNLI数据集中新增了14中语言，将有效助力自然语言理解的研究进程。同时，还发布了跨语言推理数据集XNLI，其中包括了乌尔都语和斯瓦希里语两种小语种。利用半监督和非监督的方式有效减少了对于监督训练数据的需求。研究人员还探索了数据监督的方式，结合监督和非监督数据，通过数据蒸馏的方法实现半监督学习。另外值得一提的是，研究人员探索了基于图像标签的图像识别系统，创造性的利用现存的、非传统标注的数据生成了大规模的自标记训练数据集，其中包括了35亿张来自Instagram的图像。用户为照片标记的标签可以为图像提供更为丰富的信息，将现存的图像转变为弱监督数据样本。结果表明，这些手段不仅有效地提升了基于图像的任务表现，更将图像识别模型的准确率推高了1%。

图像标签可帮助计算机学习到比通常分类更为细的子分类信息，并补充图中元素的信息。

加速AI研究产品化进程

AI作为一种基础能力已经在产品的方方面面得到体现。2018年Facebook最主要的工作也集中在如何将AI方面的研究成果尽可能的产品化并部署到系统中，主要体现在PyTroch平台和一系列工具的开发上。PyTroch自2018年发布以来已经跃居为GitHub上增长第二的开源项目。其灵活的接口对于研究AI研究的快速迭代十分友好，同时开源的框架设计有助平台包容并蓄快速迭代和发展。随着代码体系的不断完善，今年发布的PyTorch1.0实现了产品级别的框架，涵盖了从原型研究到服务部署的全套流程。

包括Google、微软和英伟达在内的大厂以及Fast.ai、Udacity等教育机构都在使用PyTorch来实现研究、产品开发和教育过程。近日，发布完整版的PyTorch1.0涵盖了混合前端的新特性，可以在图模式和eager模式下无缝切换，同时改进了分布式训练流程，为高性能研究用户提供了纯cpp的编程接口。

研究人员也基于PyTorch开发了包括 QNNPACK 、FBGEMM等工具库，使得移动端和服务器更容易地运行最新的AI模型。

同时开发了PyText，加速了自然语言处理的研究发展。

在强化学习方面，Facebook开发了Horizon框架，利用强化学习在大规模生成系统中进行优化。它吸收了研究领域大量使用的基于决策的方式，并应用于十亿级别的数据集上。在部署了这套框架后，使得优化视频流和信息流更为高效。这套工具的开源搭建了强化学习研究和产品化之间的桥梁。

Horizon的流程图解。首先对系统中的数据进行预处理，随后离线训练模型测量、最后对策略进行部署和测试，并循环改进整个流程。

为了加速机器学习的运算过程，另一个称为Glow的开源项目衔接了不同的编译器、硬件平台和深度学习框架，通过与厂家合作开发，在Intel，Cadence, Esperanto, Marvell，Qualcomm 等平台上实现了高效的加速。

作为Open Computer Project的一部分，Facebook还推出了面向工业界机器学习用户的Big Basin v2。

在VR/AR方面，研究人员结合深度学习进行了更深入的研究，在DeepFocus项目中发布了数据和模型。利用深度学习算法渲染出VR中的真实场景，包括了变焦多焦距和光场效果的智能渲染等。

用AI造福人类

将技术广泛应用于改善人类生活的方方面面是每个技术从业者的追求。Facebook在过去一年——利用音频视觉描述技术帮助视觉障碍的人，同时基于跨语言的自然语言处理和文本分析预测用户的自杀倾向，及时拯救更多的人。

同时，研究人员还利用AI迅速精确地计量自然灾害地区的受损状况。为灾难救援、受损评估和灾后重建提供了高效准确定量的手段。

此外通过机器学习技术，研究人员还开发出了Rosetta系统，用于检测图像和视频中的文本信息，并能在多种语言间进行语义的合规性检查，大大减少了人工成本以及不良言论的出现和传播。

Rosetta文本检测的两步架构

最后在医学影像方面，fastMRI项目加速了核磁共振影像的检测速度，加速了深度学习技术向医学领域的迁移和发展。项目不仅发布了充足的数据集，同时也开源了基本模型供来自世界各地的研究人员学习改进。

核磁共振的原始数据和重建后膝盖图像

过去的一年里，研究人员还改进了Getafix, predictive test selection, SapFix, Sapienz, and Spiral等等一系列系统，提高了SLAM和AI in Marketplace等技术在产品中的应用，并发表了一系列研究成果，包括了著名的wav2letter++, 结合多词的表示, 以及multilingual embeddings, 和audio processing等工作。

在新的一年里，更加扎实的工作和研究将在基础设施研究、高精尖应用和AI造福社会等方面展开。希望2019，Facebook能带来更多优秀的研究成果和高效的开源工具，推动AI技术更好发展。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

图像识别

图像识别

+关注

关注
9

文章
517

浏览量
38207
人工智能

人工智能

+关注

关注
1789

文章
46576

浏览量
236893
ai技术

ai技术

+关注

关注
1

文章
1250

浏览量
24176

原文标题：别人家的盘点 | Facebook 2018 AI研究全回顾

文章出处：【微信号：thejiangmen，微信公众号：将门创投】欢迎添加关注！文章转载请注明出处。

阿里国际站首推全流程AI产品：AI生意助手2.0

阿里巴巴国际站近日正式推出了其首个全流程AI产品——AI生意助手2.0。这一创新产品的问世，标志着阿里巴巴国际站在推动中小企业外贸业务智能化方面迈出了重要一步。 AI生意助手2.0配备

发表于 10-29 10:22 •187次阅读

AI大模型的最新研究进展

AI大模型的最新研究进展体现在多个方面，以下是对其最新进展的介绍：一、技术创新与突破生成式AI技术的爆发：生成式AI技术正在迅速发展，其强大的生成能力使得

发表于 10-23 15:19 •236次阅读

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

人们对AI for Science的关注推向了高潮。 2. 跨学科融合与科学研究新范式 AI与生命科学的结合，不仅推动了生命科学本身的进步，还促进了多个学科之间的交叉融合。这种跨学科的合作模式，打破

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

人工智能在科学研究中的核心技术，包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石，使得AI能够处理和分析复杂的数据集，从而发现隐藏在数据中的模式和规律。 2. 高性能

发表于 10-14 09:16

博联AI大模型全屋智能亮相2024中国建博会

2024中国建博会（广州）在广交会展馆及保利世贸博览馆盛大启幕。 BroadLink博联智能携AI大模型全屋智能以及AI商业照明解决方案惊喜亮相，全方位展示AI大模型在智能家居领域的

发表于 09-12 15:46 •289次阅读

人工智能ai4s试读申请

目前人工智能在绘画对话等大模型领域应用广阔，ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题，本书对ai4s基本原理和原则，方法进行描诉，有利于总结经验，拟

发表于 09-09 15:36

做AI时代的全栈服务商，北电数智在一年里如何破题立论？

以全栈AI赋能产业，北电数智的行与思

发表于 08-03 10:26 •2483次阅读

做<b class='flag-5'>AI</b>时代的<b class='flag-5'>全</b>栈服务商，北电数智在一年里如何破题立论？

联想全栈AI之海，纳智能中国的山川万物

联想全栈AI的沧海横流，看见智能中国的底色

发表于 07-01 09:42 •1210次阅读

联想<b class='flag-5'>全</b>栈<b class='flag-5'>AI</b>之海，纳智能中国的山川万物

让全栈AI的旗帜猎猎作响：“逆行者”华为云

全栈AI创新，虽艰难却必要

发表于 06-23 09:47 •2.6w次阅读

让<b class='flag-5'>全</b>栈<b class='flag-5'>AI</b>的旗帜猎猎作响：“逆行者”华为云

宁畅推出“全栈全液”AI基础设施方案

近日，宁畅科技正式发布其“全栈全液”AI基础设施方案，这一创新举措旨在全面支持大模型落地所需的各项技术需求。该方案集成了计算、存储、网络、建设、管理、应用及液冷等多项关键技术，为用户提供一站式解决方案。

发表于 05-31 09:18 •559次阅读

联想与京东签署战略协议，深化AI全栈升级合作

确定联想在京东全渠道销售总额高达1200亿元人民币的未来三年目标，并相互确立对方作为最先推出AI PC的伙伴关系，联手构建AI终端产业生态环境，推动AI设备如

发表于 04-08 10:03 •313次阅读

第二届大会回顾第10期 | 低时延分布式共享设备研究与探索

演讲嘉宾 | 杜东回顾整理 | 廖涛排版校对 | 李萍萍嘉宾介绍 OS内核及视窗分论坛杜东，上海交通大学助理研究员，OpenHarmony项目群技术指导委员会并发与协同

发表于 02-25 17:52 •503次阅读

第二届大会<b class='flag-5'>回顾</b>第10期 | 低时延分布式共享设备<b class='flag-5'>研究</b>与探索

英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的AI创新成果。面向广大开发者、研究人员和学界人士，这一AI和计算机视觉领域的全球顶会将于12月10日至16日

发表于 12-08 19:15 •506次阅读

全志算力驱动， AI生态合作共赢

— “我们通过多元化产品布局，以智能大视频为基础构建智能应用平台，通过AI全面赋能，与多家行业标杆客户建立战略合作关系，并配合客户在算力、算法、产品、服务等方面进行整合，聚焦AI语音、AI

发表于 12-08 18:40 •880次阅读

英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

英特尔研究院将重点展示31项研究成果，它们将推进面向未来的AI创新。英特尔研究院将在NeurIPS 2023大会上展示一系列富有价值、业界领先的

发表于 12-08 09:17 •658次阅读

搜索历史

Facebook 2018 AI研究全回顾

评论

阿里国际站首推全流程AI产品：AI生意助手2.0

AI大模型的最新研究进展

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

博联AI大模型全屋智能亮相2024中国建博会

人工智能ai4s试读申请

做AI时代的全栈服务商，北电数智在一年里如何破题立论？

联想全栈AI之海，纳智能中国的山川万物

让全栈AI的旗帜猎猎作响：“逆行者”华为云

宁畅推出“全栈全液”AI基础设施方案

联想与京东签署战略协议，深化AI全栈升级合作

第二届大会回顾第10期 | 低时延分布式共享设备研究与探索

英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果

全志算力驱动， AI生态合作共赢

英特尔研究院将在NeurIPS大会上展示业界领先的AI研究成果