Google Assistant的新功能——Duplex双工技术-电子发烧友网

在6月的1400多篇机器学习相关的文章/项目中，Mybridge甄选了10篇最热文章（入选率0.7％）。主题包括：Google Duplex，网格单元，神经网络，TensorFlow，Keras，第一名解决方案，CVPR 2018等。

在 5 月的1400多篇机器学习相关的文章/项目中，Mybridge甄选了10篇最热文章（入选率0.7％）。

此列表中的主题：Google Duplex，网格单元，神经网络，TensorFlow，Keras，第一名解决方案，CVPR 2018等。

Top 10文章由Mybridge AI选出，综合考虑文章分享数量、阅读时间等，并使用机器学习算法对文章进行排序。相信这些文章分享的机器学习经验和技巧是有用的。

1. Google Duplex：一个通过电话完成真实世界任务的AI系统

5月份最受关注的是谷歌在I/O大会演示的Google Assistant的新功能——Duplex双工技术。

利用Duplex双工技术，谷歌的智能助理能用非常类似人声的角色完成真实世界的任务。在demo中，谷歌CEO Pichai告诉听众，“你将要听到的是，谷歌的助理实际地打电话给一家真实的美容院，为你安排一个预约。”当然，智能助理几乎毫无破绽地完成了任务。虽然后来这个演示是否真实受到一些质疑，但这一技术引发了业界热议。

在这篇文章中，谷歌首席工程师Yaniv Leviathan和工程副总裁Yossi Matias详细介绍了Google Duplex使用到的技术，包括：

Duplex的核心是一个循环神经网络（RNN），使用TensorFlow Extended（TFX）构建。

使用谷歌自己的自动语音识别（ASR）技术来处理语音，将语音转换为文本。

使用连续文本到语音（TTS）引擎和综合TTS引擎（使用Tacotron和WaveNet）的组合，根据情况控制语调。

https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

2. “换脸术”Deep Video Portraits

Deep Video Portraits是斯坦福大学、慕尼黑技术大学等的研究人员提交给今年8月SIGGRAPH大会的一篇论文，描述了一种经过改进的“换脸”技术，可以在视频中用一个人的脸再现另一人脸部的动作、面部表情和说话口型。

例如，将普通人的脸换成奥巴马的脸。Deep Video Portraits可以通过一段目标人物的视频（在这里就是奥巴马），来学习构成脸部、眉毛、嘴角和背景等的要素以及它们的运动形式。

论文地址：https://arxiv.org/abs/1805.11714

3.在人工智能体中使用网格表示进行导航

虽然AI在围棋等许多任务超过了人类，空间导航能力对于人工智能体来说仍然是一个巨大的挑战。DeepMind在Nature上发表的一篇论文引起AI领域和神经科学领域的极大震撼：AI展现出与人脑“网格细胞”高度一致的空间导航能力。

通过一系列实验操作，研究人员发现网格单元对于基于矢量的导航至关重要。例如，当网络中的网格单元被掐断时，agent的导航能力就会受损，而且对目标的距离和方向的判断等关键指标的表示变得不那么准确。这项发现有助于AI可解释性的研究。

地址：https://deepmind.com/blog/grid-cells

4.如何用Python从头开始构建一个神经网络

这是一个入门教程，初学者可以从这个教程开始，了解深度学习的内部运作。

神经网络是什么呢？许多介绍性文章会将其与大脑进行类比，但如果抛开神经网络和人脑的类比，将其描述为一个给定的输入和一个期望的输出之间的映射的数学函数，会更好理解。

神经网络包含以下元素：

一个输入层x

任意数量的隐藏层

一个输出层ŷ

每一层之间的一组权重W和偏差b

每个隐藏层的激活函数σ。在这个教程中，使用Sigmoid激活函数。

图：一个2层神经网络的架构

地址：https://towardsdatascience.com/how-to-build-your-own-neural-network-from-scratch-in-python-68998a08e4f6

5.对Airbnb上的照片进行分类

Airbnb为数百万的民宿提供了一个平台，也因此获得了一大批民宿的房间细节照片和用户数据。在这个任务中，Airbnb的数据团队利用计算机视觉和深度学习对民宿房屋照片进行分类。

其目的一方面是将具有相似风格的房源聚集到一起，方便用户浏览。另一方面，分类也可以帮助验证房间数量和房屋信息的准确性。该团队表示，利用这些图片数据，还将发掘出更多潜在的信息。

地址：https://medium.com/airbnb-engineering/categorizing-listing-photos-at-airbnb-f9483f3ab7e3

6. Loc2Vec：用triplet-loss网络学习位置嵌入

这是一个以智能手机的传感器数据作为输入，例如加速度计、陀螺仪和位置信息，并从中提取行为洞察的平台，用于了解用户的模式，并能够预测和解释事情发生的原因。

这个平台的一个重要组成部分是场地映射算法（venue mapping algorithm）。venue mapper的目标是弄清楚你要访问的地点。

地址：http://www.sentiance.com/2018/05/03/loc2vec-learning-location-embeddings-w-triplet-loss-networks/

7.在浏览器中使用TensorFlow.js进行实时人体姿态估计

这是来自TensorFlow博客的教程，与谷歌创意实验室合作，发布了TensorFlow.js版本的PoseNet。PoseNet是一个机器学习模型，可以在浏览器中实时估计人体姿态。

PoseNet可以利用单姿态或多姿态算法检测图像和视频中的人物，所有这些都可以在浏览器中实现。

PoseNet的姿态估计分两个阶段进行：

将一个RGB图像作为输入，输入给卷积神经网络。

利用单姿态或多姿态解码算法解码来解码模型输出中的姿态、姿态置信度分数、关键点位置和关键点置信度分数。

PoseNet返回检测到的每个人的置信度值以及检测到的每个姿势关键点。

https://medium.com/tensorflow/real-time-human-pose-estimation-in-the-browser-with-tensorflow-js-7dd0bc881cd5

8.用Keras进行多标签分类

这是一个关于多标签分类的Keras教程，包括以下4个部分：

讨论多标签分类数据集（以及如何快速构建自己的分类数据集）。

简要讨论SmallerVGGNet，这是将用来实现多标签分类的Keras神经网络架构。

实现SmallerVGGNet，并使用多标签分类数据集对其进行训练。

最后，在示例图像上测试网络，并讨论一些注意事项

https://www.pyimagesearch.com/2018/05/07/multi-label-classification-with-keras

9.谷歌地标检索挑战赛：第一名解决方案解读

四个月前，谷歌在Kaggle发布了一项地标检索挑战赛（Google Landmark Retrieval Challenge），参赛者被要求在所有图像数据集中检索到含有给定图像中地标的图片。

这篇文章是第一名团队的解决方案总结，包括两个主要部分：

首先，创建一个高性能的全局描述符（global descriptor），它可以将数据集中的图像表示为奇异向量（singular vector）；

然后，创建一个高效框架，将这些向量和最可能的图像匹配，最后提交到积分榜上。

以下是一个流程图，每一步都标记LB分数。

https://www.kaggle.com/c/landmark-retrieval-challenge/discussion/57855

10.学会“夜视”

这是伊利诺伊大学香槟分校（UIUC）和Intel Labs合作的论文，提出一个基于端到端训练的用全卷积网络进行低照度图像处理的模型。这个网络直接处理原始传感器数据，并且基本不使用传统的图像处理流程。

两个大型新数据集

伯克利大学发布大型驾驶视频数据集BDD100K

伯克利大学发布了BDD100K，这是目前为止最大规模也是最多样化的驾驶视频数据集。这些数据具有四个主要特征：大规模，多样化，在真实的街道采集，并带有时间信息。利用这个数据集，你还可以参加伯克利在CVPR 2018举办的自动驾驶竞赛。

地址：http://bair.berkeley.edu/blog/2018/05/30/bdd/

骨骼X-ray数据集

Andrew Ng带领的斯坦福大学ML团队发布了一个目前为止最大规模的医学影像数据集MURA（musculoskeletal radiographs），这个数据集包含4万多张多角度射线检测图像，来自对12173名病人的14863项研究，X光影像包含人体上肢的7个部分：肘、指、小臂、手、肱、肩、腕。最近，该团队推出了基于此数据集的识别挑战赛：MURA骨骼X-ray深度学习竞赛。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Google

Google

+关注

关注
5

文章
1772

浏览量
57898
神经网络

神经网络

+关注

关注
42

文章
4785

浏览量
101284
机器学习

机器学习

+关注

关注
66

文章
8455

浏览量
133184

原文标题：5月机器学习TOP 10热文: Google Duplex，“换脸术”、网格单元（附文章地址）

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

谷歌语音助理服务新功能：可为用户整合日常有用信息

　　导读：近日，谷歌宣布为其语音助理服务Google Assistant推出一种新功能，向客户提供日常可能用到的各种信息的“可视化快照”。　　谷歌周二宣布为其语音助理服务Google

发表于 07-19 09:27

Google Assistant搭配Google Duplex技术就能成为智能音箱霸主

Google、亚马逊和苹果三大厂商力拚智能音箱市场，因整合了多项技术，根据研调机构Canalys的调查结果，智能音箱霸主在第1季换手，首度由Google Home系列产品取代Amazon Echo

发表于 05-31 09:14 •2315次阅读

Google Assistant即将登陆Wear OS

Assistant的功能也变得更加强大。在今天发表的官方博文中，Google预告了即将登陆Wear OS的诸多Google Assistant

发表于 06-14 09:45 •3652次阅读

沃尔玛借助Google Assistant来推动语音杂货店的启动

沃尔玛宣布，其客户很快将能够使用语音命令和Google Assistant购买杂货。该功能将在支持Google Assistant的任何设备

发表于 11-22 10:32 •956次阅读

Google Assistant活跃用户超五亿，将推出新功能

在亚马逊宣布整合 Alexa 语音助手的设备突破 1 亿之后，Google 宣布它的语音助手 Google Assistant 活跃用户超过了五亿。

发表于 01-09 15:38 •2490次阅读

使用Google Assistant的灯光监控系统

电子发烧友网站提供《使用Google Assistant的灯光监控系统.zip》资料免费下载

发表于 11-24 10:43 •0次下载

使用Google Assistant监控室温

电子发烧友网站提供《使用Google Assistant监控室温.zip》资料免费下载

发表于 12-13 09:23 •0次下载

通过Google Assistant控制灯光

电子发烧友网站提供《通过Google Assistant控制灯光.zip》资料免费下载

发表于 12-16 10:14 •0次下载

使用Google Assistant的警报系统

电子发烧友网站提供《使用Google Assistant的警报系统.zip》资料免费下载

发表于 12-22 16:55 •0次下载

基于Google Assistant的中继控制

电子发烧友网站提供《基于Google Assistant的中继控制.zip》资料免费下载

发表于 01-31 14:35 •0次下载

什么是双工技术？有哪些双工方式？

鸽子从A驿站到B驿站，或者从B驿站到A驿站，这两个方向的信息在交互协调的过程就是双工技术。

发表于 05-18 14:29 •7141次阅读

由Google Assistant控制的Jarvis

电子发烧友网站提供《由Google Assistant控制的Jarvis.zip》资料免费下载

发表于 06-29 14:55 •0次下载

Google Assistant语音控制开关

电子发烧友网站提供《Google Assistant语音控制开关.zip》资料免费下载

发表于 06-30 15:11 •0次下载

使用Google Assistant控制蜂鸣器

电子发烧友网站提供《使用Google Assistant控制蜂鸣器.zip》资料免费下载

发表于 07-04 11:28 •0次下载

使用Google Assistant和IFTTT控制蜂鸣器

电子发烧友网站提供《使用Google Assistant和IFTTT控制蜂鸣器.zip》资料免费下载

发表于 07-04 10:06 •0次下载

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Google Assistant的新功能——Duplex双工技术

评论

谷歌语音助理服务新功能：可为用户整合日常有用信息

Google Assistant搭配Google Duplex技术就能成为智能音箱霸主

Google Assistant即将登陆Wear OS

沃尔玛借助Google Assistant来推动语音杂货店的启动

Google Assistant活跃用户超五亿，将推出新功能

使用Google Assistant的灯光监控系统

使用Google Assistant监控室温

通过Google Assistant控制灯光

使用Google Assistant的警报系统

基于Google Assistant的中继控制

什么是双工技术？有哪些双工方式？

由Google Assistant控制的Jarvis

Google Assistant语音控制开关

使用Google Assistant控制蜂鸣器

使用Google Assistant和IFTTT控制蜂鸣器