0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌正式推出ARCore 1.7版本,为其添加了前置摄像头AR自拍能力以及动画效果支持

jmiy_worldofai 来源:lp 2019-03-14 15:27 次阅读

ARCore 是谷歌于去年 2 月份正式推出的 增强现实(AR)软件开发工具包,给开发者提供了一个开发 AR APP 的平台。不到一个月前,谷歌正式推出ARCore 1.7 版本,为其添加了前置摄像头 AR 自拍能力以及动画效果支持;而日前,谷歌又为其引入了机器学习技术,使其实时自拍 AR 的逼真效果更进一步,该技术相关的文章发布在谷歌 AI 的官方博客上。

增强现实(AR)通过将数字内容与信息叠加到物质世界的真实场景中,来让人类实现超越现实的感官体验。例如,谷歌地图的 AR 功能,能够在现实场景中叠加方向信息来为你指路。借助于Pixel 相机中的 Playground 模式,你可以使用 AR 从不同的视角看世界。并且通过借助于最新发布的「YouTube Stories」以及ARCore 全新的面部增强(Augmented Faces)API,你可以在自拍上添加动画面具、眼镜、帽子、皮肤等特效。

实现这种 AR 功能的关键挑战之一,就是以合适的方式将虚拟内容锚定到现实世界:这一过程需要一套能够追踪到每一次微笑、皱眉或假笑的高动态表面几何结构的独特的感知技术。

ARCore 的3D 网格以及它能实现的一些特效

为此,我们引入了机器学习(ML)技术来推断近似的 3D 表面几何结构,并且仅需要用到一个单摄像头输入而无需使用专用的深度传感器。这种方法利用面向移动 CPU 界面推断或其可用的全新移动 GPU 功能的TensorFlow Lite,实现了逼真的实时 AR 效果。与「 YouTube Stories」 全新的创作者特效所利用的技术一样,这项技术已通过最新的 ARCore SDK和ML Kit Face Contour Detection API向广泛的开发者社区开放。

用于自拍 AR 的机器学习工作流

我们的机器学习工作流由两个协同工作的实时深度神经网络模型组成:一个是探测器,它在整张图像上运行并计算出面部位置;另一个是通用的 3D 网格模型,它在探测器计算出来的面部位置上运行,并通过回归预测近似的表面几何结构。精确地裁剪面部能够极大地减少对一般的数据增强的要求,例如由旋转、平移和比例变换组成的仿射变换(affine transformations)等,同时让网络将大部分性能投入于预测坐标来提高其准确性——这对于锚定合适的虚拟内容至关重要。

裁剪完所关注的位置后,该网格网络一次仅应用于一个单帧,并利用加窗平滑(windowed smoothing)来减少面部处于静态时的噪音,同时避免在大幅移动期间出现的延迟。

针对 3D 网格,我们采用了迁移学习,并训练了一个具有多个目标的网络:该网络能够同时地基于合成、渲染的数据预测 3D 网格坐标以及基于类似于MLKit所提供的带有注释的、现实世界的数据预测 2D 语义轮廓。最终的网络为我们提供了基于合成数据乃至现实世界数据的合理的 3D 网格预测。所有模型都在源自于地理学多样化的数据集的数据上进行训练,并接着在平衡、多样化的测试集上进行定性和定量性能的测试。

3D 网格网络接收经裁剪的视频帧作为输入。由于它不依赖于额外的深度输入,因而也可以应用于预先录制的视频。该模型不仅输出 3D 点的位置,还输出在输入中存在并合理对齐的面部概率。一种常见的替代方法就是为每个地标预测出 2D 热图,但这种方法并不适用于深度预测,并且对于如此多的数据点来说,使用这种方法耗费的计算成本非常高。

通过迭代自展和精炼预测,我们进一步提高了模型的准确性和鲁棒性,同时也将数据集发展成为愈加具有挑战性的实例,如鬼脸,拍摄角度倾斜以及面部遮挡等。此外,数据集增强技术也扩展了可用的 ground truth 数据,并开发出了对摄像头瑕疵等人工产品问题或极端光照条件具有弹力的模型。

数据集扩展和改善路径

专为硬件定制的界面

我们使用 TensorFlow Lite 进行设备内置的神经网络推理。新推出的 GPU 后端加速能够有效提升性能,并显著降低功耗。此外,我们还设计了具有不同性能和效率特性的一系列模型架构,来覆盖到更加广泛的消费级硬件。较简单网络之间的最重要的区别就在于残差块(Residual Block)设计和可接受的输入分辨率(最简单模型中的输入分辨率为 128×128 像素,而最复杂模型中的输入分辨率为 256×256)。同时,我们还改变了层数以及子采样率(输入分辨率随网络深度的减少而减少的速度)。

每一帧的推断时间:CPU vs. GPU

这一系列的优化的结果就是:使用更简单的模型带来了实质性的加速,同时也将 AR 特效质量的降低幅度最小化。

这些成果最终则能够通过以下方式,让用户在 YouTube、ARCore 以及其他客户端体验到更加逼真的自拍 AR 效果:

通过环境映射模拟光反射,来实现眼镜的逼真渲染;

通过将虚拟的目标阴影投射到面部网格上,来实现了自然光照效果;

对面部遮挡进行建模,来隐藏面部后面的虚拟目标部分,如下所示的虚拟眼镜案例。

另外,我们还通过以下方式实现了逼真的妆容效果:

对应用到嘴唇上的镜面反射进行建模;

利用亮度感知材料来实现面部着色。

案例对比:5 个目标在不同光线下的真实化妆效果以及 AR 化妆效果

我们很高兴将这项新技术分享给创作者、用户以及开发者。感兴趣的读者可以通过下载最新的 ARCore SDK (下载地址:https://developers.googleblog.com/2019/02/new-ui-tools-and-richer-creative-canvas.html)来将这项技术用起来。未来,我们还计划将这项技术广泛应用到更多的谷歌产品线中。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 探测器
    +关注

    关注

    14

    文章

    2644

    浏览量

    73053
  • 神经网络
    +关注

    关注

    42

    文章

    4772

    浏览量

    100835
  • 机器学习
    +关注

    关注

    66

    文章

    8421

    浏览量

    132710

原文标题:通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌推出用于自拍摄像头的防脸部失真算法

    在人工智能领域,虽然今年在市场落地方面中外企业进步不同,但是谷歌、微软等巨头在具体算法研究上依然处于领先地位。谷歌研究人员成功开发了用于自拍摄像头的防脸部失真算法,这项研究成果对于社交媒体等企业大有裨益。
    发表于 06-18 08:54 763次阅读

    ESM6802支持Qt摄像头应用

    版本。使用Qt的multimedia模块可以方便快捷的进行摄像头应用的开发,本文使用Qt源码中提供的camera例程进行展示,例程代码可从Qt源码中获取或者向我们工程师索要。  我们使用的摄像头
    发表于 10-20 10:33

    如何快速 MCU 添加人脸识别摄像头

    - 1000 的十进制数表示。摄像头支持图像输出功能,主要用于开发人员设置摄像头和对准方向时的调试辅助。它的分辨率 320 x 240,还不足以用作安防监视器。如果需要流媒体视频,
    发表于 08-01 10:10

    谷歌将通过CNET在Motion Stills应用程序中增加对AR贴纸的支持

    谷歌的研究博客今天宣布,它将通过CNET在Motion Stills应用程序中增加对AR贴纸的支持。 该功能于去年晚些时候首次在谷歌Pixel 2手机上
    的头像 发表于 02-08 11:19 3053次阅读

    Scope AR通过谷歌ARCore功能,将Remote AR进一步应用到移动AR领域

    Scope AR通过利用谷歌最近发布的ARCore功能,决定将其远程协助企业应用程序Remote AR进一步应用到移动AR领域。 虽然之前
    发表于 05-16 10:14 1755次阅读

    谷歌推出支持多人AR体验的ARcore

    AR云基于ARCore的运动跟踪功能,简单来说,通过寻找虚拟物体的特殊点并创建稀疏点云来起作用。
    的头像 发表于 05-16 15:42 4428次阅读

    三星Galaxy S10 Plus曝光将有前置摄像头和后置四摄像头

    这表明三星将在新旗舰手机的Super AMOLED屏幕上面开一个孔,里面塞入前置摄像头,而手机背部至少有三颗水平设计的摄像头。其中三星Galaxy S10 Plus有前置
    发表于 12-13 08:59 2000次阅读

    小米MIX3前置摄像头超越华为Mate20

    DxOMark昨天公布了手机前置摄像头自拍排行榜,排在前三位的是谷歌Pixel3、三星Galaxy Note9、小米MIX3,如果放在中国手机厂商里面,小米的MIX3则是成为
    的头像 发表于 01-30 16:25 5239次阅读
    小米MIX3<b class='flag-5'>前置</b><b class='flag-5'>摄像头</b>超越华为Mate20

    全面屏时代,如何解决前置摄像头的问题?

    在刘海屏时代,前置摄像头和听筒安放在刘海中;在水滴屏时代,隐藏式听筒的出现,让水滴仅需要容纳前置摄像头,而在全面屏时代,如何解决前置
    的头像 发表于 08-04 09:55 5880次阅读

    谷歌推出ARCore Depth API 可以使AR游戏体验更加自然

    谷歌的开发者平台ARCore推出一款称为Depth API的新工具,该工具可以让开发者使用谷歌的动态深度算法和一个RGB摄像头来制作深度地图
    发表于 12-11 10:25 1146次阅读

    谷歌ARCore的Depth API用单个摄像头能创建深度图

    Android增强现实(AR)取得重大进步,近日谷歌正在为开发工具包ARCore添加Depth API,这项新功能仅用单个摄像头就可以创建深
    的头像 发表于 12-11 16:21 3810次阅读

    手机摄像头结构性能分析以及测试方案的介绍

    手机摄像头结构由前置摄像头和后置摄像头组成。 前置摄像头目前主要以在手机屏幕打孔的形式呈现,有利
    发表于 11-04 16:39 2209次阅读

    升级!谷歌将利用手机的双摄像头来提升 AR 性能

    据外媒 AndroidPolice 报道,谷歌即将利用手机的双摄像头来提升 AR 性能。
    发表于 03-03 18:18 1031次阅读

    浅谈ADAS前置摄像头设计挑战

    前置摄像头是高级驾驶辅助系统 (ADAS) 的重要组件,尤其是鉴于现在的新车碰撞测试要求将自动紧急制动和正面防撞作为汽车的标准功能。前置摄像头有助于实现其他 ADAS 功能,例如自适应
    的头像 发表于 12-14 15:57 759次阅读
    浅谈ADAS<b class='flag-5'>前置</b><b class='flag-5'>摄像头</b>设计挑战

    用usb摄像头替换手机前置摄像头可以吗

    随着科技的进步和智能手机的普及,摄影已经成为了我们日常生活中不可或缺的一部分。然而,有时我们可能会对手机自带的前置摄像头的拍摄效果感到不满意。那是否可以考虑用USB摄像头替代手机
    的头像 发表于 01-08 14:11 2865次阅读