0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google ARCore新增功能

ss 来源:VR陀螺 作者:VR陀螺 2020-11-27 14:25 次阅读

Google 开发者大会 (Google Developer Summit) 是谷歌面向开发者展示最新产品和平台的年度盛会。2020 Google 开发者大会于 11 月 16 日 至 21 日举行,这是谷歌首次以全线上大会的形式与中国开发者相聚。

本次大会以“代码不止”为主题,介绍了相关产品更新以及一系列面向本地开发者的技术支持内容,旨在赋能开发者高效创新、持续不断地创造愉悦的产品体验。

目前AR已经从只是畅想发展到今天的技术相对成熟的状态,应用也不断推陈出新。加上5G的带动,越来越多的AR体验走进生活,被更多人了解和使用。

随着科技的不断演进,人机交互的方式也不断变更。摄像头成为了数字世界的眼睛,能看懂并感知这个世界,再结合IMU、GPS算力集成及深度学习后,AR技术开始在最需要的位置和时空中无缝联结,并响应现实世界。

AR提供了一种体验信息以及获得答案的新方法,吸引了人们的注意力,最终帮助推动了用户行动起来。无论是应用的下载、互动,还是应用内购买,都看到了显著的提升。

此次大会与AR/VR相关重点集中在ARCore的讲解与介绍,谷歌软件工程总监王启文(Leon Wang)、大中华区AR/VR负责人熊子青、Google 技术布道师周克忠与Google 软件工程师Eric Turner围绕ARcore从多个角度进行了主题分享。

ARCore新增功能上线:更方便的设置、更真实的交互

AR作为一种视觉沉浸式媒介,能够吸引人们的注意力,是一种体验信息的新方式,并最终推动用户的行动。而谷歌发布于2018年的ARCore是AR开发者平台,提供了简单而强大的工具,为AndroidiOS用户创造有效的AR体验。目前已被应用在7亿台设备和成千上万款app上,并且已获得一系列更新。

整体上,ARCore能被适用于多种场景,离不开以下几个核心功能:

1、运动追踪。用来帮助用户实现虚拟现实的映射关系。

2、环境理解。对现实环境中的平面信息进行评估,利用特征点来估算位置、大小以及朝向 。

3、光估测。ARCore可以分析估算当前环境中的光照信息,对渲染的虚拟内容进行光照色彩的校正,使其与手机摄像头拍到的真实画面结合得更加自然。

另外ARCore还有许多延伸的功能: 1、增强面部识别。提供了高精度468点的3D Mesh。可以精准地追踪脸部细微表情,不需要深度传感器,而是运用机器学习(ML)中的深度学习,以达到这样的功能。同时支持安卓及IOS用户。

2、环境光HDR。要让虚拟物品看起来更逼真,更融入实景,其中最重要的功能之一就是要有正确的光照呈现。运用了ARCore所提供的360度全景光照信息,图中的虚拟小火箭,就可以有了对应的反光及影子。

3、Scene Viewer场景观测器。让开发者可以直接在网页上向用户提供方便、好用的3D内容及AR浏览功能。

4、Agumented Image增强图像。可以检测手机拍摄到的图像信息,并与预先设置在数据库中的图像进行匹配。可精确匹配包括移动中的图像,或是同时检测多个图像。

5、云锚点。为安卓和iOS用户创建共享的跨平台体验。就如同图中的案例,从两个人到数百人,都可以在各自的设备上一起种花、浇灌。

11月16日,谷歌软件工程总监王启文(Leon Wang)发表了关于“ARCore为用户创造有效的AR体验”的主题演讲,介绍了Google热门的AR开发工具ARCore的新增功能。

新增功能如下:

迅速放置API(Instant Placement API)

一般来说,用户在空间中放置过AR对象时,需要先用手机扫描周围的环境,完成3D表面检测。但这个过程将耗费一些时间和精力。实际上,在大多数情况下,我们不需要知道AR对象确切的3D位置也可以正确地呈现它。

借助迅速放置API和几行代码,开发人员可让用户将AR对象锚定到2D图像中,而不需要确切知道AR对象具体的3D位置。如果需要更精确的比例,可以针对3D位置进行三角测量。

景深应用API(Depth API)

景深API可以从单个RGB相机生成地图。原理是通过不同角度拍摄多张图像,并在移动手机时进行比较,以估计到每个像素的距离。尽管只有一个RGB相机,但是添加了景深传感器(如飞行时间传感器)会让景深地图效果更好。

景深可以通过多种方式增强AR真实感,“遮挡”是其中一种景深应用,即隐藏数字物体在现实世界中被遮挡的部分,从而使它们看上去像是在现实场景中真实存在。

另一种是“表面交互”,即在设备中的世界里,添加3D层面的计算,可以实现与现实物品表面的交互,比如创意AR对象,并在其表面设计反弹和飞溅的动作。此功能可以用于开发新的交互式游戏机制,使玩家能够躲在真实物体的后面。Snapchat的Dancing Hotdog和Undersea World Lens效果都使用了景深。

持久云锚点Persistent Cloud Anchors API

Cloud Anchors API可用于与多个用户共享AR对象。在相同物理空间中的不同位置同时查看这些对象并与之交互,AR内容也因此可使用更长时间。

这相当于一个“保存按钮”,人们可以基于相同的AR体验进行创作并进行反复修改。比如,Sybo和iDreamSky的Mark应用采用了该功能,人们可以在现实世界中与朋友一起创建、发现和共享AR艺术。

AR技术大神讲解ARCore深度API运作方式

Google 技术布道师周克忠与Google 软件工程师Eric Turner主要针对了ARCore 核心功能中的深度API技术进行演讲。ARCore 1.18 中发布的深度 API,赋能数以亿计的 Android 设备,在只是使用一个 RGB 摄像头的情况下,生成深度图。

以“使用深度 API 提升 AR 的真实性”为主题演讲的前半部分,周克忠介绍了ARCore的最新功能,包括深度API是什么,它可以解决什么问题等;后半部分,Eric介绍了ARCore如何实现深度API。

一、深度API是什么?它可以解决什么问题?

之前Google大中华区AR/VR负责人熊子青也曾讲述,ARCore是Google为安卓平台制作的AR开发平台,目前在全球支持超过5亿台设备。其核心能力是运动追踪、环境理解和光估测。现在已经有很多APP使用ARCore制作出各种各样的丰富体验。

通过ARCore制作的应用看上去很逼真,但是实际体验上,这些虚拟内容看起来好像他们就是手机膜一样被贴到手机屏幕上,他们并不是真的在现实世界里面,这里缺少的就是遮挡,会破坏ARCore应用的真实感。 深度API的加入,可以解决虚拟对象缺乏真实感的问题,能够消除违和感。

二、如何实现遮挡?

首先我们需要定义深度。如图C点是摄像机的位置,Z轴是摄像机的主轴,A点表示一个现实的物体,从C到A的深度则被定义为线段CA在Z轴的投影。此为场景物体的深度轴。 根据深度信息,智能手机就能够渲染虚拟物体。在着色渲染器里面计算每一个像素点的时候,我们将当前像素点的深度值,和之前在这个像素点所渲染过的颜色的深度值进行对比。 如果之前的像素点深度值更低,那么就意味着它更近;相反,则更远。就这样便可以实现基于深度的遮挡效果。

三、除了遮挡,深度API增强真实感的其他方式

1.AR光标。在AR应用里面,用户可以把定点的光标贴合深度API生成的网格,此时光标就变成了在现实世界存在的AR光标。目的是更好地帮助用户理解现在所看到、所对准的具体位置,以及这个位置的形状。

2.物理交互。比如如图所示,将一个虚拟物体丢到健身自行车上面,让AR物体和真实世界的物体发生物理碰撞,进行物理模拟

3.表面交互。通过让AR角色识别真实物体表面的高低起伏,从而做出更加真实的前进路线,甚至可以绕开障碍物。

周克忠还介绍了目前团队发表的论文《Depth Lab:Real-time 3D Interaction with Depth Maps for Mobile Augmented Reality》(UIST,2020),论文主要关于如何从深度信息实现以上功能,以及深度信息可以开启怎样的应用场景。

四、如何实现复杂的用法? 团队利用了三种辅助数据结构来帮助计算。 第一种数据结构就是一个深度数组,可以在屏幕上进行局部坐标的深度信息查询。 第二种是深度网格,可以用来和真实物体的表面进行交互。注意这里是平面坐标系的网格,毕竟世界坐标系的网格运算量过大,一般手机无法承载。 第三种是深度贴图,对GPU能处理的每一个像素都提供对应的深度值。 这三种结构在Depth Lab(深度API应用程序)都有提供代码,是一个开源项目,提供给开发者进行自主设计。

五、关于局部、表面和密集深度贴图的方法 通过使用深度数组,用户可以查询局部点的信息,以及这个点周围局部区域的深度信息。

局部深度用法中,只通过某些点的深度估测值,可以用于测量、3D资源的放置和碰撞检测。也可以配合多点的深度,实现简单的AR角色障碍规避。比如说通过深度信息查询环境中一个点与另一个点的实际距离。

表面深度用法,是基于深度信息快速构建屏幕空间的网格模型,利用游戏引擎进行网格交互。表面深度算法让我们可以在3D网格上面实现光照、物理效果、阴影等功能。 密集深度用法,即通过在深度贴图上直接进行操作,以实现复杂的逐帧像素特效。由于深度贴图上的每个像素都有深度值,使得计算量特别大。一般的屏幕空间网格,其实是经过相当的简化后的网格,而ARCore把计算量移到了GPU上,减小了手机的计算负担。

第二部分里,在周克忠介绍深度API实际运作方式的基础上,Eric通过具体例子进行了补充。

六、深度API原理剖析

一般而言,手机需要配备特殊的深度硬件才能实现深度识别,比如ToF深度传感器。但实际上,现阶段的ARCore并不需要特殊设备,只需要有摄像头,就可以实现深度API功能。

如图,左边是手机相机拍摄的原始图像,右边是深度API为此场景生成的深度。用户可以近距离观察单车,也可以远距离观察远处的门和走廊,分别对应的颜色是红色和蓝色,表示近处和远处。

这意味着无论AR应用在做什么,它都可以获取整个场景中的每个帧的深度信息。根据相机的运动生成深度信息,如蓝色帧为远处,红色帧为近处,这些帧会被最后的相机画面帧(黑色)引用为立体匹配关键帧。过去的帧与当前的帧之间的基线,可用来估算场景的立体深度。 但Eric提到,基于用户自然移动的规则,团队为此添加了一些限制。因此与传统的并行立体匹配相比,设计基于自然移动的深度API则存在一些挑战。

传统的并行立体匹配可以全面控制相机之间的相对位置。而在典型AR应用中,对于随机相机移动,团队无法控制相机的位置,即用户在进行自由移动时,相机可能在任何方向。 而目前,ARCore深度API添加了智能图像处理功能,以确保整个图像都具有准确的深度。除此之外,还能够补偿速度匹配错误、运动模糊、自动聚集聚焦变化或自然移动导致的小于正常基线的问题等。

深度API的完整流程是: 实时图像-形成关键帧池-筛选出关键帧-根据智能算法剔除无效关键帧-立体匹配-使关键帧平滑-调用深度API-实现渲染遮挡。 其亮点在于,即使是一面空白无特征的墙,ARCore的深度API仍然能够生成正确表示该空白墙的深度图像。

其原理是,如图所示,白墙是黄色帧,箱子是橙色帧。在图二的中间,可以看到伪色深度图像,正确呈现了场景中的物体的远近位置。而图三则是以点云代替颜色,进行了侧面视角观察,但同样能以垂直点表示墙面、水平点表示箱子,准确判断出墙和箱子的相对距离。 演讲的最后,周克忠总结,实现深度API最大的难点是怎么扩展这个能力。为装备到数以亿计的安卓设备上而设计深度API的时候,一方面我们需要尽可能的让它的结果精确,另外我们需要尽量去减少它的计算量,以尽量支持更多的已有设备。 而近年来,Google一直在进行深度API的优化,以减少它的计算量。

不止于此,ARCore已具有丰富的应用场景

总体上,王启文将ARCore的核心功能进行了详细介绍,周克忠和Eric剖析了ARCore最受瞩目的深度API的运作原理。有了底层技术支撑,ARCore也被广泛应用在丰富的场景中,并受YouTube、美图、滴滴等多个企业青睐。

此前,王启文在演讲上还介绍了中国地区ARCore的应用情况。在此基础上,大中华区AR/VR负责人熊子青补充ARCore应用案例,她以“ARCore新近更新及应用实例”为主题,从AR近期发展、ARCore进程、2020新近更新三个方面介绍了ARCore产品动态。

关于中国地区的应用案例,王启文介绍了包括美图、滴滴、有道少儿词典的中国开发者如何使用ARCore提高产品的性能和体验。

美图公司利用ARCore的增强面孔API(Augmented Faces API)构建了100多个自拍滤镜,就是现在我们在BeautyPlus上可以体验到的AR特效,用户可以拍摄照片和视频与朋友分享。

增强面孔API(Augmented Faces API)从2D图像中生成3D网格,可追踪嘴部动作、眨眼、点头和一些复杂的细节。

滴滴的ARCore导航功能帮助乘客在火车站、商场和机场等大型公共区域找到司机。滴滴地图中加入了AR路标,15%的用户使用AR来引导他们找到订单司机,80%的用户给出好评。

有道少儿词典应用使用AR来帮助孩子们以一种有趣和吸引人的方式学习新单词。该应用将“三角龙Triceratops ”等单词与其3D模型在AR中配对,父母可以把AR画面录制或拍照,方便日后成为孩子们可参考的学习材料。

关于更丰富的应用场景的应用,熊子青介绍了目前AR技术主要应用在学习、娱乐、出行、社交等场景,以此阐明AR技术正帮助将人们的生活变得更便利、更有趣。

例如,在Google search中,设计了许多3D模型,老虎、狮子,甚至是数学公式,让用户在搜寻时能360度观看,也可以用AR方式投射到家中,立体化地了解信息。疫情期间,获得了全球使用者的广大回响。

关于Google lens智慧镜头应用,用户打开摄像头就可以识别花草、文字、电视、地标、菜单。

在YouTube中的应用。用户可以一边看美妆博主示范化妆方式,一边可以使用AR功能进行实时试妆。

Google Map中也应用了AR户型导航。用户可以看到方向指示牌和导览提示,仿佛一个专属的私人导游。该应用是目前GoogleAR应用中使用者最多的应用之一。

随着手机的普及,营销媒介也发展出基于手机相机的新应用。运用AR将人们带入沉浸式体验,将人们带入品牌世界。Google display network中,Google推出了3D Swirl营销工具,该营销应用在今年下半年正式完成了beta测试版,并且已经看到了用户参与度及品牌影响力的显著提升。

5G实践前沿。随着5G商用化,ARCore与LG Uplus合作,在韩国首尔进行了AR+5G的实践尝试。在首尔地铁站布建了AR艺术长廊和展示车厢,5G加持能够克服地铁站人多信号差的缺陷,人们能够顺畅地体验到丰富的AR艺术内容。

昌德宫。联合国教科文组织世界遗产站点。Google与SK Telecom和文化遗产管理局合作,创建了全球首个5G赋能的AR文旅体验。AR导览由一个活化的石狮子带领,游客可以穿越到朝鲜王朝,体验传统习俗和体会朝鲜贵族生活。

总结

通过2020 Google 开发者大会,我们看到了谷歌基于算法API方面对于ARCore的进一步升级。让手机会“看”、能“懂”的需求已经随着机器学习、深度API的更新进程不再是困扰AR体验的拦路虎。

值得一体的是,谷歌正加大力度将人工智能算法整合到ARCore底层,以确保尽可能多的支持市场上参差不齐的手机品类。应用方面,谷歌ARCore采用广撒网的方式,与国内出行、教育、医疗、文化等领域的领先企业进行合作,通过催生越来越多的AR应用场景的诞生,随着量变到质变的转换,爆款AR应用的诞生值得期待。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6142

    浏览量

    105110
  • Ar
    Ar
    +关注

    关注

    24

    文章

    5083

    浏览量

    169273
  • 开发者
    +关注

    关注

    1

    文章

    553

    浏览量

    16991
收藏 人收藏

    评论

    相关推荐

    SOLIDWORKS 2025新增功能介绍

    在工程设计领域,SOLIDWORKS一直是创新的代名词,其不断推出的新版本总能带给用户惊喜。2025年的SOLIDWORKS再次不负众望,带来了一系列令人瞩目的新增功能,旨在提升设计效率、增强用户体验,并推动工程设计的边界。
    的头像 发表于 11-21 13:56 95次阅读

    HyperLynx 2409的新增部分功能

    在《HyperLynx 2409丨新一代电子系统设计的革新之旅(上)》中,我们介绍了HyperLynx 2409的新增部分。接下来,我们将继续深入探讨这些新功能如何帮助设计人员更有效地识别和解决潜在问题,从而优化设计流程,确保产品的可靠性和性能。
    的头像 发表于 11-12 11:11 205次阅读

    HyperLynx 2409新增功能和改进功能

    作为HyperLynx Schematic Analysis加入HyperLynx系列;Xpedition AMS即将作为HyperLynx AMS加入HyperLynx系列。我们的产品一如既往地出色,并具有以下新增功能和改进功能
    的头像 发表于 11-04 11:15 224次阅读

    荣耀手机新增谷歌Circle to Search功能

    近日,全球知名科技品牌荣耀宣布,在其旗舰智能手机HONOR Magic V3及HONOR 200系列上,正式推出谷歌(Google)Circle to Search功能。这一创新功能将为用户带来更加便捷、直观的搜索体验。
    的头像 发表于 10-17 18:16 635次阅读

    使用google-translate和wwe合并后无法使用google-tts怎么解决?

    我打算使用lyrat-mini做一个使用唤醒词唤醒然后后续通过google-sr和google-tts进行交流的聊天机器人,但是当我合并了adf的例子中的wwe和google-translate之后
    发表于 06-28 06:05

    微软OneNote引入“便笺”功能并更改图标为紫色,新增搜索框

    如今,微软官方宣布这一功能已进入稳定运行阶段,所有Windows用户均可尝试最新版本的OneNote应用,体验其新增的“便笺”功能
    的头像 发表于 05-28 12:02 831次阅读

    Google Pay新增功能,优化在线购物体验并提升安全性

    5 月 23 日,谷歌官方发表博文,称旗下的Google Pay增添了三大功能,以提升用户在线购物体验并实现更安全、更便捷的支付。
    的头像 发表于 05-23 11:10 487次阅读

    谷歌:iOS版Chrome浏览器将支持“圈选即搜”功能,整合Google

    据了解,截至5月17日,Google已在Galaxy S24及Pixel 8系列智能手机中引入了所谓的“圈选即搜”功能,该功能旨在帮助用户快速寻找关键信息。而日前,有消息透露,Google
    的头像 发表于 05-17 10:00 611次阅读

    智能戒指Oura Ring新增测量心血管年龄与心肺功能功能

    5月10日讯,全球热销智能戒指品牌Oura Ring近日宣布新增功能,用户可通过其测量心血管年龄和心肺功能,以评估心血管健康状况并采取相应措施。
    的头像 发表于 05-11 11:33 448次阅读

    谷歌Wear OS推出“School Time”功能 防止学生上学期间使用APP

    据悉,谷歌已于5月8日推出Google Play Services v24.18,该版本新增了为Wear OS智能手表提供的“SchoolTime”功能,广受瞩目。
    的头像 发表于 05-09 14:49 655次阅读

    Google Lens和iOS快捷指令助iPhone用户实现“圈选即搜”

    谷歌近日对 iOS 版本的 Google(Search)应用进行升级,新增了便捷的快捷指令,可自动捕捉当前画面,并利用 Google Lens 进行深度识别的同时提供相应自动搜索。
    的头像 发表于 05-08 16:19 478次阅读

    谷歌Pixel 8将采用Gemini Nano模型,新增两项AI功能

    经谷歌披露,Pixel 8 在配备 Gemini Nano 后,首先将增加两大创新 AI 功能:其中之一是 Recorder 应用内新增 Summarize 功能,无网络情况下可记录并归纳更多关于对话、采访和演示的有用信息。
    的头像 发表于 03-29 15:46 546次阅读

    阿维塔12发布3.2.0版本更新,新增多项功能并优化细节

    特殊车道智能通行功能:城市和乡村的智驾领航辅助(NCA)和车道巡航辅助(LCC)均新增功能,支持通过潮汐车道、公交车道控制杆进入NCA模式,并实现自动驶出的操作。
    的头像 发表于 03-28 14:27 551次阅读

    Google Gemma优化后可在NVIDIA GPU上运行

    2024 年 2 月 21 日,NVIDIA 携手 Google 在所有 NVIDIA AI 平台上发布面向 Gemma 的优化功能,Gemma 是 Google 最先进的新型轻量级 2B 和 7B 开放语言模型,可在任何地方运
    的头像 发表于 02-25 11:01 440次阅读

    SOLIDWORKS 3D CAD 2024的10大新增功能

    随着技术的不断进步,SOLIDWORKS,这一知名的3D CAD(计算机辅助设计)解决方案,也在不断发展和创新。近日,SOLIDWORKS发布了其新版本——SOLIDWORKS 2024,带来了许多令人兴奋的新功能和改进。下面,我们将深入探讨SOLIDWORKS 3D CAD 2024的10大
    的头像 发表于 01-17 14:01 1128次阅读