0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

3D视频会议系统VirtualCube打开未来办公的更多可能

微软科技 来源:微软科技 作者:微软科技 2022-06-13 09:36 次阅读

小编说:常言道:“眼睛是心灵的窗户”,眼神交流所传达的信息也可以进一步提升人们的沟通效果。然而,随着视频聊天、视频会议逐渐成为常态,大家不禁要问,我们有多久没有与同事、朋友、家人确认过眼神了?

而微软亚洲研究院的研究项目 3D 视频会议系统 VirtualCube,可以让在线会议的与会者建立自然的眼神交互,沉浸式的体验就像在同一个房间内面对面交流一样。该技术的相关论文被全球虚拟现实学术会议 IEEE Virtual Reality 2022 接收并获得了大会的最佳论文奖(Best Paper Award – Journal Papers Track)。

在日常交谈中,相互注视和摆动头部等动作都是自然对话的组成部分,尤其是当我们在面对面交流中变换话题、控制发言或转换交流对象时,都会伴随眼神和肢体动作的交流。然而,当前的视频会议技术却存在着一定的缺陷——由于摄像头和屏幕不在同一高度,如果看向屏幕眼神往往很不自然,如果看向摄像头则无法关注到其他与会者的反应,因此视频会议缺少了线下交流的真实感和互动感。而且在实际的工作中,我们还会有各种不同的会议场景,比如多人会议、同排而坐协同工作等情况,对于捕捉与会者的侧方视线和动作来说,现有的视频会议系统就更无能为力了。

如果有一个会议系统,可以让人们即使身处不同的地方,也能像在同一房间里一样交流,视线转动就能与同伴建立起眼神沟通,这是否会给远程办公增添一份沉浸式的真实感呢?

1利用现有的普通硬件设备搭建的 3D 视频系统

为了解决这些问题,微软亚洲研究院提出了创新的 3D 视频会议系统——VirtualCube,它可以在远程视频会议中建立起真人等大的 3D 形象,无论是正面沟通,还是侧方交流,系统都能够正确捕捉到与会者的眼神、动态,建立起眼神和肢体交流。相关论文被全球虚拟现实学术会议 IEEE Virtual Reality 2022 接收并获得了大会的最佳论文奖(Best Paper Award – Journal Papers Track)。(点击阅读原文,了解论文细节)

VirtualCube 系统具有三大优势:

标准化、简单化,全部使用现有的普通硬件设备。与办公场所中常见的格子间(Cubicle)类似,每个 VirtualCube 都提供了一致的物理环境和设备配置:与会者正前方安装有6个 Azure Kinect RGBD 摄像头,以捕捉真人的图像和眼神等动作;在与会者的正面和左右两侧还各有一个大尺寸的显示屏,以创造出身临其境的参会感。使用现有的、标准化的硬件能够大大简化用户设备校准的工作量,从而实现 3D 视频系统的快速部署和应用。

多人、多场景,任意组合。作为在线视频会议的基础构建,VirtualCube 的虚拟会议环境可由多个空间(Cube)按照不同的布局组成,以支持不同的会议场景,例如两人的面对面会议、两人并排会议,以及多人的圆桌会议等。

实时、高质量渲染真人图像。VirtualCube 可以捕捉到参与者的各种细微变化,包括人的皮肤颜色、纹理,面部或衣服上的反射光泽等,并实时渲染生成真人大小的 3D 形象,显示在远程与会者的屏幕中。而且虚拟会议环境的背景也可以根据用户的需求自由选择。

2V-Cube View和V-Cube Assembly算法双剑合璧,沉浸式会议体验不再是难题

其实业界对 3D 视频会议的研究从未间断过。早在2000年,就有人曾提出过与类似混合现实技术有关的畅想。基于这个设想,科研人员一直在探索如何将视频会议以更逼真、更自然的方式呈现,期间也出现了不同的技术路线和解决方案,但都没有达到理想的效果。对此,微软亚洲研究院主管研究员张译中和杨蛟龙表示,过往的研究仍然有很多没有解决的问题:首先,在真实环境下,无论放置怎样的单目摄像设备,即使图像质量再高,与会者也很难形成自然的眼神交流,特别是多人会议的情况;其次,很多研究针对特定的会议场景进行优化,如两个人面对面的会议或三人的圆桌会议,很难支持不同的会议设置;第三,虽然在影视界我们能够看到一些逼真的虚拟人,但那是需要专业的技术和影视团队长时间打磨和优化才能实现的,仍然需要一定的手工劳动,目前无法进行实时捕捉和实时渲染。

为此,微软亚洲研究院提出了 V-Cube View 和 V-Cube Assembly 两大全新算法,在 VirtualCube 中实现了自动捕捉参与者的手势动作和眼神变化,实时渲染形成高保真图像,让参与者在虚拟会议中体验到真实会议的氛围。

“两个人在交谈且相互注视对方时,对方看到的自己就相当于在自己眼睛的位置放置一个摄像头。但屏幕和摄像头的位置存在高低差,所以当一方注视屏幕中对方的眼睛时,摄像头捕捉到的眼神就会偏离。因此在 VirtualCube 中,我们在与会者正前方的屏幕边缘放置了六个摄像头,通过 V-Cube View 算法合成正确的视点图像,并利用 V-Cube Assembly 确定正确的相对位置,进而给与会者一个沉浸式的会议体验”,张译中介绍道。

基于深度学习的 V-Cube View 算法,通过 VirtualCube 中的六个摄像头的 RGBD 图像作为输入,实时渲染任意目标视点下人的高保真视频。这里的技术挑战是如何同时做到高保真和实时。对此,微软亚洲研究院主管研究员杨蛟龙解释道:“实时渲染高保真的人像,特别是高保真的人脸一直是个具有挑战性的研究课题。传统的三维重建和纹理贴图的做法虽然可以做到实时绘制,却无法重现出真实人脸复杂的材质和在不同视点下外观的变化。为此我们提出了一种新的 Lumi-Net 渲染方法,其核心思想是利用重构的三维几何作为参考来实现一个四维光场的实时渲染,并结合神经网络进行图像增强,从而提高了渲染的质量,特别是人脸区域的高保真度。”

具体而言,V-Cube View 算法分为三步进行。首先,研究员设计了一个神经网络来快速求解目标视点深度图作为人体的几何参考(geometry proxy)。然后,算法在给定的几何参考下将获取的多视角 RGB 图像(即光线)进行融合,实现绘制。在这一步中,研究员受传统的非结构化流明图(Unstructured Lumigraph)方法启发,将输入光线与目标像素光线的方向和深度差异作为先验,通过神经网络学习最合适的融合权重。最后,为了进一步提升绘制质量,研究员们使用了神经网络对上一步的绘制结果进行图像增强。整个算法实现了端到端的训练,并在训练过程中引入了感知损失函数及对抗学习技术,使得算法可以自动学习出最优的神经网络,实现高保真的绘制。而且为了保证绘制的实时性,算法的前两步都在低分辨率图像上执行,这样可以在不损失太多精度的情况下大大降低所需计算量。经过精心设计和优化的 V-Cube View 算法,将实时的三维人物渲染质量提升到了一个新的高度。

另外,为了让 VirtualCube 的使用者拥有和线下交流同样的体验,在将与会者映射到虚拟环境时,系统还要考虑他们之间的相对位置关系,这时 V-Cube Assembly 算法就发挥了重要的作用。“在整个虚拟会议环境中,V-Cube Assembly 可以被定义为全局坐标系统,单个的 VirtualCube 则为局部坐标系统。全局坐标系与局部坐标系之间的正确 3D 几何变化,对在视频显示器上正确呈现远程与会者的图像至关重要”杨蛟龙介绍。

研究员们首先会在 VirtualCube 中捕捉与会者的 3D 几何体,形成局部坐标系,然后将这些局部坐标系的 3D 几何体数据,投射到全局坐标系,经过 V-Cube Assembly 处理,在全局虚拟会议环境中确定每个 VirtualCube 参与者正确的相对位置,最后再将全局 3D 几何体转换为 VirtualCube 的局部坐标系,影射到 VirtualCube 的屏幕上。

3抛砖引玉,畅想未来办公无限可能

VirtualCube 给 3D 视频会议系统提供了一种全新的思路。无论从算法设计、端到端设备部署还是工程调试上,VirtualCube 都证明了利用现有的普通硬件设备就可以实现沉浸式的 3D 视频会议体验。

除了让与会者“共享”同一个物理空间外,研究员们还在探索利用 VirtualCube 系统满足远程办公中的更多协作需求。例如,研究员们展示了这样一种场景:在协同工作时,两位与会者及其电脑桌面都将是视频会议的一部分,因此与会者并排而坐,并且跨屏幕传递自己桌面上的文档和应用程序会让远程协作更加方便。

随着技术的不断精进,未来,大家或许都可以实现身隔万里,却能亲临其境一起办公,自然沟通的遥在体验,而这将极大地提高混合办公的效率。微软亚洲研究院的研究员们也希望 VirtualCube 可以成为一颗探索的种子,给更多研究人员带来启发,在大家共同的努力下,找到更好的虚拟空间交互形式,打开未来办公的更多可能。

原文标题:远在万里也像近在咫尺般的3D会议是什么体验?

文章出处:【微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6549

    浏览量

    103865
  • 3D
    3D
    +关注

    关注

    9

    文章

    2847

    浏览量

    107236
  • 视频会议系统

    关注

    2

    文章

    51

    浏览量

    17750

原文标题:远在万里也像近在咫尺般的3D会议是什么体验?

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    中小企业远程会议必备,华为云会议 Flexus 版重磅亮相 828!

    在技术进步和工作方式变革的双重驱动下,远程办公成了不可逆的发展趋势,企业对视频会议的需求也与日俱增。前些年,视频会议系统因部署复杂、造价高昂且维护成本高,仅是政府和一些大企业的“专属”,但是随着云
    的头像 发表于 09-26 22:10 542次阅读
    中小企业远程<b class='flag-5'>会议</b>必备,华为云<b class='flag-5'>会议</b> Flexus 版重磅亮相 828!

    3D 建模:塑造未来的无限可能

    在当今数字化飞速发展的时代,3D 建模正以惊人的力量改变着我们的生活和工作方式。它不仅是一项创新的技术,更是开启未来之门的钥匙。 3D或三维这个术语指的是三个空间维度:宽度、高度和深度。物质
    的头像 发表于 08-16 18:24 1499次阅读

    基于 FPGA 的会议系统设计

    展示样品图 01.设计概述 1.1 设计目的 随着疫情的出现,线上会议的应用越来越广泛,相关的技术也越来越成熟,但当前的线上会议系统大都基于电脑和手机,便于个人使用,但由于其摄像头拍摄方向
    发表于 08-01 18:40

    视频会议解决方案

    飞腾云XU316 7MIC无感本地扩音方案正是可以解决视频会议中音质不好的问题的有效解决方案。
    的头像 发表于 06-28 15:30 404次阅读
    <b class='flag-5'>视频会议</b>解决方案

    在线视频会议软件有哪些?三种实现方式

    分类来进行解说。 视频会议技术基本上可分为两大类:基于硬件的编解码和基于软件的编解码。以下是基于两种编码的三种在线视频会议实现方式。 一、基于硬件的视频会议系统 硬件视频会议系统主要通
    的头像 发表于 05-21 17:43 477次阅读
    在线<b class='flag-5'>视频会议</b>软件有哪些?三种实现方式

    Stability AI推出Stable Video 3D模型,可制作多视角3D视频

    SV3D_u是Stable Video 3D的一个版本,仅需单幅图片即可生成运动轨迹视频,无须进行相机调整。扩充版本的SV3D_p加入了轨道视图的特性,使其可以根据预设的相机路径创建
    的头像 发表于 03-21 14:57 909次阅读

    指挥车工程中的讯维视频会议系统:提升应急响应能力的关键

    在指挥车工程中,讯维视频会议系统作为一种高效的信息传递和沟通工具,发挥着至关重要的作用。特别是在应对突发事件、紧急救援等场景中,该系统能够显著提升应急响应能力,确保指挥决策的高效性和准确性。 首先
    的头像 发表于 03-08 16:47 262次阅读

    基于视频会议系统的指挥车工程通信解决方案

    指挥车工程在应对紧急事件、协调资源以及现场指挥等方面发挥着至关重要的作用。为了实现高效、稳定的通信,提升指挥决策效率,基于讯维视频会议系统的通信解决方案应运而生。 一、系统架构 该通信解决方案以讯维
    的头像 发表于 03-08 16:44 347次阅读

    SD-WAN视频会议解决方案效果如何?SD-WAN如何加速视频会议

    当今的数字化办公环境中,视频会议已经成为了企业间沟通和协作的重要工具。但是,网络状况不佳和带宽限制等问题可能会对视频会议质量产生影响。幸运的是,SD-WAN(软件定义广域网)技术的运用为优化
    的头像 发表于 02-28 14:34 319次阅读

    无线数字会议系统的设计理念与功能

    无线数字会议系统是一种便捷、高效、现代化的会议解决方案。它基于先进的技术和人性化的设计理念,为使用者提供了一系列实用的功能。本文将详细介绍无线数字会议系统的设计理念与功能。 一、设计理念 便捷性
    的头像 发表于 01-24 15:07 1044次阅读

    无线数字会议系统的技术创新与影响

    :无线数字会议系统采用最新的无线传输技术,如5G、WiFi 6等,实现了高速、稳定的信号传输。这使得视频和音频信号在传输过程中更加清晰、流畅,减少了延迟和卡顿现象。 抗干扰能力:通过采用先进的通信频段和信号处理技术,无线
    的头像 发表于 01-23 15:19 581次阅读

    无线数字会议系统与传统会议系统的比较与选择

    无线数字会议系统与传统会议系统是两种不同的会议形式,它们各有优缺点,适用于不同的场景。在选择使用哪种会议系统时,需要考虑会议的规模、目的、预
    的头像 发表于 01-23 15:17 526次阅读

    【飞腾派4G版免费试用】3.JITSI视频会议想开就开

    【飞腾派4G版免费试用】3.JITSI视频会议想开就开 现在市面上大部分会议软件都是需要付费的,就是免费使用,也大都40-50分钟的体验时间。还没聊尽兴,这块会议突然被中断了,那有没有
    发表于 12-25 18:44

    高品质万兆园区网络带你领略音视频会议体验升级,沟通无边界,视频零卡顿

    随着互联网的快速发展、企业数字化的不断深入,音视频业务已经成为了企业园区网络中的一项重要业务。大量的企业会在日常工作中把视频会议作为提升办公效率的重要手段。 举例,欧洲的某家知名银行,业务遍及全球
    的头像 发表于 11-16 20:25 403次阅读
    高品质万兆园区网络带你领略音<b class='flag-5'>视频会议</b>体验升级,沟通无边界,<b class='flag-5'>视频</b>零卡顿

    关于会议系统设备运行在线监测系统

    针对会议系统内的设备运行状态进行监测,比如功放、调音台,可通过哪种方式进行
    发表于 11-09 09:51