0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ToF传感技术让XR交互更自由

MEMS 来源:MEMS 作者:MEMS 2023-04-17 09:52 次阅读

一、技术背景与发展趋势

在当前的XR(虚拟现实、增强现实和混合现实)应用中,物理形式的手柄控制器仍作为一种基础的交互方式被广泛使用。然而,物理手柄在高临场感的沉浸式XR应用场景下,需要用户进行适应性学习,其存在操作复杂度高、成本高等先天缺陷。

为增加XR交互的流畅性及沉浸感,香港光云科技(HKSC)于近期推出一项凝聚其多年技术积累的创新性XR交互解决方案——TrueToF Neural Gesture。它基于Time of Flight(ToF)传感器信号深度学习来解析用户的精细手部动作,能够在无需手持外设下实现精准手势控制。

该方案充分发挥信号的优势,具有高精度、低延迟等诸多技术优势,为XR应用提供一种更自然、沉浸的交互体验,同时结合了香港光云科技(HKSC)最新的 3D语义理解技术,可以准确识别用户手势信息所表达的行为意图,为各类应用场景提供丰富的用户动作属性标签。例如,在教育领域,学生可以通过手势直观地操控虚拟实验装置;在娱乐领域,游戏玩家能够更自然地与虚拟角色互动;在设计领域,专业人士可以轻松地编辑、调整3D模型等等。相较于传统XR设备的手柄控制器, TrueToF Neural Gesture能够为更多用户带来创新的XR体验,使用户能够更加轻松地探索和享受虚拟世界,无需手持的的物理外设,同时降低设备成本。

“Training data is Technology” OpenAI首席科学家及联合创始人Ilye Sutskever阐明了精准的训练数据在大模型训练中的重要性。然而在3D空间对手部关节进行精准跟踪,必然需要大量的3D信号数据及其信号空间真值标注。HKSC构建了专业3D数据库—TrueToF 3D 手势基础Dataset,包含高质量的ToF 3D 信号的RAW数据以及高精度的3D标注数据。其中,3D手势超过10,000种,可供训练的案例超过100,000种,据此其开发了高精度3D手势识别方法。与传统数据集相比,TrueToF手势训练库中的数据具有精准的3D空间信息,尤其是深度Z轴上的真值数据。TrueToF 3D Dataset的建立,可以为AI学习提供更加准确、可靠的数据标注,为3D手势识别技术的发展提供有力的支撑。

二、TrueToF Neural Gesture

TrueToF Neural Gesture是一种基于TrueToF Neural IP底层成像及3D语义技术的高精度3D手势识别方案。它够在三维物理空间中实现用户手部姿态的高精度追踪,增强现实及虚拟现实下的用户交互体验。与传统手势识别技术及行业内主流方案相比,TrueToF Neural Gesture具有以下技术优势:

• 高响应:基于信号的直接处理

• 高精度:支持双手21个关节点的<1mm精度跟踪

• 3D准度:精准测量传感器与手部各关键点之间的3D距离

• 角度精度:可扩大手势角度精度范围2倍以上,并提升角度分辨率至0.5°

• 稳定性:在正常光照和低光环境下,手掌检测的稳定性更好

• 可靠性:在户外环境和低光环境下检测及跟踪稳定,可适应不同应用场景

TrueToF Neural Gesture在性能方面表现出色,与业界公认的Mediapipe等手势识别方案的关键性能指标上对比如下:

14a5c3a8-dc86-11ed-bfe3-dac502259ad0.png

关键性能指标对比

TrueToF Neural Gesture现已支持多种手势控制:

1. Gesture Pointer:该手势类似传统的激光指针方式,允许用户用任一手指向并操控虚拟物体。通过TrueToF技术捕捉手部动作,用户可以轻松地执行这一操作。

2. Controller Pointer:该手势允许用户用双手以虚拟方式体验传统物理手柄控制器的操作。TrueToF技术可以识别用户的双手动作,并将其转化为虚拟世界中的控制信号。

3. Poke Pointer:该手势允许用户用任一手指(缺省为食指)“戳”虚拟物体,进行精确的选择和操作。TrueToF技术能准确捕捉这类手势,实现细致的交互。

4. Grab Pointer:该手势允许用户能够用单手抓取和移动虚拟物体,模拟真实世界中的抓取行为。TrueToF技术捕获手部动作,并实现自然地抓取操作。

通过上述交互式手势响应,TrueToF Neural Gesture为用户提供了丰富、自然的XR交互体验,将虚拟世界的操作与现实生活中的行为深度融合。同时,该团队也在不断扩充新的手势定义以及自定义手势的接口,以便用户能以更多丰富且自然个性的方式,与虚拟世界中的物体进行沉浸式交互。

三、TrueToF Neural Gesture的特点

TrueToF Neural Gesture能够为用户带来一种自由、高精度、低延时的交互体验,源于其技术的多方面优势:

1. 无束缚:TrueToF Neural Gesture为AR设备提供物理手柄替代方案,用户可通过自然手势控制数字环境,提高便捷性和实用性。

2. 低功耗:基于Qualcomm平台,千次AI推理功耗仅为1.53 mWh,实现高性能手势识别的同时,也可有效延长消费电子产品的使用时间。

3. 高精度:基于AI技术重构的ToF成像流程,空间定位误差<1mm,保证XYZ三轴<1mm精确度,可为终端应用提供准确交互数据支撑。

4. 3D可度量:TrueToF Neural Gesture AI模型基于3D数据库训练,实现手部关节XYZ三轴0.5°旋转精度度量,适应第一视角应用场景,可克服传感观测视角约束。

5. 低延时:采用Hexagon DSP优化的<12ms的AI推理模型,保障实时交互需求,可应对高速动作和复杂场景。

四、TrueToF Neural Gesture Benchmark

4.1 暗光测试:

暗光测试是在较暗环境中对手势识别技术的性能进行评估。传统的RGB手势识别方案的性能在这种环境下往往会受到较大影响。得益于优秀的TrueToF Neural IP信号成像能力,TrueToF Neural Gesture技术在暗光环境下表现出较高的稳定性,对各类复杂室内光线条件不敏感,这不仅有助于提高手势识别精度,还可增强对光线变化环境下使用的鲁棒性。

14b47e70-dc86-11ed-bfe3-dac502259ad0.png

TrueToF Neural Gesture的不同光照表现

4.2 室外评测:

室外场景的光线条件更加复杂多变,包括强光、阴影等多种不可控因素。TrueToF Neural Gesture技术在室外评测中同样表现出较高的稳定性和鲁棒性,能够保证户外环境下的高精度的手势识别需求。

14bff19c-dc86-11ed-bfe3-dac502259ad0.png

TrueToF Neural Gesture室外场景表现

通过暗光测试与室外评测可以看出,TrueToF Neural Gesture在不同光照条件下均表现出优越性能,表明其在各种非限定光照条件的应用场景中能够提供鲁棒、高效的手势识别,可为用户带来优质、稳定且流畅的交互体验。

五、应用场景与未来展望

下一步,TrueToF Neural Gesture技术将不断优化和创新迭代,努力提升手势估计与识别的适配性及稳定性,同时引入更多AI算法不断提高手部关节识别的精度和语义识别。HKSC相信3D语义等技术创新将持续为XR、Metaverse、AIGC、Autonomous driving等更多场景提供基础应用支撑,TrueToF Neural Gesture技术也将在更广泛的数字信息领域发挥潜力,为用户带来更加智能、便捷的生活体验。






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 控制器
    +关注

    关注

    112

    文章

    16370

    浏览量

    178141
  • RGB
    RGB
    +关注

    关注

    4

    文章

    798

    浏览量

    58513
  • 传感技术
    +关注

    关注

    4

    文章

    530

    浏览量

    46315
  • TOF
    TOF
    +关注

    关注

    9

    文章

    484

    浏览量

    36355

原文标题:摆脱手柄束缚:ToF传感技术让XR交互更自由

文章出处:【微信号:MEMSensor,微信公众号:MEMS】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    舵机技术新突破,无线控制自由

    革新。本文将带您深入探索新一代无线舵机的技术奥秘,揭秘其如何实现自由、更精准的控制。 无线技术的深度融合:简化与自由的双重奏 传统舵机依赖
    的头像 发表于 11-22 15:01 208次阅读

    智能马桶脚感方案 TOF传感器选型推荐

    目前正在开发一个智能马桶脚感方案,TOF传感器选型遇到难题了,要么成本高,要么技术难啃,有没有技术大神可以帮助下啊。
    发表于 11-22 09:37

    如何打开XR的三个“枷锁”

    如果有一个科技产品,科技从业者们又爱又恨的话,XR(虚拟现实VR、增强现实AR和混合现实MR)可以当之无愧地排在第一。爱的是,XR直击人类的信息需求。人类获取的信息中85%是通过视觉,改变视觉
    的头像 发表于 09-29 08:01 645次阅读
    如何打开<b class='flag-5'>XR</b>的三个“枷锁”

    XR虚拟拍摄解决方案 秀狐XR虚拟拍摄技术

    XR虚拟拍摄是指利用扩展现实(Extended Reality)技术进行影视制作。扩展现实是一种整合了虚拟现实(VR)和增强现实(AR)的技术,可以将虚拟元素与真实世界进行交互和叠加
    的头像 发表于 09-10 14:18 349次阅读
    <b class='flag-5'>XR</b>虚拟拍摄解决方案  秀狐<b class='flag-5'>XR</b>虚拟拍摄<b class='flag-5'>技术</b>

    ToF技术应用发展方向

    ToF技术在消费电子、机器人、安防监控等领域有广泛应用前景。d-ToF在功耗、距离等方面有优势,但产业链尚不成熟;i-ToF虽工艺成熟但效果不完美。随着
    的头像 发表于 07-24 09:18 439次阅读

    基于传感器的人机交互技术

    基于传感器的人机交互技术是现代科技发展的重要领域之一,它极大地推动了人机交互的便捷性、自然性和智能性。本文将详细探讨基于传感器的人机
    的头像 发表于 07-17 16:52 816次阅读

    XR与AR和VR的区别是什么

    、触觉等感官信息,增强用户对现实世界的感知。XR技术可以用户在现实世界中看到虚拟物体,或者在虚拟环境中感
    的头像 发表于 07-08 09:43 5696次阅读

    小个头大技术XR设备上的图像传感

    电子发烧友网报道(文/周凯扬)对于现如今的XR设备来说,图像传感器已经成了绕不过的设计话题。为了提供更好的交互体验,苹果的Vision Pro就搭载了丰富的传感器,共有14个摄像头,包
    的头像 发表于 06-04 00:15 2619次阅读

    **十万级口语识别,离线自然说技术智能照明懂你**

    自然说技术,用户不用死记硬背,提供了自然、更灵活、智能的语音交互方式。 方案框图 在方案设计上,启英泰伦充分考虑了产品功能、复杂程度和制造成本等因素。通过将语音芯片作为主控,内置在
    发表于 04-29 17:09

    英飞凌与欧菲光大话ToF成像解决方案

    飞行时间(ToF)是一种基于时间测量原理的传感技术ToF技术已经发展良久,近年来更是不断推陈出新,性能得到极大提升。
    的头像 发表于 02-26 09:26 725次阅读

    多区飞行时间(ToF)传感器的特点

    ‍‍‍‍‍‍‍‍ VL53L5、VL53L7、VL53L8都是基于ST的FlightSense技术的多区飞行时间(ToF传感器。
    的头像 发表于 02-25 09:41 1155次阅读
    多区飞行时间(<b class='flag-5'>ToF</b>)<b class='flag-5'>传感</b>器的特点

    混合ToF弥补单一ToF不足实现全面深度传感

    电子发烧友网报道(文/李宁远)ToF,广为人知的传感技术,已经在各个领域中应用得十分广泛。ToF的测距原理其实并不复杂,通过给目标连续发送光信号或脉冲,然后用
    的头像 发表于 02-20 01:12 2786次阅读

    虹软空间计算技术推动XR领域发展

    在过去的二十年中,移动计算技术的迅猛发展使智能手机崭露头角,成为主流的移动智能终端。虽然科技不断进步,智能手机所面临的可视空间受限、交互单一等局限问题仍待突破。随着传感技术的提升、空
    的头像 发表于 01-26 10:15 712次阅读

    基于Crazyflie和TOF传感器的自旋停效果实现

    今天小编给大家带来的是新加坡的Maker Chathuranga Liyanage使用TOF传感Crazyflie实现高度自保持的项目。
    的头像 发表于 01-25 18:20 2604次阅读
    基于Crazyflie和<b class='flag-5'>TOF</b><b class='flag-5'>传感</b>器的自旋停效果实现

    设备聪明 |启英泰伦离线自然说,开启智能语音交互新体验!

    启英泰伦新推出「离线自然说」——一种轻量级的离线NLP技术。通过该技术,语音芯片可支持数万条离线词条,泛化能力强,几乎可涵盖用户日常所有说话习惯,可以为用户提供自然、丰富、更灵活的
    的头像 发表于 01-04 11:24 812次阅读
    <b class='flag-5'>让</b>设备<b class='flag-5'>更</b>聪明 |启英泰伦离线自然说,开启智能语音<b class='flag-5'>交互</b>新体验!