0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于单帧图像,云从科技3D人体技术创造最新世界纪录

电子工程师 来源:lp 2019-03-21 09:25 次阅读

3 月 19 日,根据官方消息,云从科技基于单帧图像的 3D 人体重建技术同时在 Human3.6M、Surreal 和 UP-3D 三大数据集上创造了最新的世界纪录,将原有最低误差记录大幅降低 30%。

Human3.6M 数据集上对比

Surreal 数据集上对比

UP-3D 数据集上对比

3D 重建领域通常以误差(Error)作为衡量算法能力的主要指标,误差就是生成模型与实际图像的差别。一般来说,误差越低,精度越高,意味着技术的性能越好。

云从称,其 3D 人体重建技术全身精度误差(Surface Error)在 Surreal 上从 75.4 毫米降低到 52.7 毫米,关节精度误差(3D Joint Error)从 55.8 毫米降低到 40.1 毫米,Human3.6M 上的关节精度误差(3D Joint Error)从 59.9 毫米降低到 46.7 毫米,技术的执行速度从之前的上百毫秒降低到仅需 5 毫秒。

与传统关键点检测、3D 重建的区别是什么?

传统的人体关键点检测技术往往以 2D 的人体骨骼关节点检测形式出现,即通过技术预测 RGB 图像中人体的十几个关节点的坐标,一方面结果非常稀疏,将人体大为简化成骨骼的形式,另一方面结果往往只包含二维平面上的坐标预测,不能还原深度信息,因此无法体现纵深的感觉。

而基于单帧图像的 3D 重建技术不仅能输出骨骼关节点信息,更能同时预测大量的人体表面关键点信息,预测结果更加丰富,而且每个点的坐标都是 3D 的,能够体现不同躯干的纵深信息。

3D 关键点检测

传统 3D 重建技术大多需要连续的图像序列或是多视角的图像,在硬件设备上一般需要采用双目摄像机或者结构光摄像机等设备,因此在手机等便携设备上往往难以实现;另一方面,专用设备还会增加部署成本,增加大规模普及 3D 重建技术的难度。

上述突破是如何实现的?

据悉,该论文对人体具有丰富多样的姿态和穿着的特点,提出了一套全新的基于人体 3D 纵深预测的 3D 信息表征方式。通过对三原色图像(RGB,不含深度信息)的分析,预测人体的 3D 形态和姿势,并用 6 万多个点完整描绘人体,从而在人体重建技术上取得速度与精度的双突破,呈现出来的模型更精细,帧率高达到 200fps,原本由于受实时显示限制而无法实现的应用可以一一实现。

不过,基于单帧图像的 3D 重建技术对原始图像的需求放松的同时,对背后的技术提出了更难的挑战:技术需要从单帧图像中推理出人体或人脸的 3D 形态,并通过光学透视、阴影叠加等基本光学原则准确预测出各个关键点在 3D 空间的位置和朝向,从而得到人体的姿态或表情信息。

可探索的技术应用方向

人体姿态和服饰复杂多样,精度提升意味着对复杂场景的适应性更好,模型更接近真实的情况。如《阿凡达》、《阿丽塔》、漫威系列等电影中,都需要专用特效设备与面部贴点来完成精细的人像采集,基于单帧图像的 3D 人体 / 人脸重建技术,意味着可能颠覆电影视频的拍摄制作,同时降低工业级 3D 动画合成的门槛。

由于对输入图像的要求低,使 3D 重建技术将可以利用普通光学摄像头作为感知设备。例如,该技术将会使美颜 App 无需结构光摄像头也能具备高精准度的瘦身与动画合成功能。

目前,这项技术可通过重要人员影像重建、医疗仿真肢体打印、虚拟试衣、美颜化妆、表情姿态动画合成等应用场景在大型商场、直播平台、美颜软件、影视特效制作等行业普及。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2864

    浏览量

    107361
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24653
  • 云从科技
    +关注

    关注

    1

    文章

    67

    浏览量

    9687

原文标题:云从科技3D人体重建技术刷新3项纪录!仅凭照片即可生成精细模型

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    天合光能TOPCon太阳电池效率达到26.58%

    近日,天合光能股份有限公司宣布其光伏科学与技术全国重点实验室自主研发的高效n型双面i-TOPCon电池,经德国哈梅林太阳能研究所(ISFH)下属的检测实验室认证,最高电池效率达到26.58%,创造了TOPCon太阳电池效率新的世界纪录
    的头像 发表于 11-25 11:37 222次阅读

    3D扫描技术医疗领域创新实践,积木易搭3D扫描仪Mole助力定制个性化手臂康复辅具

    1、“3D扫描+3D打印”技术为矫形修复、医疗辅助器具定制等领域带来突破性创新 近年来,随着AI、大数据、3D扫描、3D打印、
    的头像 发表于 10-31 11:25 186次阅读
    <b class='flag-5'>3D</b>扫描<b class='flag-5'>技术</b>医疗领域创新实践,积木易搭<b class='flag-5'>3D</b>扫描仪Mole助力定制个性化手臂康复辅具

    天合光能n型TOPCon太阳电池效率达到25.9%

    今日,位于天合光能的光伏科学与技术全国重点实验室宣布,其自主研发的高效N型i-TOPCon电池,经德国哈梅林太阳能研究所(ISFH)下属的检测实验室认证,最高电池效率达到25.9%,创造了大面积产业化n型单晶硅TOPCon电池效率新的
    的头像 发表于 10-21 09:11 318次阅读

    裸眼3D笔记本电脑——先进的光场裸眼3D技术

    效果的用户,这款笔记本电脑都能满足你的需求。 一、卓越的3D模型设计能力 英伦科技裸眼3D笔记本电脑采用最新的光场裸眼3D技术,使用户无需佩戴3D
    的头像 发表于 07-16 10:04 471次阅读

    VIVERSE 推行实时3D渲染: 探索Polygon Streaming技术力量与应用

    Streaming 3D 串流技术。 Polygon Streaming 3D 串流技术,支持高保真3D模型分享与协作,跨平台兼容,可以提
    的头像 发表于 05-31 15:49 2307次阅读
    VIVERSE 推行实时<b class='flag-5'>3D</b>渲染: 探索Polygon Streaming<b class='flag-5'>技术</b>力量与应用

    什么是光场裸眼3D

    光场裸眼3D技术,是一种无需任何辅助设备(如3D眼镜或头显)即可产生真实三维效果的技术。它通过特殊的显示设备,精确控制光线的方向和强度,使观察者在不同的角度都能看到清晰、连续的立体
    的头像 发表于 05-27 14:21 985次阅读
    什么是光场裸眼<b class='flag-5'>3D</b>?

    740.6W!天合光能打破N型i-TOPCon组件输出功率世界纪录

    近日,天合光能光伏科学与技术全国重点实验室宣布, 其自主研发的210+N型i-TOPCon光伏组件,经权威第三方检测认证机构TÜV南德认证,最高输出功率达740.6W,创造了新的世界纪录! 这也是天
    的头像 发表于 04-23 09:28 722次阅读

    多尺度浸入式3D打印策略,用于人体组织和器官的精准制造

    生物3D打印技术被认为是实现复杂人体组织和器官构建的最有前景的技术方案之一。近年来,浸入式墨水书写技术作为生物
    的头像 发表于 04-20 11:43 897次阅读

    NVIDIA路径优化引擎创下23项世界纪录

    NVIDIA cuOpt 不仅在过去三年中所有的大型路径规划基准测试中均名列榜首,还创下了二十多项世界纪录。这意味着该路径优化引擎能够使各行各业采取节约成本的高效措施。
    的头像 发表于 03-21 09:47 362次阅读

    ROG助力i9-14900KS达到9117.75 MHz,创下四项世界纪录

    近日,据 ROG 玩家国度官方微博透露,ROG MAXIMUS Z790 APEX ENCORE 助力 i9-14900KS 刷新至 9117.75 MHz,创造四项世界纪录(CPU 频率、SUPERPI 1M、PIFAST、PYPRIME 32B)。
    的头像 发表于 03-15 11:40 662次阅读

    基于深度学习的方法在处理3D进行缺陷分类应用

    背景部分介绍了3D应用领域中公开可访问的数据集的重要性,这些数据集对于分析和比较各种模型至关重要。研究人员专门设计了各种数据集,包括用于3D形状分类、3D物体检测和
    的头像 发表于 02-22 16:16 1041次阅读
    基于深度学习的方法在处理<b class='flag-5'>3D</b>点<b class='flag-5'>云</b>进行缺陷分类应用

    Adobe提出DMV3D3D生成只需30秒!让文本、图像都动起来的新方法!

    因此,本文研究者的目标是实现快速、逼真和通用的 3D 生成。为此,他们提出了 DMV3D。DMV3D 是一种全新的阶段的全类别扩散模型,能直接根据模型文字或单张图片的输入,生成
    的头像 发表于 01-30 16:20 820次阅读
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!让文本、<b class='flag-5'>图像</b>都动起来的新方法!

    基于3D的多任务模型在板端实现高效部署

    对于自动驾驶应用来说,3D 场景感知至关重要。3D数据就是具有3D特征的数据。一方面,3D
    的头像 发表于 12-28 16:35 1418次阅读
    基于<b class='flag-5'>3D</b>点<b class='flag-5'>云</b>的多任务模型在板端实现高效部署

    3D人体生成模型HumanGaussian实现原理

    3D 生成领域,根据文本提示创建高质量的 3D 人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D
    的头像 发表于 12-20 16:37 1547次阅读
    <b class='flag-5'>3D</b><b class='flag-5'>人体</b>生成模型HumanGaussian实现原理

    使用Python2D图像进行3D重建过程详解

    有许多不同的方法和算法可用于2D图像执行3D重建。选择的方法取决于诸如输入图像的质量、摄像机校准信息的可用性以及重建的期望准确性和速度等因
    的头像 发表于 12-05 14:07 2866次阅读
    使用Python<b class='flag-5'>从</b>2<b class='flag-5'>D</b><b class='flag-5'>图像</b>进行<b class='flag-5'>3D</b>重建过程详解