0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中英科学家提出了首个全自动3D模型变形传播方法

DPVg_AI_era 来源:lq 2018-12-12 09:28 次阅读

在近期举行的SIGGRAPH ASIA 2018大会上,中英科学家提出了首个全自动3D模型变形传播方法,不需要配对训练数据,也无需任何手工调整,自动将物体A的形变传播到物体B上,效果自然,解决了真实应用场景中配对模型数据少的老大难。

还记得黄教主的那段炫酷舞蹈吗,和迈克尔·杰克逊一样舞出太空步!

当然,教主没有真的在跳舞,只是录了一段普通的视频。有算法将迈克尔·杰克逊源视频中的“舞姿”识别出来,再将相关的肢体动作投射到教主身上,这样,就得到了右边的魔性视频。

这样的算法属于模型变形传播方法。传统上讲,要实现这样的转换,需要在源-目标模型对的模型上手工标注关键对应点,或是需要成对的模型输入用以训练转换算法。

然而,手工标注费时费力,而且在真实应用场景中,也难以能找到成对匹配的两种模型库。

为了解决这个问题,中科院计算所、卡迪夫大学和浙江大学的研究人员合作,提出了一种全新的3D模型变形传播方法,可以全自动地将一个人体的3D模型运动序列传播到另一个机器人的运动序列上(如下图一所示),这中间不需要任何的手工交互。图二展示了一个手的运动自动驱动牛仔裤运动的效果。

图一:运动人体到机器人模型的自动变形传播与模型合成

图二:通过手势运动自动驱动牛仔裤运动

研究人员在日前于日本东京举行的计算机图形学顶会SIGGRAPH ASIA 2018展示了他们的研究成果。本届SIGGRAPH ASIA 2018有超过一万人参会,包括学者、工程师、艺术家和学生等。相关研究论文“Automatic Unpaired Shape Deformation Transfer”,被期刊ACM Transactions on Graphics(中科院JCR分区Q1区)收录。

研究人员表示,“这项工作提出了第一个全自动的、不需要成对模型训练的模型自动变形传播算法。”

现实世界中广泛存在的“模仿”行为,在某种意义上就是变形传播。例如,人想模仿丹顶鹤走路的样子,人会先观察自身和丹顶鹤的各种动作,推断两种生物做动作的特点,思考人和鹤之间相似之处,最后推断出人如何能做出最像丹顶鹤的动作。

基于这一思考,研究人员提出了一种新的深度学习模型VAE-Cycle GAN(简称VC-GAN)来完成自动变形传播任务。相对于图像,三维网格模型是更不规则的数据结构,该方法通过一种可以表示大尺度三维模型变形的ACAP特征对三维模型进行特征提取,之后在此特征上用VAE降维,用以更紧凑地表示三维模型。

图三:VAE-Cycle GAN (VC-GAN)的网络结构图示

VC-GAN的网络模型则如上图三所示:它首先对输入的3D模型计算了适用于处理大幅度变形的ACAP 变形特征表示;然后,通过一个作用于3D网格结构上的变分自编码器(VAE)网络,将源模型和目标模型的特征表示分布映射到低维隐含层空间上,再使用Cycle-GAN来学习出两个模型隐含层之间的对应映射;最后,作者引入了光场距离(lightfield distance)来确保生成的目标模型和源模型尽可能相似,由于光场距离的计算并不可导,他们还设计了一个网络simNet来回归该光场距离。

与具有规则定义域的2D图像不同,3D模型缺乏规则的定义域,同时源模型和目标模型之间缺乏对应关系,这使得基于GAN的网络难以直接应用,而基于体素的3D-GAN又难以生成具有高精细度的三维模型,VC-GAN的引入解决了这些问题。

基于三维网格数据的VAE网络将三维模型的变形规律映射到一个规则的隐空间,并通过上述VC-GAN来建立隐空间上的映射关系,进而可以进行全自动变形传播,同时基于ACAP特征的VAE的引入,也使得生成的三维模型具有更好的细节和更加真实的效果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28455

    浏览量

    207269
  • 3D模型
    +关注

    关注

    1

    文章

    72

    浏览量

    15734

原文标题:中科院计算所、浙大等提出首个全自动3D模型变形传播法,无需配对训练数据

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    安宝特产品 安宝特3D Analyzer:智能的3D CAD高级分析工具

    安宝特3D Analyzer包含多种实用的3D CAD高级分析工具,包括自动比对模型、碰撞检测、间隙检查、壁厚检查,以及拔模和底切分析,能够有效提升
    的头像 发表于 08-07 10:13 389次阅读
    安宝特产品  安宝特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高级分析工具

    欢创播报 腾讯元宝首发3D生成应用

    1 腾讯元宝首发3D生成应用 只需一张照片,便能迅速打造独一无二的3D角色。7月16日,腾讯旗下大模型应用“腾讯元宝”上线了“3D角色梦工厂”玩法,腾讯元宝也是
    的头像 发表于 07-18 11:39 759次阅读
    欢创播报 腾讯元宝首发<b class='flag-5'>3D</b>生成应用

    裸眼3D笔记本电脑——先进的光场裸眼3D技术

    随着科技的不断进步,裸眼3D技术已经不再是科幻电影中的幻想。如今,英伦科技裸眼3D笔记本电脑将这一前沿科技带到了我们的日常生活中。无论你是专业的3D模型设计师,还是希望在视频播放和
    的头像 发表于 07-16 10:04 559次阅读

    UltiMaker正式推出了工业级3D打印机—UltiMaker Factor 4

    与之前的UltiMaker S系列桌面3D打印机不同,全球3D打印领域的领导者UltiMaker正式推出了工业级3D打印机——UltiMaker Factor 4。
    的头像 发表于 05-09 16:58 571次阅读

    ad19中3d模型不显示?

    封装库导入3d模型不显示,但导入3d模型后的封装库生成pcb文件时显示3d模型,这是什么原因导致
    发表于 04-24 13:41

    解决方案|基于3D视觉技术的铝合金板件刷油烘干自动化上下料

    针对铝合金板件刷油烘干上下料过程中的自动化需求,我们提出了一套基于3D视觉引导的解决方案。该方案通过引入先进的3D视觉技术,实现了对板件的高精度识别和定位,从而提高了生产效率和质量稳定
    的头像 发表于 04-20 17:45 338次阅读
    解决方案|基于<b class='flag-5'>3D</b>视觉技术的铝合金板件刷油烘干<b class='flag-5'>自动</b>化上下料

    包含具有多种类型信息的3D模型

    、安全和高效的建筑系统,让居住者能够拥有可持续、弹性舒适且符合人体工程学的建筑。建筑信息模型 (BIM) 是建筑工程师在建筑物和其他结构设计中使用的一种3D建模过程。BIM软件提供了一个基于模型
    发表于 03-28 17:18

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此模型具备从单张图像
    的头像 发表于 03-22 10:30 862次阅读

    Nullmax提出多相机3D目标检测新方法QAF2D

    今天上午,计算机视觉领域顶会CVPR公布了最终的论文接收结果,Nullmax感知部门的3D目标检测研究《Enhancing 3D Object Detection with 2D Detection-Guided Query A
    的头像 发表于 02-27 16:38 1152次阅读
    Nullmax<b class='flag-5'>提出</b>多相机<b class='flag-5'>3D</b>目标检测新<b class='flag-5'>方法</b>QAF2<b class='flag-5'>D</b>

    基于深度学习的方法在处理3D点云进行缺陷分类应用

    背景部分介绍了3D点云应用领域中公开可访问的数据集的重要性,这些数据集对于分析和比较各种模型至关重要。研究人员专门设计了各种数据集,包括用于3D形状分类、3D物体检测和
    的头像 发表于 02-22 16:16 1188次阅读
    基于深度学习的<b class='flag-5'>方法</b>在处理<b class='flag-5'>3D</b>点云进行缺陷分类应用

    Adobe提出DMV3D3D生成只需30秒!让文本、图像都动起来的新方法

    因此,本文研究者的目标是实现快速、逼真和通用的 3D 生成。为此,他们提出了 DMV3D。DMV3D 是一种全新的单阶段的全类别扩散模型,能
    的头像 发表于 01-30 16:20 872次阅读
    Adobe<b class='flag-5'>提出</b>DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!让文本、图像都动起来的新<b class='flag-5'>方法</b>!

    高分工作!Uni3D3D基础大模型,刷新多个SOTA!

    我们主要探索了3D视觉中scale up模型参数量和统一模型架构的可能性。在NLP / 2D vision领域,scale up大模型(GP
    的头像 发表于 01-30 15:56 895次阅读
    高分工作!Uni<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>基础大<b class='flag-5'>模型</b>,刷新多个SOTA!

    3D视觉引导3C薄片自动化上料

    3D视觉引导3C薄片自动化上料 在当今高度自动化的制造环境中,精确、高效地处理薄片类零件至关重要。特别是在3C行业,如手机、电脑等产品的制
    的头像 发表于 01-30 11:13 539次阅读
    <b class='flag-5'>3D</b>视觉引导<b class='flag-5'>3</b>C薄片<b class='flag-5'>自动</b>化上料

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 504次阅读

    如何搞定自动驾驶3D目标检测!

    可用于自动驾驶场景下基于图像的3D目标检测的数据集总结。其中一些数据集包括多个任务,这里只报告了3D检测基准(例如KITTI 3D发布了超过40K的图像,其中约15K用于
    发表于 01-05 10:43 590次阅读
    如何搞定<b class='flag-5'>自动</b>驾驶<b class='flag-5'>3D</b>目标检测!