0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一探究竟视觉学习、图形摄影、人类感知、立体三维以及识别等各个领域

nlfO_thejiangme 来源:未知 作者:李倩 2018-09-04 08:58 次阅读

计算机视觉三大会议之一的ECCV 2018将于9月8号到14号在德国慕尼黑召开!本次会议共接收论文779篇,同时在会议上将举行11场tutorials和43场各个领域的workshops。同时优秀的论文还将在会议上进行口头报告,在四天的会议日程中将会有59个orals报告覆盖了从视觉学习、图形摄影、人类感知、立体三维以及识别等各个领域。我们先来一探究竟吧!

根据网站上公布的论文题目,可以看到今年的研究热点依然围绕学习、网络等研究方式展开,但同时,检测、可视化和视觉方面的研究也占有重要的位置。接下来我们就提前来看看ECCV将为我们带来哪些精彩的研究前沿吧!

Oral

今年ECCV的主论坛将12个不同主题的分论坛分别安排到了10-13号四天的会议时间中,主要包括了视觉学习、计算摄影学、人类分析和感知、三维重建、优化与识别等领域。

在视觉学习方向,有来自Facebook的Yuxin Wu和Kaiming提出的Group Normalization来解决Batch Normalizaiton存在的问题,将不同的通道分组归一化实现了优异的表现。

还有来自爱丁堡大学和日本理化研究所的研究人员提出的深度匹配自编码器,用于从非配对多模态数据中学习出共有的隐含空间。

同时来自约翰霍普金斯大学、斯坦福大学和谷歌联合研究的渐进式神经架构搜索,用于学习神经网络的结构。通过基于序列模型的优化策略实现了高于强化学习和进化算法近五倍的效率和8倍的总体计算提升。并在CIFAR-10和ImageNet上取得了很高的精度。

值得一提的是,除了来自于霍普金斯的刘晨曦和谷歌的Zoph外,论文作者还包括李飞飞和李佳等。据报道这篇文章与Neural Architecture Search with Reinforcement Learning和Large Scale Evolution of Image Classifiers等技术一起支撑了谷歌AutoML的发展。

在计算摄影学方向,包括了从点光源、光场、可编程器件等研究热点。

来自慕尼黑工大的研究人员利用相机卷帘快门的特性优化了直接稀疏里程计的后端,实现了近实时的准确VO方法。

来自海德堡大学的研究人员提出了一种基于style-aware content的损失函数并联合自编码器训练出了实时高分辨率的风格迁移模型。使得生产的图像包含了更多更自然的美感。

来自圣迭戈分校和Adobe的研究人员提出了一种利用单张手机照片获取不同材料表面变化的双边反射率函数,通过神经网络实现了对于SVBRDF的估计,为光度渲染带来了新的可能。

在人类行为分析与感知包括了人体及各部分的姿态估计、人脸人手追踪、行人识别、行为预测等方面。

来自布里斯托、卡塔尼亚和多伦多大学的研究人员们给出了一个用于研究人类行为习惯的第一人称数据库EPIC-KITCHENS,这一数据库记录了来自多个国家的参与者在厨房中的第一人称视角,包含了1150万帧图像和3.96万个动作分割与45.34万个bbox。这一数据集将用于第一人称的物体检测、行为识别和行为预测中去。

同样来自湖南大学和东京大学的研究人员提出了从第一人称视角来预测凝视注意力的模型。

来自中山大学、商汤和视源的研究人员们提出了一种通过部分xx网络实现了实例人体分析,通过将实例人体解析任务分解成语义分割和基于边缘检测将语义部件归并到确定人物身上的两个子任务来实现。

来自伯克利的研究人员提出了一种联合视频中图像和声音信息的网络用于融合多传感器的表达,利用自监督的方式训练出了一种可以预测视频帧和音频是否对齐的神经网络,并可用于视频声源定位、音-视识别和音轨分离等任务。

萨里大学和adobe的研究人员通过训练对称的卷积自编码器来学习出骨架关节位置的编码和身体的体积表示。能够准确恢复出关节位置的3D估计。

来自洛桑理工的研究人员也提出了一种非监督的3D人体姿态估计模型,通过自编码器可以从单一视角的图像预测另一个视角。由于它编码了3D几何表示,研究人员还将它用于半监督学习映射人体姿态。

在立体视觉三维重建方面,主要研究集中在几何、立体视觉和深度推理等方面。

来自香港科技大学的研究人员提出了利用非结构化的图像作为输入,端到端地推算出参考图像的深图信息。其提出的NVSNet将相机参数编码为可微单应性变换来得到视椎体损失体积,建立起了2D特征抽取和3D损失正则化之间的关系。最终通过3D卷积来对初始点云规则化和回归来得到最终的输出结果。

为了解决点云预测中点的位置与物体全局几何形状不匹配的问题的问题,港中文提出了几何对抗损失优化单视角下点云的全局三维重建。利用多视角几何损失和条件对抗损失来对网络进行训练。

多视角几何损失使得网络学习重建多视角下有效的3D模型,而条件对抗损失则保证重建的3D物体符合普通图片中的语义信息。

除此之外还包括了普林斯顿的共面匹配方法、普林斯顿与谷歌共同完成的主动立体视觉网络以及慕尼黑工大提出的基于深度预测的单目稀疏直接里程计等研究工作。

在匹配与识别方面涵盖了目标检测、定位、纹理和位置精炼等方面的研究。

来自密歇根大学的研究人员提出了一种基于关键点对儿的目标检测方法CornerNet。它将目标检测任务转换为利用单个神经网络对bbox左上和右下角的检测。这种方法消除了对于锚框的依赖。并提出了一种称为角点pooling的层来提高对角点的定位能力。最终在COCO上达到了42.1%的mAP.

来自清华北大、旷视和头条的研究人员提出了一种目标检测中描述框定位置信度的方法IoU-Net,并利用定位置信度来改善目标检测中非极大值抑制,以产生更精确的预测框。同时提出了基于优化的框提炼方法。

来自以色列理工学院的研究人员提出了一种基于上下文损失的图像迁移方法,适用于非对齐的数据。这种模型基于上下文和语义来定义损失。这一模型在卡通图像模拟、语义风格迁移和领域迁移中都表现除了很好的效果。

Tutorials

本届ECCV的tutorials同样是涉及了视觉领域各个方面的前沿内容,从对抗学习到3D重建,从行人识别到目标检测。一定能找到一个你需要的教程来深入学习。其中有Kaiming,rbg和Gkioxari等大神带来的视觉识别及其未来的系列教程。

还有神经网络训练中归一化方法的理论与实践、特征与学习的视觉定位。

还包括行人重识别的表达学习和基于步态&面部分析的识别方法。此外还包括快速三维感知重建和理解的tutorial。

更多内容请参阅,某些教程目前已经开放相关资料下载了:

https://eccv2018.org/program/workshops_tutorials/

Workshop

最后我们来概览一番每次会议都必不可少的workshops。本届ECCV包括了43个workshops,其中包含了11个各领域的挑战赛。值得一提的是,很多来自中国的队伍在很多挑战赛中都取得了不错的成绩。

今年的workshops 主要集中于识别、检测、自动机器(自动驾驶无人机机器人等)、人类理解分析、三维重建理解、几何/表示学习和早期视觉等领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3562

    浏览量

    133904
  • 神经网络
    +关注

    关注

    42

    文章

    4732

    浏览量

    100373
  • 计算机视觉
    +关注

    关注

    8

    文章

    1694

    浏览量

    45889

原文标题:计算机视觉三大会议之——ECCV 2018 观看指南(含大量剧透+传送门)

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于安芯号SLH89F5162的真三维立体图形显示

    。LED点阵将需要显示的立体图像投影到高速旋转平面镜上,通过适当调节电机转速、合理控制LED灯有规律的亮灭和人眼视觉暂留特性实现360度视场三维立体图形显示。该装置可在全空间的
    发表于 10-19 15:16

    双目立体视觉原理大揭秘(二)

    `双目立体视觉原理大揭秘(二)——三维重构双目立体视觉门有着广阔应用前景的学科,根据双目立体视觉CCAS提供的思路及组成原理,随着光学、
    发表于 11-21 16:22

    基于立体视觉的变形测量

    ,快速、精确的获得被测对象的全场位移应变信息,在各个研究领域得到了广泛应用。 立体视觉是由多幅图像获取物体三维几何信息的方法。双目立体视觉
    发表于 09-21 10:11

    双目立体视觉的运用

    物体的三维模型,其效果也更生动逼真,又如文物保护上,因其贵重不宜直接接触,使用双目立体视觉测量既能得到三维图像、尺寸大小,又不会对文物产生破坏。 此外,技术人员还开发了款在测量应用
    发表于 03-03 09:36

    基于STM32的三维旋转显示平台设计(立体成像)!!!

    `现实的世界是个拥有宽度、高度和深度的三维立体世界。在平面二显示技术已经成熟的今天,三维立体
    发表于 08-27 14:59

    三维立体数字沙盘是是什么?

    `  那什么是三维立体数字沙盘呢?三维立体数字沙盘又叫三维数字沙盘、立体数字沙盘,是利用
    发表于 08-28 14:40

    三维可视化的应用和优势

    三维动画、以及计算机程控技术与实体模型进行融合,实现对设备运行的检测与模拟,使得管理者对于其所管理设备的外观形象、所处位置、运行参数目了然,可以很大程度上减少管理者的劳动强度,进而提高管理效率和水平
    发表于 12-02 11:52

    三维立体视觉技术的应用及其三维恢复方法介绍

    感知与建模、机器人导航、双目物体跟踪与检测以及图像分割领域三维立体视觉就是研究由2D图像恢
    发表于 10-20 11:51 5次下载

    基于双目立体视觉三维拼接和融合方法

    目前,在计算机视觉领域,越来越多的高精度三维重建方法以及实时定位和地图构建(SLAM)算法正在被提出用来对三维世界进行描述和分析。在计算机
    发表于 11-03 16:46 5次下载
    基于双目<b class='flag-5'>立体视觉</b>的<b class='flag-5'>三维</b>拼接和融合方法

    三维图形引擎综述

    虚拟现实是近年来出现的高新前沿技术,利用电脑高速计算,模拟产生个虚拟的三维空间,让使用者拥有视觉、听觉、触觉感官的模拟,如同亲历其境
    发表于 12-11 17:14 1次下载
    <b class='flag-5'>三维图形</b>引擎综述

    双目立体视觉三维测量原理

    双目立体视觉是基于视差,由角法原理进行三维信息的获取,即由两个摄像机的图像平面和北侧物体之间构成角形。
    的头像 发表于 04-11 14:32 2.4w次阅读
    双目<b class='flag-5'>立体视觉</b><b class='flag-5'>三维</b>测量原理

    的卢深视:三维视觉领域要与产业上下游积极协作

    作为三维视觉领域具有代表性的技术公司,的卢深视高级算法研究员崔哲发表了《从深度感知三维识别》主
    发表于 11-04 11:17 1422次阅读

    一探究竟eSIM的发展道路

    而这消息也再次引发了用户对于eSIM的讨论,目前eSIM在国内的应用状况到底怎样?大运营商在eSIM方面究竟如何布局?eSIM在国内何时才能真正进入智能手机领域?接下来,我们就来
    的头像 发表于 01-03 10:26 4166次阅读

    无人机+倾斜摄影技术在城市三维建设中的应用优势及前景

    立体图形。而随着无人机的普及以及无人机技术的创新和发展,无人机+倾斜摄影技术受到了越来越多人的关注,是目前市面上最热门的城市三维建设的研究内容,通过在无人机上搭载微型倾斜相机,从垂直、
    发表于 09-29 11:10 2746次阅读

    三维立体视觉三维恢复方法

    电子发烧友网站提供《三维立体视觉三维恢复方法.doc》资料免费下载
    发表于 11-03 09:31 0次下载
    <b class='flag-5'>三维</b><b class='flag-5'>立体视觉</b>之<b class='flag-5'>三维</b>恢复方法