0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员们提出了一系列新的点云处理模块

nlfO_thejiangme 来源:lq 2019-08-02 14:44 次阅读

点云是三维深度学习中一种重要的数据类型,研究人员们一直致力于高效准确的处理点云,并基于点云实现分类、检测和分割等一系列高级计算机视觉任务。自从PointNet以来,研究人员们提出了众多基于PointNet的模型和模型变体,极大的拓展了计算机视觉对于三维点云数据的处理能力。

但是由于点云的表示和处理方法对于计算资源的消耗使得网络模型无法加深,同时全局与局部的信息缺乏多层级地交互也限制了模型的表达能力。

为了探索这些问题的解决办法、来自伦敦大学学院的研究人员们提出了一系列新的点云处理模块,从效率、信息共享和点云卷积操作等方面进行了研究,得到了更宽、更深、更快效率更高的点云处理网络,让更深的点云深度学习模型成为可能。

与图像领域的深度学习架构相比,针对点云的处理手段还比较简单。无论是模块的多样性和网络的宽度与深度上,点云网络的架构都还有很大的发展空间。例如PointNet和PointNet++这样的模型架构随让证明了神经网络的有效性,但是对于计算资源的巨大消耗成为了制约这类架构发展的限制。

网络内部的每一个节点都需要携带所有邻域的特征使得存储资源消耗过大,过深的网络无法高效的实现。而在图像领域的发展经验表明,更深更宽的网络与模型的精度有着直接的联系。研究人员在这一工作中通过引入三方面的新结构来改善点云处理网络的精度、降低计算资源的消耗,同时提升了推理阶段的运行速度。

多分辨率

研究人员引入了多分辨率用于在多个不同的尺度上处理多尺度网络结构,大幅度降低了内存占用。在PointNet++中利用不断增加的聚类半径来对原始点云处理多尺度信息。而在这篇文章中,研究人员直接在网络早期的处理阶段使用了多个不同的聚类半径来处理,使得模型可以混合多个尺度的信息,理解多尺度上下文内容并减少计算资源的消耗。

研究人员使用了以下采样的方法来对原始点云进行处理,而后进行分组实现了不同尺度的处理。下图显示了多分辨率的处理方式不仅增加了某个点的领域感受野,同时不增加内存占用,更好的捕获全局的内容信息。

图中红色的点表示绿色点增加的感受野

点卷积模块

为了更加高效的获取邻域信息,研究人员将图像邻域信息的卷积概念延伸到了点云领域,提出了点卷积概念,在训练过程中更有效地混合邻域信息。相较于PointNet++减小了67%的内存占用,实现了41%的速度提升。其中的关键在于针对分组操作在前向传播的过程中将中间结果及时释放,利用单层神经网络大大加速了处理过程。

上面的算法显示了前向和反向传播的过程,在内存占用和速度上同时进行了优化。

卷积计算单元对于内存占用的大幅下降使得更深的网络成为可能。与先前的工作相比,这种结构的网络在深度增加时对计算资源需求增加地更为缓慢。

新的模型不仅在降低了初始化地内存需求,当层数增加时内存的增加也较为缓慢。深度翻倍时模型地高分辨和低分辨部分地仅仅增加了16.8%和2.3%。

优化信息流

为了综合各个尺度下的信息实现更有效的点云感知,研究人员对模型进行了更深入的分析和改进。首先为了保证在模型加深时网络的稳定性,研究人员在模型中添加了残差结构,在提高训练效果的同时避免了梯度消失的问题。

为了更好地利用多分辨率的信息,研究人员利用了交叉分辨率链接来为不同分辨率下的分支提供了信息沟通的渠道,使得高、中、低各个分辨率的信息得以有效在训练过程中交换,每个分辨率在专注于学习自身尺度信息的同时与其他分辨率进行信息交换,更有效地提升了训练和速度和推理地精度。

最终利用邻域卷积、多分辨率交叉互联和多分辨率点云处理等基础模块构建出了可堆叠的深度卷积点云网络。

研究人员在ShapeNet-Part,ScanNet,PartNet等数据集上对算法进行了验证,并利用平均IOU和部分IOU等指标评测了算法对于点云目标分割的表现。研究发现新提出的卷积点云处理结构对于更为复杂的数据表现更为优秀。

首先多分辨率结构为模型提供了不同尺度上的信息理解,对于不同分辨率的信息混合可以增加对于复杂数据的感知,更为关键的是在模型同时还在效率上实现了提升。在反向传播阶段时间减少了62%。

其次,交叉连接部分可以看作是不同分辨率间的信息互补,在很小的内存开销和速度延迟下,能在最复杂的PartNet数据集上实现更好的分割精度。

最后,内存高效的卷积利用单层感知机实现点云特征提取移除了中间层的激活,并利用多个相同单元进行堆叠,不仅提升了2.6~3%的IOU提升,更减小了67%的内存占用和41~68%的时间消耗。

最重要的,由于新的网络模块对于内存的消耗减少,使得更深的点云处理网络成为可能,通过残差结构和交叉互联保证了深度网络的稳定性和信息的流动过程。

下图展示了模型与PointNet++比较的一些结果,可以看到深度卷积点云网络在分割任务中的的误差更小:

基于本文提出模块重新构建的网络模型在IOU和计算资源利用率上均有大幅度提升:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模块
    +关注

    关注

    7

    文章

    2716

    浏览量

    47543
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    46023
  • 深度学习
    +关注

    关注

    73

    文章

    5504

    浏览量

    121246

原文标题:高效点云处理模块让更深的网络成为可能!

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    美国普渡大学和哈佛大学的研究人员出了项新发明 新...

    据物理学家组织网报道,美国普渡大学和哈佛大学的研究人员出了项极为应景的新发明:种外形如同颗圣诞树
    发表于 02-03 20:30

    高价收购西门子一系列型号触摸屏PLC系列模块

    \\\300\\\\400\西门子一系列模块高价收购西门子6AV 6DD 6GK 西门子一系列型号、求购模块PLC、触摸屏、伺服电机、模拟量输入、输出
    发表于 09-17 10:42

    求购新旧工控触摸屏系列模块 高价收购西门子一系列模块

    求购新旧工控触摸屏系列模块 高价收购西门子一系列模块,收价回收西门子模块,高价回收CPU模块新旧
    发表于 11-30 09:30

    世平集团所代理产线ADI针对DSC提出一系列解决方案

    世平集团所代理产线ADI针对DSC提出一系列解决方案 针对DSC的应用,提供了以下产品来满足客户的设计需求:.
    发表于 05-08 09:26 863次阅读
    世平集团所代理产线ADI针对DSC<b class='flag-5'>提出</b><b class='flag-5'>一系列</b>解决方案

    Ryzen Pro系列处理器正式发布:提供一系列的管理和安全特性

    本周,AMD正式针对企业用户发布了Ryzen Pro系列处理器。该系列处理器将与英特尔的vPro系列作为直接对手,与普通版本的Ryzen
    发表于 07-02 09:55 883次阅读

    研究人员提出了种柔性可拉伸扩展的多功能集成传感器阵列

    研究人员提出了种柔性可拉伸扩展的多功能集成传感器阵列,成功将电子皮肤的探测能力扩展到7种,实现温度、湿度、紫外光、磁、应变、压力和接近等多种外界刺激的实时同步监测。
    的头像 发表于 01-24 15:15 7253次阅读
    <b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>种柔性可拉伸扩展的多功能集成传感器阵列

    安的电子推出了一系列内嵌式微功率读写器

    广州安的电子科技有限公司是业内知名的专注于RFID设备研发、生产、销售和提供解决方案的高科技公司,该公司日前推出了一系列内嵌式微功率读写器。
    的头像 发表于 01-28 17:20 3355次阅读

    研究人员开发出触摸屏压力传感器阵列

    研究人员通过一系列测试,包括系统材料沉积,显微镜和压电表征。最终结果:在薄的可弯曲玻璃晶圆上制造的一系列可扩展,高性能和固态力传感器。
    发表于 07-29 11:09 1873次阅读

    港中文和商汤研究提出高效的三维目标检测​新框架

    与二维图像中会相互遮挡的物体不同,三维云中的物体都是天然分离的,使得三维目标内部各个部分的相对位置可以精确获取,这些方法将有效提高目标检测方法的性能。基于这样的观察结果,研究人员提出了
    的头像 发表于 08-02 14:18 3538次阅读
    港中文和商汤<b class='flag-5'>研究</b>员<b class='flag-5'>提出</b>高效的三维<b class='flag-5'>点</b><b class='flag-5'>云</b>目标检测​新框架

    JD和OPPO的研究人员提出了种姿势引导的时尚图像生成模型

    研究人员的主要目的在于训练个生成模型,将模特在当前姿势上的图像迁移到其他的目标姿势上去,实现对于衣着等商品的全面展示。
    的头像 发表于 08-02 14:50 2563次阅读

    Facebook的研究人员提出了Mesh R-CNN模型

    研究的目标是通过单张图像输入,对图像中的物体进行检测、获取不同物体的类别、掩膜和对应的三维网格,并对真实世界中的复杂模型进行有效处理。在2D深度网络的基础上,研究人员改进并
    的头像 发表于 08-02 15:51 3893次阅读
    Facebook的<b class='flag-5'>研究人员</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    Waymo公开最新自动驾驶汽车数据集 并邀请相关人员参加一系列挑战赛

    Waymo公开了其最新的自动驾驶汽车数据集,邀请无人驾驶汽车研究人员根据其无人驾驶车队收集的大量数据参加一系列挑战赛。 从Google分离出来的Waymo为其多传感器数据集增加了800个新的细分。
    的头像 发表于 03-20 15:29 2079次阅读

    研究人员提出了个名为CommPlan的框架

    使用CommPlan,开发人员首先使用数据,领域专业知识和学习算法指定五个模块-任务模型,通信功能,通信成本模型,人员响应模型和人员可选动作模型。通过对所有
    的头像 发表于 04-09 14:30 2175次阅读

    Waymo和谷歌合作提出一系列用于自动驾驶行为预测的模型

    Waymo 近期宣布在凤凰城地区开放没有安全员的无人驾驶出租车,实现首个商用的真正的无人驾驶。与此同时,Waymo 也公开分享了一系列新的研究论文,本文就来讲解下 Waymo 在行为预测方面的
    的头像 发表于 10-19 12:00 1967次阅读
    Waymo和谷歌合作<b class='flag-5'>提出</b><b class='flag-5'>一系列</b>用于自动驾驶行为预测的模型

    阿里在海外市场发布一系列AI大数据产品

    近日,阿里宣布面向海外市场发布一系列AI计算及大数据产品,进步扩大其在全球市场的份额。这一系列新产品涵盖了serverless模式的AI服务平台、整合向量引擎技术的大数据产品等,旨
    的头像 发表于 02-05 11:30 1073次阅读