0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

南开大学提出最新边缘检测和图像过分割被 IEEE PAMI 录用

电子工程师 来源:未知 作者:李倩 2018-11-06 09:52 次阅读

近日,南开大学媒体计算实验室提出的最新边缘检测和图像过分割(可用于生成超像素)被 IEEE PAMI 录用。研究的第一作者也发微博称:“这是第一个在最广泛使用的图像分割数据集 BSD500 上 F-Measure 评价值超越数据集本身人工标注平均值的实时算法。图像分割效果也刷新了精度记录。其算法也已经开源。”

先对各位作者进行简单的介绍:

一作 刘云,目前在实验室内攻读博士学位,他的博导也是程明明老师。从刘博士发布过的论文成果列表中可以看到,他在 CVPR、ICCV、ECCV 上都有投过论文。

论文的第二作者——程明明老师。2012 年博士毕业于清华大学,之后在英国牛津从事计算机视觉研究,并于 2014 年回国任教,2016 年起任南开大学教授,国家“万人计划”青年拔尖人才,首批天津市杰出青年基金获得者。其主要研究方向包括:计算机图形学、计算机视觉、图像处理等。已在 IEEE PAMI, ACM TOG 等 CCF-A 类国际会议及期刊发表论文 30 余篇。

三作 胡晓伟。四作 边佳旺,目前就职于华为media computing Lab。这四位作者都来自于南开大学媒体计算实验室。另外三位作者为 Le Zhang(南洋理工大学,ADSC)、Xiang Bai(华中科技大学,HUST)、唐金辉(南京理工大学,NUST)

下面 AI科技大本营就为大家分析讲解这个算法。先把相关介绍和开源地址分享给大家:

https://mmcheng.net/zh/rcfedge/

http://mftp.mmcheng.net/Papers/19PamiEdge.pdf

https://github.com/yun-liu/rcf

在计算机视觉领域,边缘检测属于一个经典问题。在近期的研究中,卷积神经网络(CNN)方法已经显著的推动该领域的发展。现有的方法,由于使用特定层数的卷积神经网络,可能无法成功提取复杂的数据模型,其中这些数据会随着图像尺度和纵横比进行变化。在本文中,我们提出了一种使用更丰富的卷积特征(Richer convolution features, RCF)的精准边缘检测方法。

RCF 方法将所有卷积特征封装成一种更具判别性的表达,这样就可以很好地利用丰富的特征层次结构,并且该方法也可以通过反向传播进行训练。RCF 方法充分利用目标的多尺度和多级信息来实现图像到图像(image-to-image)的预测。

程明明老师在他的微博中分享说:”这里面最核心的是 Richer feature: 每个 stage 里面的所有 conv 层都是有用的,而不是传统只要每个 stage 的最后一个 conv 层。这是很通用的技巧,基本上干什么任务都用得着,而且改几行代码就能实现。“

(来源:程明明老师的个人微博)

使用 VGG16 网络,我们的方法在几个公共数据集上有最好的性能(state-of-the-art)。在BSDS500基准数据集上进行测试评估时,F-Measure分数(F-measure)我们取得了 0.811 的成绩,并同时获得了8 FPS的速度。此外,快速版的 RCF 方法取得了 0.806 分和 30 FPS 的速度。为了证明所提出方法的多功能性,我们还将 RCF 检测的边缘应用于图像分割问题。

我们构建了一个基于 VGG16 的简单神经网络,以得到 conv3_1,conv3_2,conv3_3,conv4_1,conv4_2 和 conv4_3 这几层每层的输出。通过上图,可以清楚地看到卷积特征逐渐变得粗糙,并且中间层 conv3_1,conv3_2,conv4_1 和 conv4_2包含许多有用的精确细节,而这些细节没有在其他层中出现。

上图展示的是 RCF 网络架构。网络的输入是具有任意大小的图像,而网络的输出是具有相同大小的边缘检测图。我们将每个卷积层的层次特征组合成一个整体框架,而其中的所有参数都是可以训练学习的。由于 VGG16 中卷积层的感受野大小彼此不同,因此我们的网络可以学习多尺度,包括低尺度和对象级的信息,而这些信息将有助于边缘检测。

上图是该多尺度算法的管道图。调整原始图像的大小以构建图像金字塔。然后将这些多尺度图像输入到 RCF 网络中进行正向传递。接着,我们使用双线性插值将结果边缘检测图恢复为原始大小。对这些边缘图进行简单平均计算就可以输出高质量边缘图。

在 BSDS500 数据集上的评估结果

上图是超过 50 年的边缘检测方法性能总结。 我们的方法是第一个比人类注释器获得更好 F-Measure 分数的实时系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像分割
    +关注

    关注

    4

    文章

    182

    浏览量

    17995
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    45974

原文标题:南开大学提出最新边缘检测与图像分割算法,精度刷新记录(附开源地址)

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于GAC模型实现交互式图像分割的改进算法

    基于GAC模型实现交互式图像分割的改进算法提出了一种改进的交互式图像分割算法。采用全变分去噪模型对图像
    发表于 09-19 09:19

    南开大学量子力学考研试题

    南开大学量子力学考研试题
    发表于 11-25 16:10 0次下载

    基于阈值分割的红外图像边缘检测方法

    提出了一种基于阈值分割边缘检测算法。首先利用最大方差阈值法分割出红外图像的目标
    发表于 02-22 11:13 47次下载
    基于阈值<b class='flag-5'>分割</b>的红外<b class='flag-5'>图像</b><b class='flag-5'>边缘</b><b class='flag-5'>检测</b>方法

    图像分割图像边缘检测

     图像分割的研究多年来一直受到人们的高度重视,至今提出了各种类型的分割算法。Pal把图像分割算法
    发表于 12-19 09:29 1.1w次阅读
    <b class='flag-5'>图像</b><b class='flag-5'>分割</b>和<b class='flag-5'>图像</b><b class='flag-5'>边缘</b><b class='flag-5'>检测</b>

    南开大学提出了高性能太赫兹隐身材料设计的新思路

    南开大学团队在石墨烯功能材料及其隐身应用方面开展了深入的研究工作。针对传统隐身材料无法有效对抗太赫兹波探测的挑战,提出了高性能太赫兹隐身材料设计的新思路。
    的头像 发表于 12-29 15:27 5044次阅读

    南开大学决定成立人工智能学院

    据最新消息,南开大学办公室在5月11日印发中共南开大学委员会文件,决定成立南开大学人工智能学院。
    的头像 发表于 05-17 09:04 5841次阅读
    <b class='flag-5'>南开大学</b>决定成立人工智能学院

    如何对互联网图像实现像素级别的语义识别

    南开大学的程明明教授,介绍如何在没有人工标注的情况下,直接从Web中学习知识,对互联网图像实现像素级别的语义识别。
    的头像 发表于 06-27 15:35 3898次阅读
    如何对互联网<b class='flag-5'>图像</b>实现像素级别的语义识别

    南开大学开发出一种具有超高容量的锂离子电池有机正极材料

    近日,中国科学院院士、南开大学化学学院教授陈军团队设计合成了一种具有超高容量的锂离子电池有机正极材料:环己六酮,该材料包含地球丰富的碳、氢、氧元素,且此类有机正极材料展现了锂离子电池目前所报道的最高容量值,刷新了锂离子电池有机正极材料容量的世界纪录。
    发表于 05-17 15:27 1072次阅读

    南开大学孙军教授:逆流而上,为光电材料尽一份力

    孙军教授就是南开大学铌酸锂晶体研究团队中的一员。从1999年本科毕业进入905厂开始从事铌酸锂晶体研究,到去南开大学攻读硕博学位继续探索,再到今天,孙军一直在铌酸锂晶体领域里专注了二十余年。
    的头像 发表于 06-04 09:40 5252次阅读

    “人工智能+机器人”高端论坛在南开大学举行

    南开新闻网讯(通讯员周璐)10月10日,由人工智能学院、计算机学院、网络空间安全学院、电子信息与光学工程学院、软件学院联合主办的人工智能+机器人高端论坛在南开大学津南新校区举行。 本次论坛以人工智能
    的头像 发表于 10-21 15:37 2079次阅读

    南开大学提出LSKNet:遥感旋转目标检测新SOTA!

    如图1(a)所示,遥感图像中的物体检测器所使用的有限范围的背景往往会导致错误的分类。例如,在上层图像中,由于其典型特征,检测器可能将T子路口归类为十字路口,但实际上,它不是一个十字交路
    的头像 发表于 07-18 16:57 1380次阅读
    <b class='flag-5'>南开大学</b><b class='flag-5'>提出</b>LSKNet:遥感旋转目标<b class='flag-5'>检测</b>新SOTA!

    南开大学OpenHarmony技术俱乐部揭牌成立

    3月7日,由OpenAtom OpenHarmony(以下简称“OpenHarmony”)项目群技术指导委员会与南开大学共同举办的“南开大学OpenHarmony技术俱乐部成立大会”在津南校区综合
    的头像 发表于 03-08 08:37 395次阅读
    <b class='flag-5'>南开大学</b>OpenHarmony技术俱乐部揭牌成立

    南开大学和字节跳动联合开发一款StoryDiffusion模型

    近日,南开大学和字节跳动联合开发的 StoryDiffusion 模型解决了扩散模型生成连贯图像与视频的难题。
    的头像 发表于 05-07 14:46 1264次阅读

    火山引擎与南开大学深化合作签约,携手共建“AI+教育”新生态

    近日,在2024春季火山引擎FORCE原动力大会实体产业及教科研专场上,南开大学与火山引擎成功举办了深度合作签约仪式。此次合作标志着双方将携手共筑“AI+教育”的新篇章,共同推动教育行业数字化转型。
    的头像 发表于 05-20 11:16 602次阅读

    南开大学携手华为发布“人工智能赋能人才培养行动计划”

    为进一步推动人工智能与教育的深度融合,促进教育变革创新,培养智能时代公能兼备的高层次创新型人才,南开大学依托自身优势,紧紧围绕立德树人根本任务,制定推出涵盖教育教学、技术设施、管理服务三个篇章的“人工智能赋能人才培养行动计划”(以下简称“行动计划”)。
    的头像 发表于 05-22 11:51 652次阅读
    <b class='flag-5'>南开大学</b>携手华为发布“人工智能赋能人才培养行动计划”