0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于视觉Transformer的监督视频异常检测架构进行肠息肉检测的研究

lhl545545 来源:CVer 作者:CVer 2022-09-27 11:15 次阅读

本文提出一种有效的基于视觉Transformer的弱监督视频异常检测架构来实现精准检测结直肠息肉。这也是首篇利用弱监督视频标签来进行肠息肉检测的研究, 文章基于之前数据集整理合并提出了一个全新的大型结直肠视频数据集用于息肉检测的研究。性能表现SOTA!代码和数据即将开源!

结直肠镜是一种有效的检测手段来早起筛查结直肠癌。然后, 在肠镜过程中医生往往会遗漏细小的不引人注意的肠息肉, 给病人的健康留下严重的隐患。所以利用AI系统来辅助医生精准检测是十分重要的。

比较常用的方法是利用全监督的方法来逐帧标注。这种方法需要专业医生很多的精力和时间, 所以之前的论文通常利用无监督异常检测来解决。无监督异常检测只需要利用正常数据来进行训练, 然后通过对比正常和异常的特征区别达到检测肠息肉的功能。这些工作因为没有利用异常数据训练 往往很容易忽略掉很多微笑的或者只有部分可见的肠息肉。所以本文首次提出利用弱监督视频异常检测的方法来解决这个问题, 即只使用视频级的标注而不需要逐帧标注。这样做大大减少了标注的繁琐过程和时间 并且能够有效的检测细微不引人注意的息肉。

之前的弱监督视频异常检测方法通常利用multiple instance learning, 即正常视频中所有帧视为正常帧, 异常视频内至少有一或多帧为异常。基于MIL的方法经常很难准确检测出异常视频中哪一帧存在异常, 尤其是当异常帧和正常帧很像的时候。

在这篇文章, 我们首次探索了利用弱监督异常检测如何在结肠镜视频中检测异常帧 通过一个新颖的基于视觉transformer的架构。为了evaluate我们方法的准确性, 我们整理了已知的几种结肠镜数据集 整合成了一个大型的视频结肠镜数据集来测试弱监督和全监督视频帧异常检测。这个新数据集为后面的研究提供一个全新的benchmark去测试和发展。

e8a0b022-3ceb-11ed-9e49-dac502259ad0.png

e8ec86c8-3ceb-11ed-9e49-dac502259ad0.png

实验结果

实验结果表明,我们的方法在这个全新的结肠镜视频数据集上明显优于其他网络。例如, 我们的方法超过RTFM和MIST 10%-15% AP, 证明了方法的稳定性和准确性。

e9225f82-3ceb-11ed-9e49-dac502259ad0.png

下图可以看出我们方法可以有效的降低正常帧的异常分数并且提高异常帧(带息肉)的异常分数。

e944027c-3ceb-11ed-9e49-dac502259ad0.png

审核编辑:彭静

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 检测
    +关注

    关注

    5

    文章

    4433

    浏览量

    91353
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24635
  • Transformer
    +关注

    关注

    0

    文章

    141

    浏览量

    5980

原文标题:MICCAI 2022 | 基于对比学习和视觉Transformer的弱监督视频肠息肉检测

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于transformer和自监督学习的路面异常检测方法分享

    铺设异常检测可以帮助减少数据存储、传输、标记和处理的压力。本论文描述了一种基于Transformer和自监督学习的新方法,有助于定位异常区域
    的头像 发表于 12-06 14:57 1451次阅读
    基于<b class='flag-5'>transformer</b>和自<b class='flag-5'>监督</b>学习的路面<b class='flag-5'>异常</b><b class='flag-5'>检测</b>方法分享

    如何使用部分异常观测数据进行异常检测

    使用部分异常观测数据进行异常检测(翻译自 Anomaly Detection with Partially Observed Anomalies)
    发表于 04-26 14:37

    基于深度学习的异常检测研究方法

    研究方法进行了系统而全面的综述。此外,我们回顾了这些方法在不同应用领域中的应用,并评估了它们的有效性。我们根据所采用的基本假设和方法,将最先进的深度异常检测
    发表于 07-12 07:10

    基于深度学习的异常检测研究方法

    ABSTRACT1.基于深度学习的异常检测研究方法进行结构化和全面的概述2.回顾这些方法在各个领域这个中的应用情况,并评估他们的有效性。3.根据基本假设和采用的方法将最先进的深度
    发表于 07-12 06:36

    基于视频的智能交通异常检测系统

    摘要! 交通异常情况检测一直是交通管理中的重要任务# 其在智能交通系统中显得尤为重要$ 传统的检测方法存在许多不足#不能满足视频监控的需要$ 基于此#提出一种基于
    发表于 04-01 17:52 48次下载
    基于<b class='flag-5'>视频</b>的智能交通<b class='flag-5'>异常</b><b class='flag-5'>检测</b>系统

    基于隐马尔可夫模型的视频异常检测模型

    视频技术的广泛应用带来海量的视频数据,仅依靠人力对监控视频中的异常进行检测是不太可能的。异常行为
    发表于 11-20 09:37 8次下载
    基于隐马尔可夫模型的<b class='flag-5'>视频</b><b class='flag-5'>异常</b><b class='flag-5'>检测</b>模型

    智能监控视频异常事件检测

    针对智能监控系统中的行为分析与识别,将隐马尔可夫模型( Hidden Markov model,HMM)应用到智能视频监控系统的异常事件检测中。首先应用背景差法将运动目标提取出来。其次将运动目标
    发表于 03-07 13:35 2次下载
    智能监控<b class='flag-5'>视频</b><b class='flag-5'>异常</b>事件<b class='flag-5'>检测</b>

    浅谈机器学习中的异常检测应用

    一、简介 异常检测一直是机器学习中一个非常重要的子分支,在各种人工智能落地应用例如计算机视觉、数据挖掘、NLP中,异常检测算法都是很热门的
    的头像 发表于 10-29 11:26 3808次阅读
    浅谈机器学习中的<b class='flag-5'>异常</b><b class='flag-5'>检测</b>应用

    如何使用Transformer来做物体检测

    )是Facebook研究团队巧妙地利用了Transformer 架构开发的一个目标检测模型。在这篇文章中,我将通过分析DETR架构的内部工作
    的头像 发表于 04-25 10:45 2592次阅读
    如何使用<b class='flag-5'>Transformer</b>来做物体<b class='flag-5'>检测</b>?

    基于车辆轨迹特征的视频异常事件检测算法

    检测算法,对视频中的车辆目标进行提取,提出了结合运动特征和表观特征的多目标追踪算法;在此基础上,又提出了一种基于车辆轨迹特征的异常事件检测
    发表于 05-13 14:45 5次下载

    使用MATLAB进行异常检测(上)

    异常检测任务,指的是检测偏离期望行为的事件或模式,可以是简单地检测数值型数据中,是否存在远超出正常取值范围的离群值,也可以是借助相对复杂的机器学习算法识别数据中隐藏的
    的头像 发表于 11-17 10:32 3430次阅读

    使用MATLAB进行异常检测(下)

    在使用 MATLAB 进行异常检测(上)中,我们探讨了什么是异常值,简单的一维数据异常检测问题,
    的头像 发表于 11-24 10:46 2144次阅读

    基于 Transformer 的分割与检测方法

    来源:机器之心 SAM (Segment Anything )作为一个视觉的分割基础模型,在短短的 3 个月时间吸引了很多研究者的关注和跟进。如果你想系统地了解 SAM 背后的技术,并跟上内卷的步伐
    的头像 发表于 07-05 10:18 918次阅读
    基于 <b class='flag-5'>Transformer</b> 的分割与<b class='flag-5'>检测</b>方法

    哈工大提出Myriad:利用视觉专家进行工业异常检测的大型多模态模型

    最近,大型多模态(即视觉和语言)模型(LMM)在图像描述、视觉理解、视觉推理等多种视觉任务上表现出了卓越的感知能力,使其成为更易于理解的异常
    的头像 发表于 11-21 16:08 1712次阅读
    哈工大提出Myriad:利用<b class='flag-5'>视觉</b>专家<b class='flag-5'>进行</b>工业<b class='flag-5'>异常</b><b class='flag-5'>检测</b>的大型多模态模型

    语言模型的弱监督视频异常检测方法

    LGT Adapter由局部关系Transformer和全局关系图卷积串联组成。考虑到常规的Transformer在长时视频时序关系建模时冗余信息较多、计算复杂度较高,我们改进
    的头像 发表于 01-02 15:20 760次阅读
    语言模型的弱<b class='flag-5'>监督</b><b class='flag-5'>视频</b><b class='flag-5'>异常</b><b class='flag-5'>检测</b>方法