0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新的分割模型Stable-SAM

3D视觉工坊 来源:3D视觉工坊 2023-12-29 14:35 次阅读

0. 笔者个人体会

分割一切模型(SAM)这几年在CV领域应用很多,很多文章都在努力提高SAM的分割精度,但SAM分割的前提是高质量的提示(点、框)。但是实践中的SAM经常遇到不准确的提示,尤其是众包标注平台,这种不准确的提示会导致分割错误。

这也就是Stable Segment Anything Model这篇文章想要解决的问题,提出了一种新的分割模型Stable-SAM,希望遇到错误提示时也能实现稳定分割!

1. 效果展示

SAM、HQ-SAM、Stable-SAM在提供次优提示时的性能比较,Stable-SAM明显优于其他算法。

0a281586-9d31-11ee-8b88-92fbcf53809c.jpg

SAM和Stable-SAM的预测Mask和图像特征的权重对比,橙色圆圈表示注意力权重,半径越大表示得分越高。(a) 当提供高质量提示时,SAM分割结果很好。(b) 微小的提示修改会导致不稳定的分割输出,SAM错误分割了背景。(c) Stable-SAM通过将更多的特征采样注意力转移到目标对象上来准确地分割目标对象。

2. 具体原理是什么?

Stable-SAM的具体pipeline由三部分组成:

(a)是SAM的Mask解码器中的可变形采样插件(DSP)和可变形路由插件(DRP)。DSP采用小偏移网络(b)来预测特征采样偏移。随后DSP在更新的采样位置对可变形图像特征进行重新采样,并将它们馈送到SAM的标记到图像注意力。DRP采用一个小型MLP网络(c)来根据输入提示质量调节DSP激活的程度。注意,DSP自适应地单独调整图像特征采样位置,不会改变原始SAM模型。

0a573726-9d31-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法对比如何?

在不同质量的提示下,SAM、DT-SAM(微调SAM的Mask解码器)、PT-SAM(微调SAM的提示token及其对应的输出MLP层)、HQ-SAM和Stable-SAM在HQ数据集上的对比。这里也推荐工坊推出的新课程《如何将深度学习模型部署到实际工程中?(分类+检测+分割)》。

0a6b0bac-9d31-11ee-8b88-92fbcf53809c.jpg

MS COCO和SGinW数据集上的对比,Stable-SAM最优。

0a775bd2-9d31-11ee-8b88-92fbcf53809c.jpg

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    554

    文章

    8059

    浏览量

    350053
  • 解码器
    +关注

    关注

    9

    文章

    1147

    浏览量

    40897
  • 图像分割
    +关注

    关注

    4

    文章

    182

    浏览量

    18041
  • SAM
    SAM
    +关注

    关注

    0

    文章

    113

    浏览量

    33562

原文标题:SAM终结者:稳定分割一切!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一种带验证的自适应镜头分割算法

    :文中针对镜头分割在基于内容的视频检索中的重要性,首先介绍了普通的镜头分割方法,进而针对这些方法的不足,提出了一种带检测的自适应镜头分割算法,该方法能够检测
    发表于 12-16 12:25 21次下载

    一种目标飞机分割提取方法

    提出了一种目标飞机分割提取方法,该方法采用改进的使用金字塔式分割策略的以彩色高斯混合模型CMM(Gaussian Mixture Model)和迭代能量最小化为基础的CJrabCut算
    发表于 11-10 15:46 7次下载
    <b class='flag-5'>一种</b>目标飞机<b class='flag-5'>分割</b>提取方法

    一种新的彩色图像分割算法

    本文提出一种新的结合分水岭与种子区域生成、区域合并的彩色图像分割算法。首先将RGB颜色空间转换成HSI间,应用分水岭算法对图像进行初始化分割,形成过分割效果。接着基于分水岭算法得到的
    发表于 12-14 14:41 1次下载
    <b class='flag-5'>一种</b>新的彩色图像<b class='flag-5'>分割</b>算法

    一种牙齿半自动精确分割算法

    两侧的特征点构建局部凹陷感知调和场矩阵,计算模型局部区域的标量场;其次在局部网格上得系列等值线利用一种投票机制选取最佳等值线作为牙齿分割线;最后利用
    发表于 04-29 15:39 3次下载
    <b class='flag-5'>一种</b>牙齿半自动精确<b class='flag-5'>分割</b>算法

    一种高精度的肝脏图像自动分割算法

    在利用卷积神经网络分割肝脏边界较模糊的影像数据时容易丢失位置信息,导致分割精度较低。针对该问题,提出一种基于分水岭修正与U-Net模型相结合的肝脏图像自动
    发表于 05-27 15:17 2次下载

    SAM-Adapter:首次让SAM在下游任务适应调优!

    在这些基础模型中,Segment Anything Model(SAM)作为个在大型视觉语料库上训练的通用图像分割模型取得了显著的突破。事
    的头像 发表于 04-20 10:13 1665次阅读

    SAM分割模型是什么?

    SAM类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,
    的头像 发表于 05-20 09:30 2330次阅读

    近期分割模型发展情况

    SAM(Segment Anything Model)Meta 的 FAIR 实验室发布的一种最先进的图像分割模型,该模型将自然语言处理领域
    的头像 发表于 05-22 16:26 913次阅读
    近期<b class='flag-5'>分割</b>大<b class='flag-5'>模型</b>发展情况

    篇综述!分割模型(SAM)的全面调研

    SAM个提示型模型,其在 1100 万张图像上训练了超过 10 亿个掩码,实现了强大的零样本泛化。许多研究人员认为「这是 CV 的 GPT-3 时刻,因为 SAM 已经学会了物体
    的头像 发表于 05-24 14:36 1084次阅读
    第<b class='flag-5'>一</b>篇综述!<b class='flag-5'>分割</b><b class='flag-5'>一</b>切<b class='flag-5'>模型</b>(<b class='flag-5'>SAM</b>)的全面调研

    基于一种移动端高性能 Stable Diffusion 模型

      Stable Diffusion (SD)是当前最热门的文本到图像(text to image)生成扩散模型。尽管其强大的图像生成能力令人震撼,个明显的不足是需要的计算资源巨大,推理速度很慢
    的头像 发表于 06-12 10:14 834次阅读
    基于<b class='flag-5'>一种</b>移动端高性能 <b class='flag-5'>Stable</b> Diffusion <b class='flag-5'>模型</b>

    YOLOv8最新版本支持SAM分割

    分割任何模型 (Segment Anything Model - SAM) 是一种突破性的图像分割模型
    的头像 发表于 06-18 11:42 1657次阅读
    YOLOv8最新版本支持<b class='flag-5'>SAM</b><b class='flag-5'>分割</b><b class='flag-5'>一</b>切

    基于SAM设计的自动化遥感图像实例分割方法

    RSPrompter的目标是学习如何为SAM生成prompt输入,使其能够自动获取语义实例级掩码。相比之下,原始的SAM需要额外手动制作prompt,并且是一种类别无关的分割方法。
    发表于 07-04 10:45 994次阅读
    基于<b class='flag-5'>SAM</b>设计的自动化遥感图像实例<b class='flag-5'>分割</b>方法

    介绍一种自动驾驶汽车中可行驶区域和车道分割的高效轻量级模型

    本文介绍了TwinLiteNet:一种自动驾驶汽车中可行驶区域和车道分割的高效轻量级模型。语义分割是自动驾驶中理解周围环境的项常见任务。
    发表于 08-03 14:20 1335次阅读
    介绍<b class='flag-5'>一种</b>自动驾驶汽车中可行驶区域和车道<b class='flag-5'>分割</b>的高效轻量级<b class='flag-5'>模型</b>

    ICCV 2023 | 超越SAM!EntitySeg:更少的数据,更高的分割质量

    ,需要在不同的图像领域、新的物体类别以及各种图像分辨率和质量下都能够保持鲁棒性。为了解决这个问题,早在 SAM[6] 模型年之前,一种不考虑类别的实体
    的头像 发表于 10-02 10:40 876次阅读
    ICCV 2023 | 超越<b class='flag-5'>SAM</b>!EntitySeg:更少的数据,更高的<b class='flag-5'>分割</b>质量

    图像分割与语义分割中的CNN模型综述

    图像分割与语义分割是计算机视觉领域的重要任务,旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络(CNN)作为深度学习的一种核心模型,在图像
    的头像 发表于 07-09 11:51 1114次阅读