CVPR 2023 中的领域适应：用于切片方向连续的无监督跨模态医学图像分割-电子发烧友网

CVPR 2023 中的领域适应：用于切片方向连续的无监督跨模态医学图像分割

前言

我们已经介绍过 3 篇 CVPR 中的典型领域适应工作，他们三篇都是 TTA（Test-Time Adaptation）的 settings，而这次要介绍的文章是 UDA（Unsupervised domain adaptation）的 setting。之前的三篇文章分别是：

CoTTA

EcoTTA

DIGA

在这篇文章中，提出了 SDC-UDA，一种简单而有效的用于连续切片方向的跨模态医学图像分割的体积型 UDA 框架，它结合了切片内和切片间自注意力图像转换、不确定性约束的伪标签优化和体积型自训练。与以前的医学图像分割 UDA 方法不同之处在于它可以获得切片方向上的连续分割（这一点有点重要，因为往往临床上都是一个 3D 数据，而直接处理 3D 数据又需要很大的计算资源），从而确保更高的准确性和临床实践中的潜力。

如上图所示，以前的医学图像分割 UDA 方法大多采用 2D UDA，当将预测堆叠在一起时，会导致切片方向上的预测不一致。SDC-UDA 在翻译和分割过程中考虑了体积信息，从而改善了分割结果在切片方向上的连续性，可以看到在图的最右侧，下面方法的 Dice 值在切片方向上是稳定的。

此外，我们全文中提到的“体积”这个词，可以理解为 3D 数据。

体积型 UDA 框架概述

如下图所示，SDC-UDA 大致有五个步骤，从 stage 1 到 stage 5：

stage 1：带有片内和片间注意力的对抗学习过程，这一步是 stage 2 的基础，stage 2 是该步骤的上半部分。后面会单独用一个小节介绍。

stage 2：target 模态数据生成，假如 source 数据模态是 MRI，那么在这个步骤我们会得到 3D 的 CT 和对应的 label。

stage 3：把生成的 target 数据和 label 送入到教师网络训练。

stage 4：将真实的不带标签的 target 数据输入到 stage 3 的教师网络得到伪标签，并通过不确定性抑制优化伪标签。

stage 5：将生成的 target 数据、真实 target 数据和他们的标签用于优化学生网络，最终的预测也是在学生网络上。

请添加图片描述

具体实现

Unpaired 图像转换

先前的 2D UDA 方法将 3D 体积分割成 2D 切片，并在之后将它们的转换重新堆叠成 3D 体积。由于切片是单独处理的，重新构建转换后的体积通常需要额外的后处理，如切片方向插值，但这仍然无法完全解决切片方向不连续等问题。为了解决 2D 方法缺乏对体积性质的考虑和 3D 方法的优化效率问题，这篇文章提出了一种简单而有效的像素级领域转换方法，用于医学图像体积数据，通过使用切片内部和切片间自注意力模块将一组源域图像转换为目标域图像。与先前的 2D 方法只在单个切片内进行转换，而这篇文章的方法利用了切片方向上相邻切片的信息。这类似于最近在视频处理中的进展，它利用了帧内部和帧之间的信息。与需要昂贵计算成本的 3D 方法相比，不需要大量计算（下采样）。

如上图所示，首先我们将一个 3D MRI 数据裁剪出 3 张切片，输入到 CNN 的 encoder中，encoder 的输出是三张切片的 feature maps，即在通道维度上被卷积。然后我们在长和宽的方向上裁剪 patches，这样会得到若干个 patch 块，输入到带有片内和片间的切片注意力模块中。这个注意力模块就是很普通的多头注意力、残差和 FFN 的两次组合。最后我们做相反过程的 decoder，这时生成的图像应该是 target 模态的。为了方便理解，可以再去看看我们在上一节提到的 stage 1，对应 stage 1 的上半部分。

stage 1 除了包括上面提到的这个过程，还包括重建的反过程（下半部分），这样我们才能计算一致性的 loss，同时利用对抗学习的判别器，完成自监督的训练。

体积自训练和伪标签优化

我们已经介绍了概述中第一个 stage，这一节对应后面三个 stage。

通过从源域转换的合成数据 x˜t 和注释 ys（即带标签的合成数据集），我们首先训练一个教师分割网络 teacher，该网络最小化分割损失：

训练完教师模型，可以通过将真实的目标域数据 xt 传递给训练好的分割模型 teacher，获取未标记真实数据的伪标签 y˜t。

由于 teacher 预测出的伪标签是噪声标签，必须对其进行改进，以提高准确性并引导自训练朝更好的方向发展。这篇文章设计了一种增强敏感性（SE）和特异性（SP）的伪标签改进模块，该模块基于图像强度、当前伪标签和不确定性区域（高于阈值）来改进伪标签。

通过预测出的伪标签，计算与每个类别相对应的不确定性（即熵）图：

其中 p 是每个类别的输出概率图。为了增强伪标签的敏感性，检测超出伪标签范围的高度不确定的区域。然后，如果该区域中的像素强度在当前伪标签包含的图像强度的某个范围内，该区域将被包括为伪标签的一部分。该公式可以表示为：

其中分别表示目标域图像、伪标签、改进的伪标签和裁剪了高不确定性区域掩码。该方法基于假设：在医学图像中，具有相似强度且相互接近的像素很可能属于同一类别。

为了增强伪标签的特异性，也是检测伪标签范围内的高度不确定的区域。区别是，如果该区域中的像素强度不在当前伪标签包含的图像强度的某个范围内，则将其从当前伪标签中排除。可以表示为：

上面这个流程，文章中给出了图示如下，有助于理解这个流程：

请添加图片描述

在 stage 5 中，合成的 target scans 与真实 target scans 存在分布差异。这篇文章将这两种配对数据结合到自训练中，以最大程度地提高泛化能力，并最小化由于分布差异而引起的性能下降。把带标签的合成 target scans 和带伪标签的 target scans 的数据合并，训练一个学生分割模型 student，以最小化以下损失：

实验

下表是 SDC-UDA 与以前的非医学图像和医学图像 UDA 方法之间的定量结果的比较。该表包括非医学图像 UDA 方法（例如 cycleGan、cycada、ADVENT 和 FDA）的结果，以及最近的医学图像 UDA 方法（例如 SIFA 和 PSIGAN）的结果。对比发表在 TMI 2020 上的 PSIGAN 方法，DICE 指标上提升了很多，特别是从 T1 到 T2 的跨模态设置。MRI 到 CT 也有显著的提升。

请添加图片描述

可视化结果比较如下图：

请添加图片描述

总结

这篇文章提出了 SDC-UDA，一种用于切片方向连续的跨模态医学图像分割的新型 UDA 框架。SDC-UDA 通过切片内部和切片间的自注意力有效地转换医学体积，并通过利用不确定性图，设计简单而有效的伪标签细化策略。通过体积级自训练更好地适应目标域。

现在的 SDC-UDA 框架中，只有 stage 1 是不需要训练 3D 图像的，后面的过程仍然是 3D 的训练（可能出于准确率的角度），也需要消耗更多的计算资源，其实也是可以优化成一组堆叠切片的。

参考

https://arxiv.org/pdf/2305.11012.pdf

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

3D

3D

+关注

关注
9

文章
2923

浏览量
108180
框架

框架

+关注

关注
0

文章
403

浏览量
17564
图像分割

图像分割

+关注

关注
4

文章
182

浏览量
18057

原文标题：CVPR 2023 中的领域适应：用于切片方向连续的无监督跨模态医学图像分割

文章出处：【微信号：GiantPandaCV，微信公众号：GiantPandaCV】欢迎添加关注！文章转载请注明出处。

PCB中的平面跨分割

在 PCB 设计过程中，由于平面的分割，可能会导致信号参考平面不连续，对于低低频信号，可能没什么关系，而在高频数字系统中，高频信号以参考平面作返回路径，即回流路径，如果参考ᒣ面不

发表于 10-09 13:10

FCM聚类算法用于医学图像分割matlab源程序

FCM聚类算法以及改进模糊聚类算法用于医学图像分割的matlab源程序

发表于 05-11 23:30

FCM聚类算法以及改进模糊聚类算法用于医学图像分割的matlab源程序

发表于 05-11 23:54

van-自然和医学图像的深度语义分割：网络结构

概率值最大的分割结果，作为最后的分割图。U-Net中常常会问为什么适用于医学图像这个问题.。首先分析医学

发表于 12-28 11:03

van-自然和医学图像的深度语义分割：网络结构

概率值最大的分割结果，作为最后的分割图。U-Net中常常会问为什么适用于医学图像这个问题.。首先分析医学

发表于 12-28 11:06

基于MLP的快速医学图像分割网络UNeXt相关资料分享

1、基于MLP的快速医学图像分割网络UNeXt　　方法概述　　之前我们解读过基于 Transformer 的 U-Net变体，近年来一直是领先的医学

发表于 09-23 14:53

深度学习在医学图像分割与病变识别中的应用实战

等方面具有重要意义。本文将介绍这一领域的背景、挑战，以及通过一个代码实例展示如何利用深度学习方法进行医学图像分割与病变识别。背景与挑战医学

发表于 09-04 11:11

基于改进CNN的医学图像分割方法

为了提高医学图像分割的精确性和鲁棒性，提岀了一种基于改进卷积神经网络的医学图像分割方法。首先采用

发表于 06-03 16:23 •6次下载

全面解读CVPR2021-MMAct挑战赛跨模态动作识别双冠方案

导读日前，计算机视觉和模式识别领域的三大顶级会议之一CVPR正在进行中，深兰DeepBlueAI团队在动作识别国际挑战赛（ActivityNet）研讨会上，参加了 MMAct 挑战赛中

发表于 06-25 10:53 •2472次阅读

基于耦合字典学习与图像正则化的跨模态检索

基于耦合字典学习与图像正则化的跨模态检索

发表于 06-27 11:23 •39次下载

快速HAC聚类算法的改进及应用于无监督语音分割

快速HAC聚类算法的改进及应用于无监督语音分割(电源输入电容温度高)-该文档为快速HAC聚类算法的改进及应用于

发表于 07-26 11:01 •1次下载

改进自适应GACV的水下图像分割算法研究

改进自适应GACV的水下图像分割算法研究(通信电源技术20年第13期)-基于改进自适应GACV的水下图像

发表于 09-22 15:32 •11次下载

跨图像关系型KD方法语义分割任务-CIRKD

语义分割任务作为计算机视觉中的基础任务之一，其目的是对图像中的每一个像素进行分类。该任务也被广泛应用于实践，例如自动驾驶和

发表于 05-10 11:30 •2528次阅读

基于Diffusion Probabilistic Model的医学图像分割

MedSegDiff 在原版 DPM 的基础上引入了动态条件编码，增强 DPM 在医学图像分割上的分步注意力能力。

发表于 05-04 18:14 •4212次阅读

CVPR 2023 | 完全无监督的视频物体分割 RCF

TLDR：视频分割一直是重标注的一个 task，这篇 CVPR 2023 文章研究了完全不需要标注的视频物体分割。仅使用 ResNet，RCF模型在 DAVIS16/STv2/FBM

发表于 07-16 20:45 •717次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

CVPR 2023 中的领域适应：用于切片方向连续的无监督跨模态医学图像分割

评论

PCB中的平面跨分割

FCM聚类算法用于医学图像分割matlab源程序

FCM聚类算法以及改进模糊聚类算法用于医学图像分割的matlab源程序

van-自然和医学图像的深度语义分割：网络结构

van-自然和医学图像的深度语义分割：网络结构

基于MLP的快速医学图像分割网络UNeXt相关资料分享

深度学习在医学图像分割与病变识别中的应用实战

基于改进CNN的医学图像分割方法

全面解读CVPR2021-MMAct挑战赛跨模态动作识别双冠方案

基于耦合字典学习与图像正则化的跨模态检索

快速HAC聚类算法的改进及应用于无监督语音分割

改进自适应GACV的水下图像分割算法研究

跨图像关系型KD方法语义分割任务-CIRKD

基于Diffusion Probabilistic Model的医学图像分割

CVPR 2023 | 完全无监督的视频物体分割 RCF