一种AI辅助的图像编辑工具,可以自动抠图替换任何图像的背景-电子发烧友网

MIT CSAIL的研究人员开发了一种基于深度学习的图像编辑工具，能够自动抠图，替换任何图像的背景。他们称之为“图像软分割”，这个系统能够分析原始图像的纹理和颜色，仅需3~4分钟，生成非常自然、真实的图像，其效果不输专业人士用Photoshop的制作。

是时候卸载你的PS软件了。

最近，MIT计算机科学与人工智能实验室（CSAIL）的研究人员开发了一种AI辅助的图像编辑工具，它可以自动抠图，替换任何图像的背景。

像这样：

和这样：

要使抠完的这些图像看起来很逼真并不是一件容易的事，因为图像编辑必须要成功捕捉前景和背景之间微妙的审美转换点，这对于人类头发等复杂材质来说尤其困难。

下图除外。

“处理这些图像的棘手之处在于，图像中每个像素并不是全部只属于一个物体。”麻省理工学院计算机科学与人工智能实验室（CSAIL）的访问研究员Yagiz Aksoy说。“很多时候，我们很难确定哪些像素是背景的一部分，哪些像素是特定的人的一部分。”

除了经验最丰富的编辑人员之外，其他人都很难把控这些细节。但是在最近的一篇新论文中，Aksoy和他的同事展示了一种利用机器学习让照片编辑过程自动化的方法，而且表示这种方法也可用于视频处理。

该团队提出的方法可以将拍摄的图像自动分解为一组不同的图层，图层之间通过一系列“软过渡”（soft transitions）相分隔。

他们把这个系统命名为“语义软分割”（semantic soft segmentation，SSS），它能够分析原始图像的纹理和颜色，并将其与神经网络收集的有关图像中实际目标的信息相结合。

3分钟AI自动抠图，彻底抛弃PhotoShop

编辑器将图像中的对象和背景分割成不同的部分，以便于选择。但不像大多数图片编辑软件需要式样磁性套索或魔术套索工具，MIT开发的AI工具并不依赖于用户输入的上下文，你不必跟踪一个对象或放大并捕捉精细细节。AI可以自动实现这一过程。

这个过程从神经网络估计图像的区域和特征开始：

然后，神经网络检测到“soft transitions”，例如狗狗的毛发和草。以前这个过程必须手动去做。

然后通过颜色将图像中的像素相互关联：

这些信息与神经网络检测到的特征相结合，对图像的层进行估计。

经过这一系列处理，现在，可以实现AI自动抠图并更换背景了。

研究人员表示，这样自动处理一张640×480的图像需要3~4分钟。

“一旦计算出这些软分割段，用户就不必手动套索，也不用对图像的特定图层的外观进行单独修改，”Aksoy说道，他在上周与温哥华举办的SIGGRAPH计算机图形会议上发表了该技术的论文。“这样一来，更换背景和调整颜色等手动编辑任务将变得更加容易。”

当然，这个魔术一般的工具背后涉及许多复杂的算法和计算，我们将在后文介绍。该团队使用神经网络来处理图像特征和确定图像的柔化边缘。

技术细节：图像“软分割”技术炼成大法

该方法最重要的是自动生成输入图像的软分割，也就是说，将输入图像分解成表示场景中对象的层，包括透明度和软过渡（soft transitions）。

图2：SSS方法的概述

如上图所示，对于输入图像，我们要生成每个像素的超维语义特征向量（hyperdimensional semantic feature vectors），并使用纹理和语义信息定义图形。图形构造使得相应的Laplacian矩阵及其特征向量揭示了语义对象和它们之间的软过渡（soft transitions）。

我们使用特征向量来构建一组初始的软分割（soft segments），并将它们组合起来得到语义上有意义的分割。最后，我们对soft segments进行细化，使其可用于目标图像编辑任务。

非局部颜色亲和性（Nonlocal Color Affinity）

我们定义了一个额外的 low-level affinity，表示基于颜色的长期交互。

这种亲和性（affinity）基本上确保了具有非常相似的颜色的区域在复杂场景结构中保持关联，其效果如下图所示。

高级语义亲和性（High-Level Semantic Affinity）

虽然非局部颜色亲和为分割过程增加了大范围的交互，但它仍然属于低级别特征。我们的实验表明，在没有附加信息的情况下，在分割中仍然会经常对不同对象的相似颜色的图像区域进行合并。

为了创建仅限于语义相似区域的分割片段，我们添加了一个语义关联项，对属于同一场景对象的像素进行分组，并尽量防止来自不同对象的像素的混杂。我们在目标识别领域的先前成果的基础上，在每个像素上计算与底层对象相关的特征向量。

我们还定义了超像素的语义亲和。除了增加线性系统的稀疏性之外，超像素的使用还减少了过渡区域中不可靠特征向量的负面影响，如图4所示。

图4. 不同处理流程效果比较。（a）仅使用Laplacian matting（b）结合使用Laplacian matting和语义分割（c）进一步利用稀疏颜色连接方法。

由于特征向量不能表示人与背景之间的语义切割，因此仅使用Laplacian matting会导致包括背景的大部分的人物分割片段突出显示。加入稀疏颜色连接可提供更清晰的前景遮景。

创建图层

我们使用前面描述的语义亲和来创建图层，得到Laplacian matrix L。我们要从该矩阵中提取特征向量，并使用两步稀疏化过程，利用这些特征向量创建图层。

图6.图像（a）显示了像素稀疏化之前（b）和之后（c）的结果。

如图所示，因为我们的结果（c）保留了头发周围的柔和过渡，而常数参数（d）则会导致过度稀疏的结果。

语义特征向量

图8.我们首先为给定图像生成每像素128维特征向量（图a）。图b表示128维到3维的随机投影。我们利用每个图像的主成分分析（c）将特征的维数减少到3。在降维之前，使用引导过滤器对特征进行边缘对齐。

更多技术细节，请阅读论文：

该论文由麻省理工学院副教授Wojciech Matusik、CSAIL博士后研究员Tae-Hyun Oh、Adobe Research的Sylvain Paris、以及苏黎世联邦理工学院和微软的Marc Pollefeys共同撰写。

论文地址：

http://cfg.mit.edu/sites/cfg.mit.edu/files/sss_3.pdf

未来可用于视频处理

SSS目前主要是处理静态图像。不过研究团队表示，未来可以预见将该技术用于视频处理，并将可能产生许多电影制作应用程序。

研究人员表示，他们的目的并不是解决一般的自然抠图问题。自然抠图是一个成熟的领域，面临许多特有的挑战，例如在非常相似颜色的前景和背景区域中生成精确的抠图结果。目前最先进的方法取决于两个区域的颜色分布。当目标颜色非常相似时，他们的方法可能在开始的约束稀疏化步骤中失败，或者基于大面积过渡区域建立了不可靠的语义特征向量，可能导致软分割的失败。

两个失败的例子

“我们想让抠图的过程变得更简单、快捷，让一般用户也可以更方便地进行图像编辑。“Aksoy说。“我们的目标是，只需点击一下鼠标，编辑就可以将图像组合在一起，打造出成熟、逼真的梦幻世界。”

Aksoy表示，目前SSS可供Instagram和Snapchat等社交平台使用，让图像过滤器的效果更加逼真，尤其是在更改自拍背景或模拟特定类型的相机时。在未来，研究人员计划进一步将处理图像所需的时间从几分钟降低到几秒，并通过提高系统匹配颜色和处理光照和阴影目标的能力，使图像看上去更加逼真。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4785

浏览量
101286
图像

图像

+关注

关注
2

文章
1089

浏览量
40605
深度学习

深度学习

+关注

关注
73

文章
5521

浏览量
121676

原文标题：该卸载PhotoShop了！MIT用AI实现3分钟自动抠图，精细到头发丝

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

基于深度学习的图像抠图领域应用及挑战

本文还整合了包括合成图像和真实图像在内的诸多图像抠图数据集，并在典型的数据集上对具有代表性的诸多方法进行了系统的实验和主客观结果评估。

发表于 04-20 09:29 •990次阅读

基于深度学习的<b class='flag-5'>图像</b><b class='flag-5'>抠</b><b class='flag-5'>图</b>领域应用及挑战

编辑图象如此简单，只需一步！

编辑图象如此简单，只需一步！咔咔艺术大师”是一款图像编辑软件，可以对

发表于 06-11 18:07

给照片轻松换背景（让ps更轻松）

，轻松换背景就是针对这一应用瓶颈而开发的。软件提供单色幕(蓝幕)法和内外轮廓法两种高级自动/半自动抠

发表于 09-19 10:00

专业的去背景抠图工具(Corel KnockOut 中文版)

;Verdana">专业的去背景抠图工具(Corel KnockOut 中文版)</font><br/>&

发表于 04-13 14:00

一种改进的矩不变自动阈值算法

摘要：提出了一种改进的矩不变自动阈值算法。该算法针对矩不变自动阈值法忽略图像细节的缺点，在矩不变自动阈值的基础上增加了基于目标边缘像素的梯度

发表于 08-24 16:22

图像其实是一种波，可以用波的算法处理图像

前几天读到一篇文章，它提到图像其实是一种波，可以用波的算法处理图像。我顿时有一种醍醐灌顶的感觉，

发表于 01-05 10:44 •1.1w次阅读

MIT研发基于AI助力的图像处理编辑工具

美国麻省理工学院的MIT计算机科学与人工智能实验室（MIT-CSAIL）开发出了基于人工智能助力的图像处理编辑工具，能够自动化进行对象选择，高效处理对象和毛发边缘的

发表于 08-24 15:01 •3112次阅读

MIT研发了人工智能助力的图像处理编辑工具

该工具能够应用AI技术将图片的主题对象人物和背景区分成不同区块，对比PS工具的繁琐操作，这些利用AI抠出的对象边缘清晰且自然，且细节保留的非

发表于 08-27 16:58 •4189次阅读

基于图像显著性识别的自动抠图系统设计

，对RC算法进行改进，并实现一个基于图像显著性识别的自动抠图系统，克服传统抠

发表于 06-09 16:36 •0次下载

金山办公上线AI新功能：创意抠图只需3秒，秒杀PS手动抠图！

下载最新版WPS即可体验该功能。抠图经常难倒职场小白。在我们在做PPT时，常常会遇到“人像照片的背景与PPT的背景格格不入”的情况，改变不了照片背

发表于 07-02 15:32 •771次阅读

EditGAN图像编辑框架将影响未来几代GAN的发展

　　此外， EditGAN 框架可能会影响未来几代 GAN 的发展。虽然当前版本的 EditGAN 侧重于图像编辑，但类似的方法也可能用于编辑 3D 形状和对象，这在为游戏、电影或 metaverse 创建虚拟 3D 内容时非常有用。

发表于 04-06 16:29 •1715次阅读

AI图像编辑技术DragGAN开源，拖动鼠标即可改变人物笑容

DragGAN是一个直观的图像编辑工具PM系统(www.multiable.com.cn)，用户只需要控制图像中的像素点和方向，就可以快速调

发表于 06-29 10:34 •1020次阅读

生成式 AI 研究通过引导式图像结构控制为创作者赋能

新的研究正在通过一个文本引导的图像编辑工具来提升生成式 AI 的创造性潜能。这项创新性的研究提出了一个使用即插即用扩散特征（PnP DFs）

发表于 07-24 19:30 •603次阅读

伯克利AI实验室开源图像编辑模型InstructPix2Pix，简化生成图像编辑并提供一致结果

之前的 AI 图像编辑能力通常是进行风格转换，流行的文本到图像生成模型（如 DALL-E 和 Stable Diffusion）也支持图像到图像

发表于 08-28 15:45 •927次阅读

字节发布SeedEdit图像编辑模型

，SeedEdit模型凭借其强大的技术实力，支持用户通过一句简单的自然语言描述，即可轻松实现对图像的多种编辑操作。无论是修图、换装、美化，还是转化风格、在指定区域添加或删除元素等复杂任

发表于 11-12 10:43 •374次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

一种AI辅助的图像编辑工具,可以自动抠图替换任何图像的背景

评论

基于深度学习的图像抠图领域应用及挑战

编辑图象如此简单，只需一步！

给照片轻松换背景（让ps更轻松）

专业的去背景抠图工具(Corel KnockOut 中文版)

一种改进的矩不变自动阈值算法

图像其实是一种波，可以用波的算法处理图像

MIT研发基于AI助力的图像处理编辑工具

MIT研发了人工智能助力的图像处理编辑工具

基于图像显著性识别的自动抠图系统设计

金山办公上线AI新功能：创意抠图只需3秒，秒杀PS手动抠图！

EditGAN图像编辑框架将影响未来几代GAN的发展

AI图像编辑技术DragGAN开源，拖动鼠标即可改变人物笑容

生成式 AI 研究通过引导式图像结构控制为创作者赋能

伯克利AI实验室开源图像编辑模型InstructPix2Pix，简化生成图像编辑并提供一致结果

字节发布SeedEdit图像编辑模型