一款工具，借助深度学习模型可以一键抠去漫画中的文字-电子发烧友网

漫画抠图是汉化组翻译中必不可少而又工作量很大的一项工作，主要内容是将漫画中的文字抠去，以便替换成另一种语言。现在，这项工作可以自动化地完成了，一位韩国的开发者开源了一款工具，借助深度学习模型可以一键抠去漫画中的文字，连背景图中的文字都可以被抠去，效果十分惊人。

很多人都喜欢看日本漫画，不少作品已经成为很多人心中的童年回忆。但是对于漫画的翻译人员来说，他们需要去除原有漫画的对话框和背景文字，并将其替换为读者使用的语言。由于一本漫画可能有数万个对话框和对话，因此工作量是很大的。

现在，抠图的工作人员可以基本上解放他们的双手了。只要你有 TensorFlow，就可以快速实现一键抠图，将漫画图像中的所有文字一键去除。

SickZil-Machine，一键抠图

SickZil 是韩文中的作者提供了一个视频，用于展示这一工具的效果。

作者同时提供了自动工具抠图的案例。

对话框中的文字可以被完全消除。

有时候会有些文字消除不干净的情况，但基本不影响画面（漫画右上角标题符号）。同时，背景中被去掉文字后，背景画面可以被自动补全，基本不改变画面效果（画面右上角背景文字）。

从视频中可以看出，这一工具非常的方便。只需要选择待处理的漫画，然后运行工具即可。如果有一些画面被误去除，或者有一些去除不干净的情况下，用户可以手动修改需要被去除的文字。

那么，这一工具背后是什么技术呢？

技术

模型架构

据项目作者介绍，这一工具背后使用了两个模型，第一个是 Seg Net，用于检测漫画中的问题。另一个则是 Compl Net，用于处理漫画图像，去除文字并补全缺失的图像部分。

Seg Net 使用的是 U-NET。这是一种编码器-解码器架构。编码器逐渐减少池化层的空间维度，解码器逐步修复物体的细节和空间维度。

U-Net 的架构，将输入图像逐步池化后进行上采样，从而还原图像细节。

而 Compl Net 使用的是 deepfill v2，这是一个用于对任意被 mask 的图像进行修复的模型，可以适应各种 mask 的方式（块状遮盖或线条遮盖都可以）。deepfill 是 Adobe 等机构提出一系列图像修复工具，机器之心也曾用过 deepfill v1，但是效果似乎没有论文展示的那么好。

目前 deepfill v2 并没有官方开源，但 GitHub 上有其他开发者复现。

deepfill v2 的模型架构，可以进行图像修复。

有了这两大神器，基本上可以实现漫画文字的检测识别和去除文本后的图像补全。

数据集和训练

有了模型还不够，很多读者想知道，整个系统是怎样训练的。

在 Seg Net 上，作者使用了原始的漫画图像和文本内容遮盖数据，用于覆盖原始漫画中所有的文字部分。在 Compl Net 上，模型的输入为被移除了文字的漫画图像。模型使用了 285 个图像-遮盖对和 31500 张漫画图像，其中有将近 12000 张漫画是有文字的，因此训练的数据比较平衡。

安装和使用

作者没有透露训练模型的相关参数，但是提供了开发者需要准备的硬件配置。对于开发者而言，运行代码需要准备 NVIDIA 驱动 410.x，CUDA 10.0，CUDNN >= 7.4.1，TensorFlow 需要大于 1.13 版本。

配置代码步骤如下：

首先克隆相关代码：git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下载 zip 文件，地址：https://github.com/KUR-creative/SickZil-Machine/releases。

解压并复制文件：SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目录：SickZil-Machine/resource.

进入目录并安装：pip install -r requirements.txt

运行主程序：cd src; python main.py

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3140

浏览量
48670
代码

代码

+关注

关注
30

文章
4733

浏览量
68277
深度学习

深度学习

+关注

关注
73

文章
5485

浏览量
120928

原文标题：漫画汉化组福音：深度学习工具一键抠图

文章出处：【微信号：almosthuman2014，微信公众号：机器之心】欢迎添加关注！文章转载请注明出处。

在中压开关柜上使用微机五防锁是否可以实现一键顺控

蜀瑞创新为大家科普：虽然微机五防锁是实现“一键顺控”的重要组成部分之一，但它本身并不能单独完成整个过程。需要结合其他自动化控制技术和设备，以及合适的软件平台来实现真正的“一键顺控”。

发表于 11-06 11:58 •46次阅读

在中压开关柜上使用微机五防锁是否<b class='flag-5'>可以</b>实现<b class='flag-5'>一键</b>顺控

FPGA加速深度学习模型的案例

FPGA（现场可编程门阵列）加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速

发表于 10-25 09:22 •121次阅读

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度

发表于 10-23 15:25 •337次阅读

开关柜可视化和一键顺控可以结合一起吗？

蜀瑞创新为大家科普：开关柜可视化与一键顺控系统的结合，可以进一步增强电力系统的智能化管理水平。这种结合主要体现在以下几个方面：

发表于 10-14 09:38 •126次阅读

一键断电开关的种类有哪些

一键断电开关的种类主要可以从其功能和实现方式上进行分类。以下是一些常见的一键断电开关种类： 1. 继电器式一键断电开关定义：这种开关通过

发表于 09-13 16:45 •670次阅读

一键断电开关的控制原理是什么

一键断电开关，也被称为紧急断电开关或紧急停止开关，是一种安全装置，用于在紧急情况下迅速切断电源，以防止事故的发生或扩大。这种开关的设计和应用在工业、实验室、医疗设备以及任何需要快速断电的场合都

发表于 09-13 16:28 •704次阅读

OOTDiffusion整合包一键AI换装, 免费生成高端服装模特照! 电商必备省钱工具！

保姆级OOTDiffusion换装教程，小白也能迅速上手提供免费学习工具，学习期内无限制使用，24小时畅通服务；工具简单，三步玩转AI换装，视频教程+1对1辅导；

发表于 08-09 20:06 •412次阅读

变电站一键顺控系统和开关柜一键顺控有区别吗？

变电站一键顺控系统和开关柜一键顺控技术虽然都涉及到“一键顺控”的概念，但它们在应用范围和具体实现上有所不同，因此变电站一键顺控系统和开关柜一键

发表于 07-31 13:34 •427次阅读

深度学习中的模型权重

在深度学习这一充满无限可能性的领域中，模型权重（Weights）作为其核心组成部分，扮演着至关重要的角色。它们不仅是模型

发表于 07-04 11:49 •869次阅读

2021款路虎揽胜运动版车遥控及一键起动功能失效

2021款路虎揽胜运动版车遥控及一键起动功能失效蔡永福故障现象故障诊断故障排除一辆2021款路虎揽胜运动版车，搭载AJ20-P6H3L发动机，累计行驶里程约为2.5万km。车主反映，使

发表于 07-04 08:09 •371次阅读

宝塔面板Docker一键安装：部署GPTAcademic，开发私有GPT学术优化工具

人工智能的浪潮中，GPT模型因其强大的自然语言处理能力备受瞩目。然而，为了更好地应用于学术领域，许多人希望能部署自己私有的GPT学术优化工具。本文将详细介绍如何通过宝塔面板和Docker一键安装

发表于 07-02 11:58 •2416次阅读

深度学习模型训练过程详解

深度学习模型训练是一个复杂且关键的过程，它涉及大量的数据、计算资源和精心设计的算法。训练一个深度

发表于 07-01 16:13 •1045次阅读

一键闪测仪使用时的注意事项有哪些？

中图仪器VX系列一键闪测仪采用双远心高分辨率光学镜头，结合高精度图像分析算法，并融入一键闪测原理，可以对工件平面的点、线、圆等基本元素作精密测量，测量精度高，并且操作简单、性能优良稳定。

发表于 12-13 09:28 •794次阅读

一键动态切换IP脚本

T*o*r*Proxy一键搭建动态代*理，通过利用T*o*r搭建Socks5代*理，最终实现动态切换IP的效果。

发表于 12-08 10:25 •1011次阅读

Neuro-T：零代码自动深度学习训练平台

友思特 Neuro-T为传统的深度学习视觉检测方案提供了“自动深度学习”的解决方案，结合自动标注功能，一键生成高性能视觉检测

发表于 11-24 17:58 •572次阅读