0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一款工具,借助深度学习模型可以一键抠去漫画中的文字

m3Fp_almosthuma 来源:机器之心 2020-01-27 11:12 次阅读

漫画抠图是汉化组翻译中必不可少而又工作量很大的一项工作,主要内容是将漫画中的文字抠去,以便替换成另一种语言。现在,这项工作可以自动化地完成了,一位韩国的开发者开源了一款工具,借助深度学习模型可以一键抠去漫画中的文字,连背景图中的文字都可以被抠去,效果十分惊人。

很多人都喜欢看日本漫画,不少作品已经成为很多人心中的童年回忆。但是对于漫画的翻译人员来说,他们需要去除原有漫画的对话框和背景文字,并将其替换为读者使用的语言。由于一本漫画可能有数万个对话框和对话,因此工作量是很大的。

现在,抠图的工作人员可以基本上解放他们的双手了。只要你有 TensorFlow,就可以快速实现一键抠图,将漫画图像中的所有文字一键去除。

SickZil-Machine,一键抠图

SickZil 是韩文中的作者提供了一个视频,用于展示这一工具的效果。

作者同时提供了自动工具抠图的案例。

对话框中的文字可以被完全消除。

有时候会有些文字消除不干净的情况,但基本不影响画面(漫画右上角标题符号)。同时,背景中被去掉文字后,背景画面可以被自动补全,基本不改变画面效果(画面右上角背景文字)。

从视频中可以看出,这一工具非常的方便。只需要选择待处理的漫画,然后运行工具即可。如果有一些画面被误去除,或者有一些去除不干净的情况下,用户可以手动修改需要被去除的文字。

那么,这一工具背后是什么技术呢?

技术

模型架构

据项目作者介绍,这一工具背后使用了两个模型,第一个是 Seg Net,用于检测漫画中的问题。另一个则是 Compl Net,用于处理漫画图像,去除文字并补全缺失的图像部分。

Seg Net 使用的是 U-NET。这是一种编码器-解码器架构。编码器逐渐减少池化层的空间维度,解码器逐步修复物体的细节和空间维度。

U-Net 的架构,将输入图像逐步池化后进行上采样,从而还原图像细节。

而 Compl Net 使用的是 deepfill v2,这是一个用于对任意被 mask 的图像进行修复的模型,可以适应各种 mask 的方式(块状遮盖或线条遮盖都可以)。deepfill 是 Adobe 等机构提出一系列图像修复工具,机器之心也曾用过 deepfill v1,但是效果似乎没有论文展示的那么好。

目前 deepfill v2 并没有官方开源,但 GitHub 上有其他开发者复现。

deepfill v2 的模型架构,可以进行图像修复。

有了这两大神器,基本上可以实现漫画文字的检测识别和去除文本后的图像补全。

数据集和训练

有了模型还不够,很多读者想知道,整个系统是怎样训练的。

在 Seg Net 上,作者使用了原始的漫画图像和文本内容遮盖数据,用于覆盖原始漫画中所有的文字部分。在 Compl Net 上,模型的输入为被移除了文字的漫画图像。模型使用了 285 个图像-遮盖对和 31500 张漫画图像,其中有将近 12000 张漫画是有文字的,因此训练的数据比较平衡。

安装和使用

作者没有透露训练模型的相关参数,但是提供了开发者需要准备的硬件配置。 对于开发者而言,运行代码需要准备 NVIDIA 驱动 410.x,CUDA 10.0,CUDNN >= 7.4.1,TensorFlow 需要大于 1.13 版本。

配置代码步骤如下:

首先克隆相关代码:git clone https://github.com/KUR-creative/SickZil-Machine.git; cd SickZil-Machine

下载 zip 文件,地址:https://github.com/KUR-creative/SickZil-Machine/releases。

解压并复制文件:SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/cnet 和 SickZil-Machine-0.1.1-pre0-win64-cpu-eng/resource/snet 到文件目录:SickZil-Machine/resource.

进入目录并安装:pip install -r requirements.txt

运行主程序:cd src; python main.py

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3140

    浏览量

    48670
  • 代码
    +关注

    关注

    30

    文章

    4733

    浏览量

    68277
  • 深度学习
    +关注

    关注

    73

    文章

    5485

    浏览量

    120928

原文标题:漫画汉化组福音:深度学习工具一键抠图

文章出处:【微信号:almosthuman2014,微信公众号:机器之心】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    在中压开关柜上使用微机五防锁是否可以实现一键顺控

    蜀瑞创新为大家科普:虽然微机五防锁是实现“一键顺控”的重要组成部分之,但它本身并不能单独完成整个过程。需要结合其他自动化控制技术和设备,以及合适的软件平台来实现真正的“一键顺控”。
    的头像 发表于 11-06 11:58 46次阅读
    在中压开关柜上使用微机五防锁是否<b class='flag-5'>可以</b>实现<b class='flag-5'>一键</b>顺控

    FPGA加速深度学习模型的案例

    FPGA(现场可编程门阵列)加速深度学习模型是当前硬件加速领域的个热门研究方向。以下是些FPGA加速
    的头像 发表于 10-25 09:22 121次阅读

    AI大模型深度学习的关系

    AI大模型深度学习之间存在着密不可分的关系,它们互为促进,相辅相成。以下是对两者关系的介绍: 深度
    的头像 发表于 10-23 15:25 337次阅读

    开关柜可视化和一键顺控可以结合起吗?

    蜀瑞创新为大家科普:开关柜可视化与一键顺控系统的结合,可以步增强电力系统的智能化管理水平。这种结合主要体现在以下几个方面:
    的头像 发表于 10-14 09:38 126次阅读
    开关柜可视化和<b class='flag-5'>一键</b>顺控<b class='flag-5'>可以</b>结合<b class='flag-5'>一</b>起吗?

    一键断电开关的种类有哪些

    一键断电开关的种类主要可以从其功能和实现方式上进行分类。以下是些常见的一键断电开关种类: 1. 继电器式一键断电开关 定义 :这种开关通过
    的头像 发表于 09-13 16:45 670次阅读

    一键断电开关的控制原理是什么

    一键断电开关,也被称为紧急断电开关或紧急停止开关,是种安全装置,用于在紧急情况下迅速切断电源,以防止事故的发生或扩大。这种开关的设计和应用在工业、实验室、医疗设备以及任何需要快速断电的场合都
    的头像 发表于 09-13 16:28 704次阅读

    OOTDiffusion整合包一键AI换装, 免费生成高端服装模特照! 电商必备省钱工具

    保姆级OOTDiffusion换装教程,小白也能迅速上手 提供免费学习工具学习期内无限制使用,24小时畅通服务; 工具简单,三步玩转AI换装,视频教程+1对1辅导;
    的头像 发表于 08-09 20:06 412次阅读
    OOTDiffusion整合包<b class='flag-5'>一键</b>AI换装, 免费生成高端服装模特照! 电商必备省钱<b class='flag-5'>工具</b>!

    变电站一键顺控系统和开关柜一键顺控有区别吗?

    变电站一键顺控系统和开关柜一键顺控技术虽然都涉及到“一键顺控”的概念,但它们在应用范围和具体实现上有所不同,因此变电站一键顺控系统和开关柜一键
    的头像 发表于 07-31 13:34 427次阅读
    变电站<b class='flag-5'>一键</b>顺控系统和开关柜<b class='flag-5'>一键</b>顺控有区别吗?

    深度学习中的模型权重

    深度学习充满无限可能性的领域中,模型权重(Weights)作为其核心组成部分,扮演着至关重要的角色。它们不仅是模型
    的头像 发表于 07-04 11:49 869次阅读

    2021路虎揽胜运动版车遥控及一键起动功能失效

    2021路虎揽胜运动版车遥控及一键起动功能失效蔡永福故障现象故障诊断故障排除辆2021路虎揽胜运动版车,搭载AJ20-P6H3L发动机,累计行驶里程约为2.5万km。车主反映,使
    的头像 发表于 07-04 08:09 371次阅读
    2021<b class='flag-5'>款</b>路虎揽胜运动版车遥控及<b class='flag-5'>一键</b>起动功能失效

    宝塔面板Docker一键安装:部署GPTAcademic,开发私有GPT学术优化工具

    人工智能的浪潮中,GPT模型因其强大的自然语言处理能力备受瞩目。然而,为了更好地应用于学术领域,许多人希望能部署自己私有的GPT学术优化工具。本文将详细介绍如何通过宝塔面板和Docker一键安装
    的头像 发表于 07-02 11:58 2416次阅读
    宝塔面板Docker<b class='flag-5'>一键</b>安装:部署GPTAcademic,开发私有GPT学术优化<b class='flag-5'>工具</b>

    深度学习模型训练过程详解

    深度学习模型训练是个复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。训练深度
    的头像 发表于 07-01 16:13 1045次阅读

    一键闪测仪使用时的注意事项有哪些?

    中图仪器VX系列一键闪测仪采用双远心高分辨率光学镜头,结合高精度图像分析算法,并融入一键闪测原理,可以对工件平面的点、线、圆等基本元素作精密测量,测量精度高,并且操作简单、性能优良稳定。
    的头像 发表于 12-13 09:28 794次阅读
    <b class='flag-5'>一键</b>闪测仪使用时的注意事项有哪些?

    一键动态切换IP脚本

    T*o*r*Proxy一键搭建动态代*理,通过利用T*o*r搭建Socks5代*理,最终实现动态切换IP的效果。
    的头像 发表于 12-08 10:25 1011次阅读
    <b class='flag-5'>一键</b>动态切换IP脚本

    Neuro-T:零代码自动深度学习训练平台

    友思特 Neuro-T为传统的深度学习视觉检测方案提供了“自动深度学习”的解决方案,结合自动标注功能,一键生成高性能视觉检测
    的头像 发表于 11-24 17:58 572次阅读
    Neuro-T:零代码自动<b class='flag-5'>深度</b><b class='flag-5'>学习</b>训练平台