0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

根据颜色自动生成标识的LoGAN模型

zhKF_jqr_AI 来源:未知 作者:李倩 2018-11-05 15:10 次阅读

标识设计是一个费时费力的过程。而最近生成式模型领域进展飞速,这就让人好奇AI可不可以用来设计标识?生成对抗网络(GAN)据说能够学习模拟任何数据分布,已经取得了广泛的应用,但目前很少有人研究如何用GAN来设计标识。年底召开的ICMLA 2018上有一篇论文,马斯特里赫特大学的Ajkel Mino和Gerasimos Spanakis,提出了根据颜色自动生成标识的LoGAN模型,可以说是这一方向上的初步探索。

LoGAN架构

GAN

在介绍LoGAN架构之前,先温习下GAN网络。

GAN由生成器和判别器两个神经网络组成,以对抗的形式同时训练。

GAN是出名的难训练,饱受训练不稳定、无法收敛、模式崩塌之苦。近年来有不少研究都试图改进GAN的训练过程,例如在GAN中引入深度卷积层(DCGAN),修改目标函数(LSGAN和WGAN)。

条件GAN

如前所述,LoGAN是根据颜色自动生成标识,换句话说,是以颜色为条件。能够基于标签数据生成特定分类的图像的GAN架构,主要有两种:

CGAN,生成器和判别器都额外接受一个类别标签数据。

AC-GAN,判别器不仅需要识别图像的真伪,还需要判断图像的类别(不论真伪)。

GAN、CGAN、AC-GAN架构对比

LoGAN即基于AC-GAN改造得到。

AC-WGAN-GP

在AC-GAN架构中(参见上图),判别器同时优化真伪误差和类别误差:

不过,考虑到WGAN-GP更稳定,所以LoGAN用WGAN-GP的损失函数替换了AC-GAN的损失函数:

但是这就造成了一个问题,类别损失没有了。所以,LoGAN在AC-GAN的基础上额外增加了一个分类器Q,辅助判别器进行分类。也就是说,和AC-GAN不同,LoGAN由三个网络组成:生成器G、判别器D、分类器Q。

经过改造的AC-GAN

分类器Q的损失函数定义如下:

为了避免训练不稳和模式崩塌,LoGAN的训练借鉴了一些最新研究成果,采取了以下措施:

判别器每迭代5次,分别迭代一次生成器和分类器。

z取样自高斯分布。

应用了批归一化。

试验

数据集

LoGAN基于LLD-icons数据集训练,该数据集包含486377张32×32像素的图标。

使用了K均值聚类(k = 3)从图像中提取主要色彩,然后分为黑、蓝、棕等12类:

训练

下为判别器、生成器、分类器的训练损失图像。

从图中我们可以看到,判别器和生成器的损失图像有下降趋势,没有收敛。不过这并不意味着训练有问题,因为WGAN和WGAN-GP都不保证收敛。另一方面,分类器收敛至接近1的损失值。实际上,生成图像的分类损失收敛至零,这意味着生成图像都能被正确分类。

结果

400个epoch的训练后,每个分类生成了64个标识:

由于是在32×32像素的图标上训练的,所以生成的标识有点模糊。生成的标识大多为圆形或方形,但也有不规则形状,如心形和X形。

各个分类主要颜色的准确率、召回、F1数据如下表所示:

有些分类的评分偏低,这是因为很多图标周围使用白色作为背景,同理,灰色作为中性色,也有很多图标使用。

各分类主要颜色分布

改进方向

尽管取得了很有潜力的结果,LoGAN目前还是有不少限制:

对抗生成网络的常见问题,生成的标识很模糊。使用分辨率更高的训练图像应该能缓解这一问题。

仅仅使用颜色作为关键词局限性太大。未来考虑加入形状、公司的重心等其他关键词。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1922

    浏览量

    73161
  • 生成器
    +关注

    关注

    7

    文章

    314

    浏览量

    20987

原文标题:LoGAN:根据颜色自动生成标识

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于模型设计和自动代码生成的一些书籍

    基于模型设计和自动代码生成的一些书籍链接:链接:http://pan.baidu.com/s/1c29mQp6 密码:g1iy
    发表于 12-15 12:19

    multisim可以根据逻辑函数自动生成逻辑图吗?

    multisim可以根据逻辑函数自动生成逻辑图吗?
    发表于 05-01 22:29

    基于模型设计的HDL代码自动生成技术综述

    摘要:在调研近几年基于模型设计的HDL代码自动生成技术相关工具及工程应用情况的基础上,从HDL代码自动生成的技术角度分析了基于
    发表于 06-08 09:29

    为什么生成模型值得研究

    1.Why study generative modeling? 人们可能很自然地想知道为什么生成模型值得研究,尤其是那些只能够生成数据而不能提供密度函数估计的生成
    发表于 09-15 06:03

    Simulink 自动代码生成原理分享

    多出来一些目标系统可以选择。自定义目标系统是为了让Simulink生成的代码能根据用户的需要,与底层驱动做集成。我们首先需要了解Simulink目标编译的流程,如下图,Simulink模型会先变成一个
    发表于 05-31 11:19

    CRC校验代码自动生成工具

    CRC校验代码自动生成工具根据输入条件自动产生各种CRC的VHDL或verilog源程序
    发表于 05-20 11:16 294次下载
    CRC校验代码<b class='flag-5'>自动</b><b class='flag-5'>生成</b>工具

    自动标识灯电路

    自动标识灯电路
    发表于 08-27 15:07 720次阅读
    <b class='flag-5'>自动</b><b class='flag-5'>标识</b>灯电路

    基于颜色和区域的运动目标识

    针对全自主足球机器人目标识别受光强变化的影响, 实时性、准确性和鲁棒性存在的不足, 提出了一种基于动态窗口HSI 色彩空间模型的阈值向量位与及区域合并算法, 并通过动态窗口减小
    发表于 06-28 15:36 34次下载
    基于<b class='flag-5'>颜色</b>和区域的运动目<b class='flag-5'>标识</b>别

    OpenAI最新提出的可逆生成模型Glow

    low是一种可逆生成模型(reversible generative model),也被称为基于流的生成模型(flow-based generative model)。目前,学界还很少
    的头像 发表于 07-11 09:46 7285次阅读

    机器视觉中图像前置知识颜色模型的分类与应用

    RGB颜色模型(也叫红、绿、蓝三原色模型或者加色混色模型):将红、绿、蓝3种不同颜色根据亮度配
    的头像 发表于 06-11 09:02 5064次阅读
    机器视觉中图像前置知识<b class='flag-5'>颜色</b><b class='flag-5'>模型</b>的分类与应用

    AN-715: 走近IBIS模型:什么是IBIS模型?它们是如何生成的?

    AN-715: 走近IBIS模型:什么是IBIS模型?它们是如何生成的?
    发表于 03-21 13:59 10次下载
    AN-715: 走近IBIS<b class='flag-5'>模型</b>:什么是IBIS<b class='flag-5'>模型</b>?它们是如何<b class='flag-5'>生成</b>的?

    安全关键系统的扩展SysML模型自动生成

    安全关键系统的扩展SysML模型自动生成
    发表于 06-09 14:38 3次下载

    c语言代码自动生成工具,MCU代码自动生成工具介绍

    自动生成服务。云端会根据产品定义的数据点生成对应产品的设备端代码。自动生成的代码实现了机智云通信
    发表于 10-28 17:36 8次下载
    c语言代码<b class='flag-5'>自动</b><b class='flag-5'>生成</b>工具,MCU代码<b class='flag-5'>自动</b><b class='flag-5'>生成</b>工具介绍

    从HumanEval到CoderEval: 你的代码生成模型真的work吗?

    项目中的选取了代码生成任务来构建CoderEval,并根据对外部依赖的程度为标准将这些任务分为6个等级、根据生成的目标分为3类生成任务,以更
    的头像 发表于 11-25 15:55 1700次阅读
    从HumanEval到CoderEval: 你的代码<b class='flag-5'>生成</b><b class='flag-5'>模型</b>真的work吗?

    谷歌发布全新视频生成模型Veo与Imagen文生图模型

    谷歌近日宣布了两项重大技术进展,首先是视频生成模型Veo的正式推出。这款先进的模型能够支持生成质量更高的视频内容,让用户能够根据自己的需求设
    的头像 发表于 05-16 10:46 372次阅读