搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

根据颜色自动生成标识的LoGAN模型

标识设计是一个费时费力的过程。而最近生成式模型领域进展飞速，这就让人好奇AI可不可以用来设计标识？生成对抗网络（GAN）据说能够学习模拟任何数据分布，已经取得了广泛的应用，但目前很少有人研究如何用GAN来设计标识。年底召开的ICMLA 2018上有一篇论文，马斯特里赫特大学的Ajkel Mino和Gerasimos Spanakis，提出了根据颜色自动生成标识的LoGAN模型，可以说是这一方向上的初步探索。

LoGAN架构

GAN

在介绍LoGAN架构之前，先温习下GAN网络。

GAN由生成器和判别器两个神经网络组成，以对抗的形式同时训练。

GAN是出名的难训练，饱受训练不稳定、无法收敛、模式崩塌之苦。近年来有不少研究都试图改进GAN的训练过程，例如在GAN中引入深度卷积层（DCGAN），修改目标函数（LSGAN和WGAN）。

条件GAN

如前所述，LoGAN是根据颜色自动生成标识，换句话说，是以颜色为条件。能够基于标签数据生成特定分类的图像的GAN架构，主要有两种：

CGAN，生成器和判别器都额外接受一个类别标签数据。

AC-GAN，判别器不仅需要识别图像的真伪，还需要判断图像的类别（不论真伪）。

GAN、CGAN、AC-GAN架构对比

LoGAN即基于AC-GAN改造得到。

AC-WGAN-GP

在AC-GAN架构中（参见上图），判别器同时优化真伪误差和类别误差：

不过，考虑到WGAN-GP更稳定，所以LoGAN用WGAN-GP的损失函数替换了AC-GAN的损失函数：

但是这就造成了一个问题，类别损失没有了。所以，LoGAN在AC-GAN的基础上额外增加了一个分类器Q，辅助判别器进行分类。也就是说，和AC-GAN不同，LoGAN由三个网络组成：生成器G、判别器D、分类器Q。

经过改造的AC-GAN

分类器Q的损失函数定义如下：

为了避免训练不稳和模式崩塌，LoGAN的训练借鉴了一些最新研究成果，采取了以下措施：

判别器每迭代5次，分别迭代一次生成器和分类器。

z取样自高斯分布。

应用了批归一化。

试验

数据集

LoGAN基于LLD-icons数据集训练，该数据集包含486377张32×32像素的图标。

使用了K均值聚类（k = 3）从图像中提取主要色彩，然后分为黑、蓝、棕等12类：

训练

下为判别器、生成器、分类器的训练损失图像。

从图中我们可以看到，判别器和生成器的损失图像有下降趋势，没有收敛。不过这并不意味着训练有问题，因为WGAN和WGAN-GP都不保证收敛。另一方面，分类器收敛至接近1的损失值。实际上，生成图像的分类损失收敛至零，这意味着生成图像都能被正确分类。

结果

400个epoch的训练后，每个分类生成了64个标识：

由于是在32×32像素的图标上训练的，所以生成的标识有点模糊。生成的标识大多为圆形或方形，但也有不规则形状，如心形和X形。

各个分类主要颜色的准确率、召回、F1数据如下表所示：

有些分类的评分偏低，这是因为很多图标周围使用白色作为背景，同理，灰色作为中性色，也有很多图标使用。

各分类主要颜色分布

改进方向

尽管取得了很有潜力的结果，LoGAN目前还是有不少限制：

对抗生成网络的常见问题，生成的标识很模糊。使用分辨率更高的训练图像应该能缓解这一问题。

仅仅使用颜色作为关键词局限性太大。未来考虑加入形状、公司的重心等其他关键词。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

GaN

GaN

+关注

关注
19

文章
1943

浏览量
73597
生成器

生成器

+关注

关注
7

文章
316

浏览量
21043

原文标题：LoGAN：根据颜色自动生成标识

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

基于模型设计和自动代码生成的一些书籍

基于模型设计和自动代码生成的一些书籍链接：链接：http://pan.baidu.com/s/1c29mQp6 密码：g1iy

发表于 12-15 12:19

multisim可以根据逻辑函数自动生成逻辑图吗？

multisim可以根据逻辑函数自动生成逻辑图吗？

发表于 05-01 22:29

基于模型设计的HDL代码自动生成技术综述

摘要：在调研近几年基于模型设计的HDL代码自动生成技术相关工具及工程应用情况的基础上，从HDL代码自动生成的技术角度分析了基于

发表于 06-08 09:29

为什么生成模型值得研究

1.Why study generative modeling? 人们可能很自然地想知道为什么生成模型值得研究，尤其是那些只能够生成数据而不能提供密度函数估计的生成

发表于 09-15 06:03

Simulink 自动代码生成原理分享

多出来一些目标系统可以选择。自定义目标系统是为了让Simulink生成的代码能根据用户的需要，与底层驱动做集成。我们首先需要了解Simulink目标编译的流程，如下图，Simulink模型会先变成一个

发表于 05-31 11:19

CRC校验代码自动生成工具

CRC校验代码自动生成工具根据输入条件自动产生各种CRC的VHDL或verilog源程序

发表于 05-20 11:16 •294次下载

CRC校验代码<b class='flag-5'>自动</b><b class='flag-5'>生成</b>工具

自动标识灯电路

自动标识灯电路

发表于 08-27 15:07 •736次阅读

<b class='flag-5'>自动</b><b class='flag-5'>标识</b>灯电路

基于颜色和区域的运动目标识别

针对全自主足球机器人目标识别受光强变化的影响, 实时性、准确性和鲁棒性存在的不足, 提出了一种基于动态窗口HSI 色彩空间模型的阈值向量位与及区域合并算法, 并通过动态窗口减小

发表于 06-28 15:36 •34次下载

基于<b class='flag-5'>颜色</b>和区域的运动目<b class='flag-5'>标识</b>别

OpenAI最新提出的可逆生成模型Glow

low是一种可逆生成模型（reversible generative model），也被称为基于流的生成模型（flow-based generative model）。目前，学界还很少

的头像

发表于 07-11 09:46 •7314次阅读

机器视觉中图像前置知识颜色模型的分类与应用

RGB颜色模型(也叫红、绿、蓝三原色模型或者加色混色模型)：将红、绿、蓝3种不同颜色，根据亮度配

的头像

发表于 06-11 09:02 •5160次阅读

机器视觉中图像前置知识<b class='flag-5'>颜色</b><b class='flag-5'>模型</b>的分类与应用

AN-715: 走近IBIS模型：什么是IBIS模型？它们是如何生成的？

AN-715: 走近IBIS模型：什么是IBIS模型？它们是如何生成的？

发表于 03-21 13:59 •10次下载

AN-715: 走近IBIS<b class='flag-5'>模型</b>：什么是IBIS<b class='flag-5'>模型</b>？它们是如何<b class='flag-5'>生成</b>的？

安全关键系统的扩展SysML模型自动生成

安全关键系统的扩展SysML模型自动生成

发表于 06-09 14:38 •3次下载

c语言代码自动生成工具,MCU代码自动生成工具介绍

自动生成服务。云端会根据产品定义的数据点生成对应产品的设备端代码。自动生成的代码实现了机智云通信

发表于 10-28 17:36 •8次下载

c语言代码<b class='flag-5'>自动</b><b class='flag-5'>生成</b>工具,MCU代码<b class='flag-5'>自动</b><b class='flag-5'>生成</b>工具介绍

从HumanEval到CoderEval: 你的代码生成模型真的work吗？

项目中的选取了代码生成任务来构建CoderEval，并根据对外部依赖的程度为标准将这些任务分为6个等级、根据生成的目标分为3类生成任务，以更

的头像

发表于 11-25 15:55 •1871次阅读

从HumanEval到CoderEval: 你的代码<b class='flag-5'>生成</b><b class='flag-5'>模型</b>真的work吗？

谷歌发布全新视频生成模型Veo与Imagen文生图模型

谷歌近日宣布了两项重大技术进展，首先是视频生成模型Veo的正式推出。这款先进的模型能够支持生成质量更高的视频内容，让用户能够根据自己的需求设

的头像

发表于 05-16 10:46 •404次阅读