还记得前些日子轰动一时的 BigGAN 模型吗?生成对抗网络(GAN)作为当前最热门的技术之一,最近在图像生成方面的成果颇受人关注。近日,由 DeepMind 和赫瑞瓦特大学组成的科研人员公布的 BigGAN 模型,被称为“史上最强 GAN 生成器”,可合成食物照片、风景肖像和动物照片,其图片效果十分逼真,在 ImageNet 的测评集上从之前的最高分 52.52 提升到 66.3,效果提升非常显著。
由BigGAN模型生成的类条件样本(图片截取自论文)
目前 ICLR 2019 的论文评审结果于上周刚刚公布,其中就包括 BigGAN 模型的这篇论文“Large Scale GAN Training for High Fidelity Natural Image Synthesis”,现已挂在 arXiv 上。BigGAN 获得了三位评审 8 分、7 分和 10 分的评价,详情参看:https://openreview.net/forum?id=B1xsqj09Fm
简单解释下,之所以称为 BigGAN,引用合肥工业大学研究生武广的话来讲,主要归于三点:
一是 Batch Size 的增大,二是采用先验分布 z 的“截断技巧”,三是对模型稳定性的控制。
如在训练中每批 Batch 就有 2048 张照片(通常情况下都是 64 张),用于控制模型部分特性的算法控制器参数是此前其他模型的 4 倍,近 1.58 亿。
为方便开发者练习和使用,DeepMind 今天又公开了 BigGAN 的 TensorFlow Hub,顺带还提供了在 Colab 上的 demo,开发者可以在 Colab 上运行图像生成和插值任务。
链接:https://tfhub.dev/deepmind/biggan-256
▌如何使用 Colab demo?
首先,你得打开 Colab,登录 Google 账户。
注意:这是一个完全运行在云端的环境,开发者可以使用 Keras、TensorFlow、PyTorch 等框架进行深度学习应用的开发,尤其适合那些手头没有 GPU 资源的初学者。
第一步:设置
1.1 从 TF Hub 中下载 BigGAN 生成器模组
1.2 定义 BigGAN 图像分类及展示功能
1.3 创建 TensorFlow 会话,并初始化变量
第二步:搜索特定类别的 BigGAN 样本
类条件抽样
第三步:在 BigGAN 样本之间插值
插值
-
控制器
+关注
关注
112文章
16185浏览量
177335 -
GaN
+关注
关注
19文章
1917浏览量
72942 -
生成器
+关注
关注
7文章
313浏览量
20973
原文标题:“史上最强”BigGAN公开TensorFlow Hub demo!
文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论