0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用浮世绘人脸图像的数据集来训练StyleGAN模型

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2020-12-07 13:56 次阅读

作为我的论文《基于分辨率的GAN插值用于域间的可控图像合成》的一部分,我使用浮世绘人脸图像的数据集来训练StyleGAN模型,本文包含该数据集的链接和该数据集的详细信息

更新

V2 - 删除了28张质量不好的图像(对准不良或没有正面)。

V1 - 最初发行的版本,被使用在与分辨率相关的GAN插值的论文中,用于域之间的可控图像合成。

数据集 浮世绘人脸数据集包含来自浮世绘照片的5209张脸部图像。图像像素为1024x1024、jpeg格式,并已根据FFHQ数据集所使用的过程进行对齐。上面是数据集中(几乎)所有图像的地图,对图像进行了绘制,以使相似的面孔看起来靠近在一起[2]。为了便于显示, 图像已缩小为256x256。 细节 图片是从数个博物馆网站上下載来的,然后我使用Amazon Rekognition尝试从每个图片中检测面部和面部标志。Rekognition在这两个任务上都做得很合理,但是显然并不完美,很多面部都被遗漏了,并且许多图像中都存在对齐错误。同时,许多图像的分辨率並不是很高,因此为了生成1024x1024分辨率的可用数据集,我使用了在Manga109数据集上训练的预训练的ESRGAN [3]模型来按需放大图像,尽管这些图像会留下一些瑕疵,但大体上的结果还是不错的。 其他数据集

KaoKore是浮世绘人脸的另一个数据集[4],它具有更多的多样性和标签,但是图像分辨率较低且人脸未对齐。 许可和使用 此数据集是根据``知识共享署名-相同方式共享4.0国际许可证''提供的。 如果使用数据集,请引用为“Aligned ukiyo-e faces dataset, Justin Pinkney 2020”或一个bibtex条目:

1. Pinkney, Justin N. M., and Doron Adler. ‘Resolution Dependent GAN Interpolation for Controllable Image Synthesis Between Domains’. ArXiv:2010.05334[Cs, Eess], 20 October 2020.http://arxiv.org/abs/2010.05334. 2. 为了生成此图像,我首先使用在Imagenet上预训练的ResNet50从每个图像中提取CNN的特征。然后使用UMAP将这些高维特征向量投影到二维,最后使用lapjv算法完成网格划分。 3. Wang, Xintao, Ke Yu, Shixiang Wu, Jinjin Gu, Yihao Liu, Chao Dong, Chen Change Loy, Yu Qiao, and Xiaoou Tang. ‘ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks’. ArXiv:1809.00219[Cs], 1 September 2018.http://arxiv.org/abs/1809.00219. 4. Tian, Yingtao, Chikahiko Suzuki, Tarin Clanuwat, Mikel Bober-Irizar, Alex Lamb, and Asanobu Kitamoto. ‘KaoKore: A Pre-Modern Japanese Art Facial Expression Dataset’. ArXiv:2002.08595[Cs, Stat], 20 February 2020.http://arxiv.org/abs/2002.08595.

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1078

    浏览量

    40375
  • 分辨率
    +关注

    关注

    2

    文章

    1031

    浏览量

    41866
  • 数据集
    +关注

    关注

    4

    文章

    1200

    浏览量

    24619

原文标题:Ukiyo-e faces dataset 浮世绘面孔数据集

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI大模型训练数据来源分析

    学术机构、政府组织或企业公开发布,涵盖了各种类型的数据,如图像、文本、音频、视频等。例如: ImageNet :一个广泛用于图像识别任务的大规模图像
    的头像 发表于 10-23 15:32 313次阅读

    如何训练自己的AI大模型

    训练AI大模型之前,需要明确自己的具体需求,比如是进行自然语言处理、图像识别、推荐系统还是其他任务。 二、数据收集与预处理 数据收集 根据
    的头像 发表于 10-23 15:07 372次阅读

    如何训练ai大模型

    训练AI大模型是一个复杂且耗时的过程,涉及多个关键步骤和细致的考量。 一、数据准备 1. 数据收集 确定数据类型 :根据
    的头像 发表于 10-17 18:17 526次阅读

    如何理解机器学习中的训练、验证和测试

    理解机器学习中的训练、验证和测试,是掌握机器学习核心概念和流程的重要一步。这三者不仅构成了模型学习与评估的基础框架,还直接关系到
    的头像 发表于 07-10 15:45 2921次阅读

    人脸识别模型训练流程

    准备阶段,需要收集大量的人脸图像数据,并进行数据清洗、标注和增强等操作。 1.1 数据收集 数据
    的头像 发表于 07-04 09:19 756次阅读

    人脸识别模型训练失败原因有哪些

    人脸识别模型训练失败的原因有很多,以下是一些常见的原因及其解决方案: 数据质量问题 数据
    的头像 发表于 07-04 09:17 508次阅读

    人脸识别模型训练是什么意思

    人脸识别模型训练是指通过大量的人脸数据,使用机器学习或深度学习算法,训练出一个能够识别和分类
    的头像 发表于 07-04 09:16 435次阅读

    人脸检测模型有哪些

    人脸检测是计算机视觉领域的一个重要研究方向,它涉及到从图像或视频中检测出人脸的位置和大小。随着深度学习技术的发展,人脸检测模型的性能得到了显
    的头像 发表于 07-03 17:05 870次阅读

    PyTorch如何训练自己的数据

    PyTorch是一个广泛使用的深度学习框架,它以其灵活性、易用性和强大的动态图特性而闻名。在训练深度学习模型时,数据是不可或缺的组成部分。然而,很多时候,我们可能需要使用自己的
    的头像 发表于 07-02 14:09 1177次阅读

    【大语言模型:原理与工程实践】大语言模型的预训练

    大语言模型的核心特点在于其庞大的参数量,这赋予了模型强大的学习容量,使其无需依赖微调即可适应各种下游任务,而更倾向于培养通用的处理能力。然而,随着学习容量的增加,对预训练数据的需求也相
    发表于 05-07 17:10

    如何使用Python进行图像识别的自动学习自动训练

    图像识别的自动学习和自动训练。 首先,让我们了解一下图像识别的基本概念。图像识别是指通过计算机程序识别和理解图像内容的过程。自动学习和自动
    的头像 发表于 01-12 16:06 518次阅读

    【飞腾派4G版免费试用】第三章:抓取图像,手动标注并完成自定义目标检测模型训练和测试

    抓取图像,手动标注并完成自定义目标检测模型训练和测试 在第二章中,我介绍了模型训练的一般过程,其中关键的过程是带有标注信息的
    发表于 12-16 10:05

    模型数据:力量的源泉,进步的阶梯

    一、引言 在    的繁荣发展中,大模型数据的作用日益凸显。它们如庞大的知识库,为AI提供了丰富的信息和理解能力。本文将用一种独特的风格探讨大
    的头像 发表于 12-07 17:18 618次阅读

    模型数据:突破边界,探索未来

    随着人工智能技术的快速发展,大型预训练模型如GPT-4、BERT等在自然语言处理领域取得了显著的成功。这些大模型背后的关键之一是庞大的数据
    的头像 发表于 12-06 16:10 589次阅读

    模型数据:构建、挑战与未来趋势

    随着深度学习技术的快速发展,大型预训练模型如GPT-4、BERT等在各个领域取得了显著的成功。这些大模型背后的关键之一是庞大的数据,为
    的头像 发表于 12-06 15:28 1482次阅读