0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Jurgen:我比GAN之父提前三年想到生成式对抗网络

电子工程师 来源:YXQ 2019-05-14 10:19 次阅读

2014年的一晚,Ian Goodfellow和一个刚刚毕业的博士生一起喝酒庆祝。在蒙特利尔一个酒吧,一些朋友希望他能帮忙看看手头上一个棘手的项目:计算机如何自己生成图片。

研究人员已经使用了神经网络模拟人脑的神经元网络的一种算法),作为生成模型来创造合理的新数据。但结果往往不尽人意。计算机生成的人脸图像通常不是模糊不清,就是缺耳少鼻。

Ian Goodfellow朋友们提出的方案是对那些组成图片的元素进行复杂的统计分析以帮助机器自己生成图片。这需要进行大量的数据运算,Ian Goodfellow告诉他们这根本行不通。

边喝啤酒边思考问题时,他突然有了一个想法。如果让两个神经网络相互对抗会出现什么结果呢?他的朋友对此持怀疑态度。

当他回到家,女朋友已经熟睡,他决定马上实验自己的想法。那天他一直写代码写到凌晨,然后进行测试。第一次运行就成功了!

那天晚上他提出的方法现在叫做GAN,即生成对抗网络(generative adversarial network)。

通过使用两个神经网络的相互对抗,Ian Goodfellow创造了一个强大的AI工具——生成对抗网络GAN(generative adversarial network)。现在,该方法已经在机器学习领域产生了巨大的影响,也让他的创造者Goodfellow成为了人工智能界的重要人物。

GAN的诞生故事早已为技术圈所熟知,但是,产生这样奇妙对抗想法的似乎不止Ian Goodfellow一人。

比如另一位机器学习领袖Jurgen Schmidhuber就声称早些时候已经做过类似的工作。

NIPS 2016上有的相关争论:

https://media.nips.cc/nipsbooks/nipspapers/paper_files/nips27/reviews/1384.html

今天,一篇2010年的博文亦在reddit上引发热议。这是一篇非常简短的文章,但是很精确的提出了GAN的基本想法,其中附带的一张图片更是直接表示出了GAN的部署方式。

https://web.archive.org/web/20120312111546/http://yehar.com:80 /blog /?p = 167

这篇帖子引发了大量讨论,不少人觉得遗憾,称,如果小哥能更重视一下自己的这个想法,“他可能才会成为那个改变世界的人。”

当然,也有人表示,有这样的想法很重要,但真的付诸实践才行,并且,2010年的硬件条件或许也还无法支撑让GAN大火的一些应用。甚至拿出来哥伦布发现新大陆的例子表示,“哥伦布可能是第一个发现者,但一定有很多人早就预言过'也许在大西洋有一些岛屿'?”

事实上,这篇博客的作者Olli Niemitalo的心态其实比吃瓜群众要好很多,Olli是位来自芬兰的电器工程师,在2017年的一篇帖子了,他叙述了自己在刚刚发现GAN的心路历程:“2017年5月,我在YouTube看到了Ian Goodfellow的相关教程,made my day! 我之前写下的只是一个基本的想法,并且已经做了很多工作来使它取得良好的效果。这个演讲回答了我曾经遇到过的问题以及更多问题。”

从这篇博客作者的个人主页可以看出,Olli本身也是位思维活跃并且乐于提出新想法的“宝藏男孩”,从2007年开始,他在博客中记下了从“能唱歌的自行车刹车“到”永不迟到的手表“等超多自己的想法,当然其中也包括了这个“GAN”的雏形。

正如Goodfellow所说,“如果你有一个觉得可行的想法,也具有领域知识能够认识到它切实有效,那么你的想法才会真的价值。我提出GAN只花了大约1个小时,写论文花了2个星期。这绝对是一个“99%灵感,1%汗水”的故事,但是在那之前我花了4年时间在相关主题上攻读博士学位。”

最后,欢迎看看这个比Goodfellow早三年提出的GAN的简短想法。

Amethod for training artificial neural networksto generate missing data within a variable context. As the idea is hard to put in a single sentence, I will use an example:

An image may have missing pixels (let's say, under a smudge). How can one restore the missing pixels, knowing only the surrounding pixels? One approach would be a "generator" neural network that, given the surrounding pixels as input, generates the missing pixels.

But how to train such a network? One can't expect the network to exactly produce the missing pixels. Imagine, for example, that the missing data is a patch of grass. One could teach the network with a bunch of images of lawns, with portions removed. The teacher knows the data that is missing, and could score the network according to the root mean square difference (RMSD) between the generated patch of grass and the original data. The problem is that if the generator encounters an image that is not part of the training set, it would be impossible for the neural network to put all the leaves, especially in the middle of the patch, in exactly the right places. The lowest RMSD error would probably be achieved by the network filling the middle area of the patch with a solid color that is the average of the color of pixels in typical images of grass. If the network tried to generate grass that looks convincing to a human and as such fulfills its purpose, there would be an unfortunate penalty by the RMSD metric.

My idea is this (see figure below): Train simultaneously with the generator a classifier network that is given, in random or alternating sequence, generated and original data. The classifier then has to guess, in the context of the surrounding image context, whether the input is original (1) or generated (0). The generator network is simultaneously trying to get a high score (1) from the classifier. The outcome, hopefully, is that both networks start out really simple, and progress towards generating and recognizing more and more advanced features, approaching and possibly defeating human's ability to discern between the generated data and the original. If multiple training samples are considered for each score, then RMSD is the correct error metric to use, as this will encourage the classifier network to output probabilities.

如果你对GAN的诞生故事感兴趣,也可以看大数据文摘的相关报道:

GAN之父Ian Goodfellow :那个赋予机器想象力的人类

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GaN
    GaN
    +关注

    关注

    19

    文章

    2045

    浏览量

    74742
  • 机器学习
    +关注

    关注

    66

    文章

    8458

    浏览量

    133278

原文标题:“我比Goodfellow提前三年想到了GAN”

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI将推动未来三年存储需求翻倍

    满足AI生成数据的海量存储需求时,云存储成为了各行业企业的首选解决方案。 调查结果显示,AI的普及程度已经相当高,72%的受访企业表示已经在利用这项技术,而另外28%的企业则计划在未来三年内采用AI。这一广泛的采用率预示着数据生成
    的头像 发表于 01-23 14:42 209次阅读

    嵌入搞啥挣钱,干了三年好迷茫?

    三年前,怀揣着对电子技术的热爱,踏入了嵌入开发领域。那时的,满心憧憬着能在这个充满挑战与机遇的行业里大展拳脚,创造出具有创新性的产品。然而,
    的头像 发表于 01-19 09:10 394次阅读
    嵌入<b class='flag-5'>式</b>搞啥挣钱,干了<b class='flag-5'>三年</b>好迷茫?

    #新年新气象,大家新年快乐!#AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、生成对抗
    发表于 01-13 10:46

    AIGC入门及鸿蒙入门

    Generated Content,即人工智能生成内容。它利用人工智能技术自动生成或辅助生成文本、图像、音频、视频等内容。 AIGC的核心技术包括自然语言处理(NLP)、计算机视觉、生成对抗
    发表于 01-13 10:32

    广汽三年“番禺行动”深度解读

    近日,第22届广州车展拉开帷幕,广汽集团携旗下整车品牌重磅参展。在当天的新闻发布会上,广汽集团一口气发布了广汽三年“番禺行动”及款全新的新能源车型,给现场观众与媒体带来了极大的震撼。
    的头像 发表于 11-21 11:23 519次阅读

    行代码完成生成AI部署

    LLM加载与推理部署能力,实现了OpenVINO对CNN网络生成模型、LLM网络主流模型的全面推理支持。
    的头像 发表于 08-30 16:49 508次阅读
    <b class='flag-5'>三</b>行代码完成<b class='flag-5'>生成</b><b class='flag-5'>式</b>AI部署

    生成对抗网络(GANs)的原理与应用案例

    生成对抗网络(Generative Adversarial Networks,GANs)是一种由蒙特利尔大学的Ian Goodfellow等人在2014提出的深度学习算法。GANs通过构建两个
    的头像 发表于 07-09 11:34 1453次阅读

    生成AI与神经网络模型的区别和联系

    生成AI与神经网络模型是现代人工智能领域的两个核心概念,它们在推动技术进步和应用拓展方面发挥着至关重要的作用。本文将详细探讨生成AI与神
    的头像 发表于 07-02 15:03 1094次阅读

    索尼半导体部门削减投资,三年计划投入6500亿日元

    索尼半导体部门近日宣布,计划在截至20273月的三年内,投入约6500亿日元(约合300.95亿元人民币)用于资本支出。这一数字相较于前一个三年期减少了约30%,显示出索尼在半导体领域的投资策略正经历调整。
    的头像 发表于 06-05 10:22 751次阅读

    华为分布存储连续三年荣膺2024Gartner“客户之选”

    近日,全球权威咨询与分析机构Gartner发布《2024Gartner Peer InsightsTM 分布文件系统与对象存储“客户之声”》报告,华为凭借其OceanStor分布存储解决方案再次荣获“客户之选”殊荣,这已是
    的头像 发表于 05-24 10:12 813次阅读

    三年不换电?挑战苹果AirTag!| 小白测功耗@合宙

    三年不换电?挑战苹果AirTag!| 小白测功耗@合宙
    的头像 发表于 05-17 14:36 2104次阅读
    <b class='flag-5'>三年</b>不换电?挑战苹果AirTag!| 小白测功耗@合宙

    京东集团连续第三年入选《财富》中国ESG影响力榜

    5月13日,《财富》发布了“2024中国ESG影响力榜”,京东集团以其在环境、社会和公司治理(ESG)方面的卓越表现,连续第三年名列榜单。
    的头像 发表于 05-14 14:25 768次阅读

    洛微科技续三年荣获「2024杭州准独角兽企业」殊荣!

    4月25日,第八届万物生长大会在杭州落幕,在这盛大的场合中,洛微科技再次闪耀登场,连续三年荣获「2024杭州准独角兽企业」殊荣!
    的头像 发表于 04-28 11:36 820次阅读
    洛微科技续<b class='flag-5'>三年</b>荣获「2024杭州准独角兽企业」殊荣!

    生成 AI 进入模型驱动时代

    人意识到,需要针对特定的应用对模型进行更广泛的训练。因此,只要说到“生成AI”这个词,我们很自然地就会联想到要使用经过训练的模型。但是,生成
    的头像 发表于 04-13 08:12 616次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> AI 进入模型驱动时代

    深度学习生成对抗网络GAN)全解析

    GANs真正的能力来源于它们遵循的对抗训练模式。生成器的权重是基于判别器的损失所学习到的。因此,生成器被它生成的图像所推动着进行训练,很难知道生成
    发表于 03-29 14:42 4919次阅读
    深度学习<b class='flag-5'>生成对抗</b><b class='flag-5'>网络</b>(<b class='flag-5'>GAN</b>)全解析