0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

讲真,AI研究发表和模型开源,真的该制定一个规范了

DPVg_AI_era 来源:lq 2019-02-24 10:58 次阅读

深度学习界“最敢说的人”Yann LeCun再次放话,不过今天是提问:要是他早先能够预料到如今CNN被滥用,比如制作DeepFake换脸假视频,他当初还该不该开源CNN?讲真,AI研究发表和模型开源,真的该制定一个规范了。

Yann LeCun今天在Twitter上提问:

讲真,要是当初知道卷积神经网络(CNN)会催生DeepFake,我们还要不要发表CNN?

LeCun说:“问个严肃的问题:卷积神经网络(CNN)被用于(或开发)各种各样的应用。很多这样的应用对世界起到了积极影响,例如,医疗影像、汽车安全、内容过滤、环境监控等等。

“但有的应用则可能起到负面的效果,或者说侵犯隐私,例如,公众场所的人脸识别系统、进攻性武器,以及有偏见的“过滤”系统……

“那么,假设在上世纪80年代那时我们能够预见CNN的这些负面影响,我们该不该把CNN模型保密不公开呢?

“几点想法:

最终,CNN(或者类似的东西)还是会被其他人发明出来(实际上,有些人可以说差不多已经做到了)。其实,福岛邦彦就跟我说,他80年代末的时候正在研究一种用BP训练的新认知机(Neocogitron),但看到我们1989年发表的神经计算论文“大感震惊”(shocked),然后停止了他的项目。

开源CNN或深度学习软件平台直到2002年才出现(CNN是20世纪90年代早期商业软件包SN和2002年开源的Lush软件包的一项功能。20世纪90年代中后期才开始有OSS分发)。因此,在某种程度上,CNN直到2002年才完全发表(released)。但那时基本没有什么人关注CNN,或者想到用Lush来训练CNN。”

LeCun的这番话,可以说是为他此前的“表态”做出了完美的解释。

是的,这里说的还是关于OpenAI模型开源的那件事。

LeCun:担心模型太强大而不开源,干脆别研究AI

2月中旬,OpenAI宣布他们开发了一个通用文本生成模型GPT-2,拥有15亿参数,使用了800万网页进行训练,能够同时完成文本生成、回答问题、总结摘要、机器翻译等多项任务,有的时候效果甚至比专门的文本生成/问答/摘要总结等模型还要好。

接着,OpenAI用一个又一个的示例,充分展示了GPT-2模型有多强大,等到众人迫不及待地要了解设计细节时,突然话锋一转,说他们担心模型“太过强大”,开源后可能遭人滥用,这次决定不公布具体参数和训练数据集,只是放出一个小很多的样本模型供人参考。

谁料,OpenAI这一举动引爆了整个AI圈,相比GPT-2模型本身,对于模型是否该开源的争论在短时间内得到了更多的关注,NLP领域以外的研究人员和开发者也凑过来,而且“群众的意见”几乎是一边倒的反对OpenAI,简而言之:

担心AI过于强大而不开源太矫情,这样还不如一开始就别研究AI。

当时,LeCun不仅转发了一条讽刺OpenAI的推文,还“火上浇油”地写了个段子,大意是:可不能开源在MNIST数据集上精度99.99%的模型,这可能被人用来篡改邮编,发动垃圾邮件恐怖袭击,那还得了。具体见下:

最终,LeCun对OpenAI不予开源的嘲讽发展到了极致:

“每个新生出来的人都可能造谣、传播流言并影响其他人,那我们是不是该别生孩子了?”

这番言论实在称不上严谨,甚至不能算“严肃”,但作为Facebook首席科学家、卷积神经网络发明人和深度学习三巨头之一,LeCun在如今的AI圈子里拥有巨大的影响力,他的这一表态迅速成为重磅砝码,压在了天平“反对不开源”的这边,不仅坚定了此前站出来表示反对的人的信念,还影响了不少后来人的观点。

关于模型开源,我们真正关注的应该是什么?

当然,现在业界的重点已经从最初的口水战聚焦到AI研究发表和开源政策的讨论上来。

LeCun或许也是希望用今天这个“serious question”来阐述自己当初过于简单而容易被人误会的表态。

大多数研究人员都同意,OpenAI决定不开源的出发点是好的,但给出的理由却不尽人意:

首先,GPT-2模型是否真有那么强大?不公布细节无法证明这一点。这也是一开始口水战的一大焦点,如果不给出细节,谁都可以站出来说我实现了强AI,但由于“担心太过强大”,所以我不能发表。

插一句,从OpenAI公布的统计数据中可以看出,GPT-2不仅仅是“记住了”数据,而是确实具有更强的泛化性能。

其次,公开了模型设计和训练数据集,是否就会被人拿去在网上“假言惑众”?先抛开结果复现程度,但看训练成本——OpenAI并没有介绍训练GPT-2模型的时间,但根据知情的研究人员透露,OpenAI取得了特许,使用谷歌TPU来训练模型,1小时花费2048美元。这个费用不是一般人能承担得起的,而能承担起这种费用的,如果真要“作恶”,有大概率不需要借助开源模型。

最后,关于企业研究机构如何宣传AI研究,如何面对公众、媒体和研究人员等不同群体,OpenAI的做法也有一些争议。DeepMind在最初介绍WaveNet,一个能合成与真人语音几乎无二的强大语音生成模型的时候对于潜在危险只字不提,而OpenAI不但主动提出并且还想要牵头制定AI研究发表的相关政策。这里说不出谁对谁错,但OpenAI只给出一个邮箱地址,欢迎“感兴趣的研究人员”联系他们的做法是远远不够的。

现在能够肯定的是,关于AI研究发表和模型开源,相关的政策真的需要制定了。OpenAI在担心模型被滥用时举了DeepFake为例,DeepFake是基于CNN构建的图像生成模型,由于强大的图像生成能力,能够生成以假乱真的人脸,甚至骗过先进的人脸识别模型。

那么回到LeCun一开始问的那个严肃的问题:

要是当初知道卷积神经网络(CNN)会催生DeepFake,我们还要不要发表CNN呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30851

    浏览量

    269028
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121153
  • cnn
    cnn
    +关注

    关注

    3

    文章

    352

    浏览量

    22213

原文标题:LeCun:30年前知道DeepFake,我还该不该开源CNN?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    ​在人工智能领域,Meta的最新动作再次引起了全球的关注。今天,我们见证Meta发布的 Llama 3.3 70B 模型,这是开源的人
    的头像 发表于 12-18 16:46 117次阅读
    Meta重磅发布Llama 3.3 70B:<b class='flag-5'>开源</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑

    谷歌发布“深度研究AI工具,利用Gemini模型进行网络信息检索

    据外媒最新报道,谷歌近期发布款名为“深度研究”的先进AI工具。这款工具借助其内部的Gemini大型语言模型,实现
    的头像 发表于 12-16 09:35 201次阅读

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些
    的头像 发表于 12-14 10:33 174次阅读

    阿里云开源推理大模型QwQ

    近日,阿里云通义团队宣布推出全新AI推理模型QwQ-32B-Preview,并同步实现开源。这举措标志着阿里云在
    的头像 发表于 11-29 11:30 555次阅读

    AMD发布10亿参数开源AI模型OLMo

    AMD公司近日宣布项重大进展,推出了首个完全开放的10亿参数语言模型系列——AMD OLMo。这举措为开发者和研究人员提供
    的头像 发表于 11-12 18:08 440次阅读

    科技云报到:假开源噱头?开源模型和你想的不样!

    查看、修改、分发。开源自此深刻影响了互联网行业的每一个角落。 在大模型和GenAI崛起的当下,开源再次成为业界关注焦点,对于开源和闭源的争论
    的头像 发表于 11-03 10:46 229次阅读

    Llama 3 与开源AI模型的关系

    体现在多个层面。 1. 开源精神的体现 Llama 3项目可能是开源项目,这意味着它的源代码、算法和数据集对公众开放。这种开放性是开源
    的头像 发表于 10-27 14:42 371次阅读

    AI模型的最新研究进展

    AI模型的最新研究进展体现在多个方面,以下是对其最新进展的介绍: 、技术创新与突破 生成式AI技术的爆发 : 生成式
    的头像 发表于 10-23 15:19 433次阅读

    开源 KiCad/AD 查看器 + AI Copilot?

    使用,从电阻到复杂的 MCU,机器人都能给你解释的清清楚楚,省时省力! 开源的 EDA 查看器 之前推荐过
    发表于 08-18 22:41

    Meta即将发布超强开源AI模型Llama 3-405B

    在人工智能领域的激烈竞争中,Meta公司再次掷出重磅炸弹,宣布将于7月23日正式发布其最新力作——Llama 3-405B,拥有惊人4050亿参数的开源模型。这
    的头像 发表于 07-18 09:58 994次阅读

    STM CUBE AI错误导入onnx模型报错的原因?

    使用cube-AI分析模型时报错,模型是pytorch的cnn转化成onnx ``` Neural Network Tools for STM32
    发表于 05-27 07:15

    IBM开源AI模型,推动AI企业化应用

    IBM近日宣布,将把系列先进的人工智能模型开源软件的形式发布,此举标志着人工智能技术在企业应用上的新篇章。公司表示,随着watsonx平台推出满年,
    的头像 发表于 05-22 09:25 491次阅读

    英国AI安全研究所推出AI模型安全评估平台

    据报道,英国人工智能安全研究院近日发布名为“Inspect”的AI模型安全评估平台,此平台采用开源技术且对全球
    的头像 发表于 05-13 15:20 416次阅读

    通义千问推出1100亿参数开源模型

    通义千问近日震撼发布1100亿参数的开源模型Qwen1.5-110B,这举措标志着通义千问在AI领域迈出了重大步伐。
    的头像 发表于 05-06 10:49 587次阅读

    谷歌发布轻量级开源人工智能模型Gemma

    谷歌近日宣布推出开源人工智能(AI模型系列Gemma,旨在为开发人员和研究人员提供负责任的
    的头像 发表于 02-23 11:38 861次阅读