0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google和OpenAI联合发布了Activation Atla

DPVg_AI_era 来源:lp 2019-03-10 09:34 次阅读

Google和OpenAI联合发布了Activation Atlas(激活地图),终于将神经网络图像分类的“黑匣子”用可视化的方式表示出来了!AI的世界真是神奇!

AI眼中的世界就是激活地图(Activation Atlases)。

近日,谷歌与OpenAI共同创建了Activation Atlases,这是一种可视化神经元之间相互作用的新技术。通过使用特征反演(feature inversion)来可视化一个图像分类网络中数以百万计的激活。

换言之,神经网络图像分类的黑匣子终于被打开了。这将有助于研究人员更好的理解AI系统在内部决策的过程。

Activation Atalas:神经网络隐藏层可以表示什么

我们先来看下以往的工作的一些缺陷:

(单个神经元)单个神经元的可视化使隐藏层变得有意义,但是忽略了神经元之间的交互作用——它只向我们展示了高维激活空间的一维正交探针。(成对交互)成对的交互揭示了相互作用的效果,但它们只显示了具有数百个维度空间的二维切片,而且许多组合是不现实的。(空间激活)空间激活通过对可能激活的子流形进行采样来向我们显示许多神经元的重要组合,但它们仅限于给定示例图像中出现的那些神经元。(Activation Atlas)通过对多种可能的激活进行采样,Activation Atlase为我们提供了一个更全面的概览。

Activation Atalas是建立在特征可视化的基础上,这是一种研究“神经网络隐藏层可以表示什么”的技术。

在深入研究Activation Atalas之前,先简要回顾一下如何使用特征可视化使激活向量变得有意义,也就是如何“透过网络的眼睛看”事物。 这种技术将成为Activation Atalas的基础。

注:本文关注的神经网络是InceptionV1,也称GoogLeNet。

因为InceptionV1是一个卷积网络,每层每幅图像都不只有一个激活向量。

这意味着相同的神经元运行在前一层的每个patch上。因此,当通过网络传递整幅图像时,每个神经元将被评估数百次,每一个重叠的图像块被评估一次。

结果是一个特征可视化网格,每个patch都有一个。这向我们展示了网络如何看到输入图像的不同部分。

(左)从ImageNet输入的图像;(右)来自InceptionV1的激活网格,mixed4d层。

这是单幅图像的情况,但如果图像的数量是数以百万计的,那么AI的反应又将如何呢?

先从收集一百万个图像的激活开始。

我们将随机为每张图像选择一个空间激活。这就得到了100万个激活向量。每个向量都是高维的,可能是512维!对于如此复杂的一组数据,如果我们想要一个大的视图,就需要对其进行组织和聚合

通过一些先进的降维技术,可以将收集到的激活向量投影到有用的二维布局中,并保留原始空间的一些局部结构。将在创建的2D布局上绘制网格,对于网格中的每个单元格,将位于该单元格边界内的所有激活平均化,并使用特征可视化来创建图标表示。

(左)从不同的训练示例中收集100万个激活向量。

(中)将它们排列成2D,以便让相似的元素更紧密地排列在一起。

(右)对每个单元格的平均添加网格,并对其进行特征可视化。

mixed4c层,应用到InceptionV1,从左至右:20x20,40x40,80x80,160x160。

这幅地图集乍一看可能有点让人不知所措,这种多样性反映了模型开发的各种抽象和概念。

如果我们看一下地图集的左上方,我们会看到看起来像动物头部的东西。

不同种类的动物之间有一些区别,但似乎更多的是一些普通哺乳动物的元素——眼睛、皮毛、鼻子——而不是不同种类动物的集合。

随着我们向下移动,我们开始看到不同类型的毛皮和四足动物的背部。

在此之下,我们发现不同的动物腿和脚在不同的地面上休息。

在脚的下面,我们开始失去任何可识别的动物部分,并看到孤立的地面和地板。 我们看到归属于“沙洲”等环境以及地面上发现的东西,如“门垫”或“蚂蚁”。

这些沙质岩石背景慢慢地融入海滩和水体。在这里,我们可以看到水面上下的湖泊和海洋。虽然神经网络上确实有“海滨”这样的特定类别,但我们看到许多海洋动物的属性,而没有任何与动物本身有关的视觉参考。

但令人欣慰的是,用于为“海滨”类识别海洋的活动与用于分类“海星”或“海狮”的活动是相同的。在这一点上,湖泊和海洋也没有真正的区别——“湖边”和“河马”的属性与“海星”和“黄貂鱼”混杂在一起。

早期的特征可视化工作主要集中在单个神经元上。而通过收集成千上万个神经元相互作用的例子并将其可视化,ActivationAtalas从单个神经元转移到这些神经元共同代表的空间。

现在让我们跳到地图集的另一边,在那里我们可以看到许多不同的文本检测器。当识别诸如“菜单”、“web站点”或“book jacket”之类的类时,这些检测器将非常有用。

再向上看,可以看到许多不同的人。在ImageNet中很少有专门识别人员的类,但人们会出现在很多图像中。

我们看到人们使用的物品(“锤子”、“笛子”)、人们穿的衣服(“领结”、“邮筒”)以及人们参加的活动(“篮球”)的属性。在这些可视化中,肤色是一致的,我们怀疑这反映了用于训练的数据的分布。

最后,回到左边,我们可以看到圆形的食物和水果主要是由颜色组成的——我们看到归属于“柠檬”、“橘子”和“无花果”。

模型在多层次上发展过程

上述工作中,我们主要关注网络的一个层——mixed4c,它位于网络的中间。而卷积网络通常很深,由许多层组成,且逐步构建更强大的抽象。 为了获得整体视图,我们必须研究模型的抽象是如何在多个层次上发展的。

首先,让我们比较来自网络不同区域的三个层,以了解每个层的不同特征——mixed3b、mixed4c和mixed5b。我们将关注每层的有助于“卷心菜”分类的区域。

当在网络中移动时,后面的层似乎变得更加具体和复杂。

因为每个层都在前一层的激活之上构建其激活。后一层的接受域也往往比前一层更大(这意味着图像的子集更大),因此概念似乎包含了更多的整体对象。

还有另一个值得注意的现象:不仅概念正在被提炼,而且新概念正在从旧概念的组合中出现。

最后,如果我们缩小一点,我们可以看到更宽的激活空间的形状是如何从一层到另一层变化的。通过在几个连续的层中观察相似的区域,我们可以看到概念得到细化和区分——在mixed4a中,我们看到非常模糊的通用blob,通过mixed4e将其细化为更加具体的“半岛”。

激活地图中,类的边界是导致神经网络容易“误认”主要原因

突出显示完整地图集的特定类别激活有助于了解该类如何与网络“可以看到”的完整空间相关联。

但是,如果我们想要真正隔离有助于特定类的激活,我们 可以删除所有其他激活。与一般地图集类似,我们在类特定激活向量上运行维数减少5,以便排列类激活图集中显示的特征可视化。

类激活图集使我们能够更清楚地了解网络使用哪些检测器对特定类进行排名。 在“呼吸管”示例中,我们可以清楚地看到海洋、水下和彩色面具。

不过,在某些情况下,我们希望看到有很强的相关性(比如鱼和潜水者)。这些激活本身可能比我们感兴趣的类对不同的类有更强的贡献,但是它们的存在也可以对我们感兴趣的类有更大的贡献。

对于这些,我们需要选择一种不同的过滤方法。

要立即理解类之间的所有差异可能有点困难。为了便于比较,我们可以将这两个视图合并为一个视图。我们将在水平方向绘制“snorkel”和“scuba diving”属性之间的差异,并使用t-SNE在垂直方向聚集类似的活动。

在这个对比中,我们可以看到一些鸟一样的生物和左边清晰的管子,暗示着与“snorkel”有关,而一些鲨鱼一样的生物和右边圆形、闪亮、金属的东西,暗示着与“scuba driver”有关。

让我们从标记为“snorkel”的ImageNet数据集中获取一张图像,并添加类似于此图标的内容,以查看它如何影响分类分数。

这里的失效模式似乎是该模型正在使用其探测器用于“蒸汽机车”类来识别空气罐以帮助对“潜水员”进行分类。

我们称之为“多用途”功能 - 探测器可以对视觉上相似的非常不同的概念做出反应。 让我们来看看“灰鲸”和“大白鲨”之间的区别,看看这个问题的另一个例子。

在这个例子中,我们看到另一个似乎扮演两个角色的探测器:探测棒球上的红色缝线和鲨鱼的白色牙齿和粉红色的内口。

这个探测器也出现在激活地图集层混合5b过滤到“大白鲨”,它的归属点是各种各样的球,最重要的是“棒球”。

让我们将棒球图片添加到ImageNet中的“灰鲸”图片中,看看它是如何影响分类的。

所以,这也就是为什么神经网络经常总会认错东西了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6150

    浏览量

    105243
  • 神经网络
    +关注

    关注

    42

    文章

    4767

    浏览量

    100662
  • 图像分类
    +关注

    关注

    0

    文章

    90

    浏览量

    11914

原文标题:谷歌和OpenAI重磅解密神经网络“黑匣子”:AI图像分类原来就是一张激活地图!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    壁仞科技与软通动力联合发布创新AI PC产品

    在广州市黄埔区中新知识城举办的“H•I³ AI探索峰会”上,壁仞科技与软通动力携手共创辉煌,联合发布全新的AI PC(AIPC)产品,这一里程碑式的合作标志着AI技术在企业应用领域的又一次飞跃,为产业智能化进程注入了强劲动力。
    的头像 发表于 09-02 16:07 456次阅读

    中软国际与华为联合发布院端医保风控一体机解决方案

    近日,以“数据赋能监管 守卫基金安全”为主题的联合解决方案发布会在苏州举行,中软国际有限公司(以下简称“中软国际”)与华为技术有限公司(以下简称“华为”)联合发布院端医保风控一体机解决方案,实现医保基金在院端的事前、事中、事后的
    的头像 发表于 07-29 16:02 714次阅读
    中软国际与华为<b class='flag-5'>联合发布</b>院端医保风控一体机解决方案

    OpenAI推出SearchGPT原型,正式向Google搜索引擎发起挑战

    在人工智能领域的持续探索中,OpenAI 迈出了重大一步,发布其最新的 SearchGPT 原型,直接瞄准 Google 的核心业务——
    的头像 发表于 07-26 15:11 565次阅读

    OpenAI 深夜抛出王炸 “ChatGPT- 4o”, “她” 来了

    当地时间5月13日OpenAI推出ChatGPT-4o,代表人工智能向前迈出的一大步。在GPT-4turbo的强大基础上,这种迭代拥有显著的改进。在发布会的演示中,OpenAI展示
    发表于 05-27 15:43

    百度智能云携手长江云联合发布数智广电“白皮书”

    5月23日上午,“长江论道暨第27届中国智能视听与科技创新高峰论坛”在武汉开幕,湖北长江云新媒体集团(以下简称长江云)与百度智能云联合发布《面向AIGC的数智广电新质生产力构建白皮书》
    的头像 发表于 05-24 18:12 1129次阅读
    百度智能云携手长江云<b class='flag-5'>联合发布</b>数智广电“白皮书”

    OpenAI联合创始人Ilya Sutskever宣布离职

    近日,OpenAI联合创始人Ilya Sutskever在社交平台上宣布,他将离开这家引领人工智能革命的公司。Ilya在推文中回顾OpenAI的辉煌发展历程,并称之为一个“奇迹”。
    的头像 发表于 05-16 09:26 473次阅读

    MediaTek携手生态伙伴联合发布《生成式AI手机产业白皮书》

    、腾讯混元、vivo等生态伙伴*,联合发布《生成式AI手机产业白皮书》,共同定义“生成式AI手机”的概念和典型特征。
    的头像 发表于 05-08 16:48 418次阅读

    芯驰科技与Qt Group联合发布并展示全新的智能座舱解决方案

    在2024年4月25日开幕的北京国际汽车展上,芯驰科技与HMI开发软件提供商Qt Group联合发布并展示全新的智能座舱解决方案
    的头像 发表于 04-29 14:23 1689次阅读
    芯驰科技与Qt Group<b class='flag-5'>联合发布</b>并展示<b class='flag-5'>了</b>全新的智能座舱解决方案

    OpenAI联手Nvidia发布首台Nvidia DGX H200

    OpenAI总裁兼联合创始人Greg Brockman分享他与山姆・阿尔特曼(Sam Altman)、黄仁勋以及自己的合影,他们的眼前正是这台首次亮相的DGX H200。
    的头像 发表于 04-25 13:50 407次阅读

    联想上海交大联合发布全球首款商业化高亮不锈镁合金材料

    4月19日,联想集团和上海交通大学联合发布业界首款可商业化的高亮不锈镁合金材料,其耐腐蚀性达到了业界当前镁合金产品的十倍,日前刚斩获2024国际镁协会变形加工产品类唯一的大奖!
    的头像 发表于 04-23 11:39 567次阅读

    星闪联盟与ICCE联盟联合发布星闪数字车钥匙标准助力汽车智能新纪元

    在2024年3月30日举办的2024国际星闪联盟产业峰会上,国际星闪无线短距通信联盟(简称“星闪联盟”)与智慧车联产业生态联盟(简称“ICCE联盟”)联合发布星闪数字车钥匙标准。
    的头像 发表于 04-03 10:21 1706次阅读
    星闪联盟与ICCE联盟<b class='flag-5'>联合发布</b>星闪数字车钥匙标准助力汽车智能新纪元

    润和软件与新财富联合发布金融AI对话式搜索引擎“金融搜一搜”产品

    3月29日,新财富投顾嘉年华活动中,江苏润和软件股份有限公司(以下简称“润和软件”)与深圳市新财富数字科技有限责任公司(以下简称“新财富”)联合发布金融AI对话式搜索引擎——“金融搜一搜”产品,助力金融投资场景智能化升级。
    的头像 发表于 04-02 10:15 472次阅读
    润和软件与新财富<b class='flag-5'>联合发布</b>金融AI对话式搜索引擎“金融搜一搜”产品

    Anthropic 声称其新的 AI 聊天机器人模型击败 OpenAI 的 GPT-4

    ABSTRACT摘要新的Claude3系列人工智能模型的性能与GoogleOpenAI的领先模型一样好,甚至更好JAEALOT2024年3月5日Anthropic是一家由OpenAI几位前员工创立
    的头像 发表于 03-06 08:24 511次阅读
    Anthropic 声称其新的 AI 聊天机器人模型击败<b class='flag-5'>了</b> <b class='flag-5'>OpenAI</b> 的 GPT-4

    中国电信携手中兴通讯联合发布Cluster DRS创新技术和成果

    2月26日,2024年世界移动通信大会(MWC2024)在西班牙巴塞罗那开幕。展会期间,中国电信携手中兴通讯联合发布Cluster DRS(Dynamic Radio Sharing,基站簇级的动态波束共享)创新技术和成果。
    的头像 发表于 02-27 10:44 484次阅读