0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解耦表征所得出的因子是否真正独立

电子工程师 来源:fqj 2019-05-08 14:12 次阅读

而今,深度学习大行其道。

结果来看,它是能说会画外加打游戏,但这是如何实现的?模型里的中间数据有什么意义?换句话说,模型训练中所生成的高维数据如何进行有意义的理解?

这离不开非监督学习解耦表征(Unsupervised Learning of Disentangled Representations)。

一个在好奇心驱动的探索(curiosity driven exploration)、抽象推理(abstract reasoning)、视觉概念学习(visual concept learning )等方面早已用起来的方法。

但是目前,并未有什么方案可以统一衡量非监督学习解耦表征的有效性和局限性。即,解耦表征所得出的因子是否真正独立?某些解耦表征指标是否的确代表解耦的有效程度?

为解决这一问题,Francesco Locatello等人在“Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations ”(ICML 2019)一文中,对目前最佳的一些非监督解耦表征模型做出了大规模可复现评估,并指出了一些未来发展方向,造福业界人士。

该评估经由7个不同数据集上超12000个模型得出,涵盖了对业界最佳的解耦方法以及一些评估指标的评测,不仅可复现,而且该研究的代码和10800个预训练好的模型都已开源在disentanglement_lib,研究者们也可以将自己的解耦模型在此进行统一评估,与其他解耦模型进行对比,非常棒。

啥是解耦

通俗来讲,解耦就是将一个对象分解为各自独立的因素。不同的因素控制不同的结果,一个因素只控制一个结果的改变。解耦表征,也就是找出对象特征里的可解释因子,从而对高维的数据产生有意义的理解。

非监督解耦认为,现实世界的数据是由一些可解释的独立因子不同组合产生的,可以通过非监督学习的方式找到这些独立因子。如在Shapes3D数据集中,每个图像由六个独立因子控制,分别是:物体形状、物体大小、相机角度、地板颜色、墙壁颜色,物体颜色。

解耦表征所得出的因子是否真正独立

图 | Shapes3D数据集的独立真值因子可视化:地板颜色:上左;墙壁颜色:上中;物体颜色:上右;物体尺寸:下左;物体形状:下中;相机角度:下右。

解耦表征希望捕捉到这些独立因子,下图中每个3D图像数据是10维的数据,用FactorVAE解耦模型(一种变分自编码器variational autoencoders,即VAE的变种)对3D图像进行解耦,企图找出十维数据的每一维度信息,也即独立控制因子,结果有些因子被成功分离,而有些因子仍然未被捕捉。上右和上中表明,模型成功分解了地板颜色,然而,下左一和下左二两图表明物体颜色和尺寸仍未被分解开来,物体的颜色和大小都在变化,说明控制的两个因子并未独立分解。

解耦表征所得出的因子是否真正独立

图 | 可视化用FactorVAE模型所学到的隐含维度信息。墙壁颜色、地板颜色、相机角度被成功分解(见上右一、上中、和下中);物体的形状、尺寸、颜色还未被分解出来(见上左一和下左一、下左二)

本大型可复现研究的关键结论

为了理解高维数据,目前已有大量的非监督解耦模型。这些解耦模型一般基于变分自编码器(variational autoencoders, VAE,一种非监督生成模型,通过将数据分解出独立隐含因子来进行数据的生成,也即将高维数据映射成低维数据,并且低维数据的每一维度都独立控制着该数据的某一个性质)衍变而来,同时研究者们也设计了一些度量指标来衡量解耦水平,但实际上,并没有一个大规模的可复现实验来对这些模型及指标做出统一的衡量。

为解决这一问题,Francesco Locatello等人对六个现有最佳模型(BetaVAE,AnnealedVAE,FactorVAE,DIP-VAE I / II和Beta-TCVAE, 以上皆为变分自编码器的变种)和六个解耦指标(BetaVAE评分,FactorVAE评分,MIG,SAP,Modularity和DCI Disentanglement)的实际解耦的程度做了统一的可复现衡量实验,通过7个数据集上12800个模型的训练,衡量模型和参数的实际效果,他们有了这样的发现:

1、无法证实解耦模型的确可以进行可靠的解耦。

解耦模型的结果,即所分析出的独立因子并不是每次都确定,会随着模型的改变而变化,也就是说,分析出的独立因子并不是真正的唯一控制因子。解耦表征是非监督的,如果没有一些真值标签,其实无法衡量是否成功解耦。如想对解耦进行衡量,必须提前规定好数据集和模型的归纳偏好(Inductive Bias)。即,必须有假设才能知晓结果是否吻合假设,如果什么假设都没有,那就无法衡量结论好坏。

将不同解耦模型在同一个数据集上多次训练,只是每次随机数不同,解耦指标FactorsVAE分数的分布跨度很大,即使同一个模型,仅仅随机数不同,FactorsVAE分数就会变化,并且该影响超过了正则化强度所能施加的影响。因此这种解耦表征的结果不固定,所解出的因子便难以称之为独立因子,毕竟我们设想现实世界中的对象是由确定因素以某种组合造成的。

解耦表征所得出的因子是否真正独立

图 | 不同模型在Cars3D数据集上FactorsVAE分数的分布:左图是不同分解模型的FactorsVAE分布;右图是FactorVAE模型不同正则化强度的FactorsVAE分布。

2、解耦表征有益于下游任务(如分类任务)也是无法证实的。

FactorVAE分数和分类表现(基于Gradient Boosted Trees,GBT)并没有什么相关性,也就是FactorVAE分数高的解耦模型,利用模型解出的因子实现的分类任务表现也不一定就很好。

解耦表征所得出的因子是否真正独立

图 | 利用相应解耦模型的下游分类任务在dSprites数据集上的表现

由此,他们得出了这样一些见解:

1. 进行非监督的解耦表征需设置归纳偏好。未来工作需要明确描述强加的归纳偏好并明确是否利用了显性和隐性监督。

2. 找到好的能适用多个数据集的非监督模型归纳偏好非常关键。

3. 应证明引入解耦表征举措的具体实际益处。

4. 解耦模型效果应该在多种数据集上具有可重复性。

开源解耦表征库

该研究所用评估流程及方法、所用解耦模型(10800个,有一些模型关于Shapes3D不可用)、所采用的解耦衡量指标,以及一些帮助理解模型的可视化工具都开源在disentanglement_lib(https://github.com/google-research/disentanglement_lib)此库优点有三:

易复现。少于4个shell命令,disentanglement_lib即可重现评估所用的任何模型。另,虽所用参考模型所需算力非常之巨,但别怕,10800个预训练好的模型已奉上。

能修改。可对实验方案可以进行一些修改,验证你自己的想法。

易扩展。该库可实现公正统一的、可复现的,标准化的评估,可以轻松地将自己的新模型与参考模型对比。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 解耦
    +关注

    关注

    0

    文章

    40

    浏览量

    11907

原文标题:快来吧!有个开源框架测试你的解耦表征

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    瑞萨电子与吉利汽车联合举办汽车主控芯片软硬能力提升训练营

    近日,由瑞萨电子与吉利汽车研究院联合举办的“汽车主控芯片软硬能力提升训练营”顺利落幕。
    的头像 发表于 12-09 10:50 282次阅读

    AMC1303M2520所输出的信号经过STM32的DFSDM外设进行采集滤波后,得出的数据转换成波形与实际波形不一致怎么解决?

    的DFSDM外设进行采集滤波后,所得出的数据转换成波形与实际波形完全天壤之别,所以在此进行求助。 1.第一个问题是,我们计划用AMC1303M2520来采集40KHZ的正弦信号的方案是否是可行的呢? 2.第二个问题是,我们目前在DFSDM中配置的是Sinc2阶,25过采样
    发表于 12-06 06:05

    非线性光与线性光的差别

    非线性光与线性光的不同 在电路中光的电路非常常见,光在电路中的作用是进行隔离并对光电进行转换,光的种类当中,包括线性光
    的头像 发表于 11-16 10:28 402次阅读

    EMB系统功能安全分析(3)

    EMB 系统失效判断基于前面所述三路并行的安全机制,可实时检测系统运行状态,探测系统故障,又由于该系统为四轮独立制动,结合安全机制可引入四轮制动故障因子 λi来表征四轮故障状态,进行失效判断。故障
    的头像 发表于 10-16 14:31 390次阅读
    EMB系统功能安全分析(3)

    粒子传感器有哪些

    粒子传感器是电气火灾监控探测器中的关键组成部分,它们通过探测由电缆、塑料等物质在受热分解时产生的粒子来实现火灾的极早期预警。以下是关于热粒子传感器的一些信息: 类型与特点 独立式与非独立
    的头像 发表于 09-25 14:54 323次阅读

    探索光:高速光与普通光的差异

    在现代电子设备中,光(光电耦合器)是不可或缺的重要元件。它通过光信号隔离电路,防止高电压或高电流的干扰。然而,随着电子技术的发展,对光的性能需求也在不断提升。高速光的出现,标志着光
    的头像 发表于 08-20 08:51 569次阅读
    探索光<b class='flag-5'>耦</b>:高速光<b class='flag-5'>耦</b>与普通光<b class='flag-5'>耦</b>的差异

    不平衡电网下基于功率的PWM整流器控制策略研究

    当三相输入电压不平衡时,在静止坐标系下进行分析,一般都忽略了电流的,应用传统比例谐振控制器时存在一个问题,即有功功率与无功功率的耦合严重。针对不平衡电网工况下PWM整流器有功及无功功率严重耦合
    的头像 发表于 07-23 14:40 192次阅读
    不平衡电网下基于功率<b class='flag-5'>解</b><b class='flag-5'>耦</b>的PWM整流器控制策略研究

    STM8是否可以一块驱动24个光

    小弟今天想做一个24路继电器的板子,本来是想用24个光 驱动三极管控制继电器 ,但是想到STM8的驱动能力 ,是否STM8引脚 是否可以一块驱动24个光。还有 在STM8上电的时候
    发表于 05-08 06:30

    实践GoF的23种设计模式实现:桥接模式

    也即,将抽象部分和实现部分进行,使得它们能够各自往独立的方向变化。
    的头像 发表于 04-14 09:30 460次阅读
    实践GoF的23种设计模式实现:桥接模式

    智能数采网关助力破解软硬件难题

    不同需求提供可靠的数字化支持。 软硬件是指将软件和硬件进行分离,使得软件和硬件能够独立设计、开发、测试和部署,从而提高系统的灵活性、可扩展性和可维护性。在工业控制领域,由于PLC(可编程逻辑控制器)产品品牌众多,且通常
    的头像 发表于 04-11 15:37 411次阅读
    智能数采网关助力破解软硬件<b class='flag-5'>解</b><b class='flag-5'>耦</b>难题

    817光和2501光区别 2501光可以代替pc817吗

    817光(PC817)和2501光(PC2501)是两种常见的光器件,它们在结构、性能和应用上有一些区别。 首先,817光和2501光
    的头像 发表于 04-02 17:30 5355次阅读

    电网列是什么意思?电网故障列装置的作用与功能有哪些?

    一、电网列的概念电网列简单来说,就是当电力系统因为某些原因(比如设备故障或受到干扰)而失去稳定,无法维持正常的同步运行时,为了防止事故扩大,系统会自动或手动地将电网分成两个或多个独立的部分。这样
    的头像 发表于 03-29 12:00 6588次阅读
    电网<b class='flag-5'>解</b>列是什么意思?电网故障<b class='flag-5'>解</b>列装置的作用与功能有哪些?

    正向光和反向光区别

    正向光和反向光区别  正向光和反向光是电子元件中常见的两种类型的光,它们在电气隔离和信号传输方面有着不同的特性。本文将详细介绍正向
    的头像 发表于 02-02 10:08 1757次阅读

    一种常见的设计

    在模块划分时,我们通常会考虑耦合,即尽量减少模块间的交互,让模块间的接口尽量简单。
    的头像 发表于 01-17 10:05 574次阅读
    一种常见的<b class='flag-5'>解</b><b class='flag-5'>耦</b>设计

    RAM的应用-一种常见的设计

    在模块划分时,我们通常会考虑耦合,即尽量减少模块间的交互,让模块间的接口尽量简单。
    的头像 发表于 01-13 17:14 691次阅读
    RAM的应用-一种常见的<b class='flag-5'>解</b><b class='flag-5'>耦</b>设计