0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华裔女博士提出:Facebook提出用于超参数调整的自我监督学习框架

人工智能与大数据技术 来源:新智元 作者:新智元 2021-04-26 09:45 次阅读

来源:Facebook

【导读】Facebook的研究人员近日提出了一种用于超参数调整的自我监督学习框架。这个新模型实现了准确预测的结果,估计超参数的速度快了6到20倍。

近日,Facebook的研究人员提出了一种新的用于模型选择(SSL-MS) 和超参数调整(SSL-HPT)的自监督学习框架,该框架以较少的计算时间和资源提供准确的预测。

与基于基线搜索的算法相比,SSL-HPT 算法估计超参数的速度快了6-20倍,同时在各种应用中产生了比较准确的预测结果。

SSL:估算超参数速度快6-20倍

在时间序列分析(用于发现趋势或预测未来值)中,超参数的细微差别可能导致给定模型的非常不同的预测结果。

因此,选择最优的超参数值显得尤为重要。

大多数现有的超参数调整方法,如网格搜索、随机搜索和贝叶斯最优搜索,都是基于一个关键组件: 搜索。

因此,它们计算代价非常昂贵,不能应用于快速、可扩展的时间序列超参数调整。

研究人员提出的框架 SSL-HPT 使用时间序列特征作为输入(不牺牲精确度的情况下),在较短的时间内产生最佳的超参数。

那么,它们是如何工作的呢?

研究人员开发的自监督学习框架在预测时的两个主要任务: SSL-MS 和 SSL-HPT。

SSL-MS: SSL-MS 的自我监督学习框架包括三个步骤,如下所示:

1eef003a-a610-11eb-aece-12bb97331649.png

1 离线训练数据准备: 获得每个时间序列的时间序列特征和每个时间序列的最佳性能模型通过离线超参数调整。

2 离线训练: 利用步骤1中的数据训练分类器(自我监督学习者) ,其中输入特征(预测器)是时间序列特征,标记是步骤1中性能最好的模型。

3 线模型预测: 在线服务中,对于新的时间序列数据,提取特征,然后使用预先训练的分类器进行推理,例如随机森林模型。

SSL-MS 的工作流程可以自然地扩展到 SSL-HPT。

如下图所示,给定一个模型,探索每个时间序列在预定义参数空间内的所有超参数设置。

对于输入 x,研究者在这里使用的时间序列特征与 SSL-MS 相同。

自监督学习器一经训练,就可以直接对超参数进行预测,并针对任何新的时间序列数据产生预测结果。

1f1286c2-a610-11eb-aece-12bb97331649.png

最终,研究人员通过在内部和外部数据集上对新型算法进行了实证评估,并得到了相似的结论。

SSL 框架可以极大地提高模型选择和超参数调整的效率,以可比的预测精度减少6-20倍的运行时间。

预测为什么重要?

预测是 Facebook 的核心数据科学和机器学习任务之一,因此提供快速、可靠、准确的预测结果和大量的时间序列数据对自身的业务非常重要。

这个框架的应用包括容量规划和管理、需求预测、能源预测和异常检测

计算技术的迅速发展使企业能够跟踪大量的时间序列数据集。因此,定期预测数百万个时间序列的需求正变得越来越普遍。

但是,要获得大量时间序列的快速且准确的预测仍然具有挑战性。

Facebook新提出的 SSL 框架提供了一个高效的解决方案,以低计算成本和短运行时间提供高质量的预测结果。

这种方法独立于特定的预测模型和算法,因此享有单个预测技术的优势,例如 Prophet 模型的可解释性。

初步分析表明, SSL框架可以扩展到模型推荐,并在Facebook内部 AX 库中增强贝叶斯优化算法。

论文一作:普渡大学华人学者

这篇论文一作是普渡大学大学的研究员Peiyi Zhang。

Peiyi Zhang本科毕业于浙江大学,并在康奈尔大学获得了硕士学位,普渡大学获得了博士学位。

去年6月,她还在Facebook进行了两个月的实习。

Peiyi Zhang曾获得洛杉矶市数据分析项目荣誉奖、浙江大学学生科研训练计划优秀奖、大学生数学建模竞赛优秀奖。

Xiaodong Jiang是本片论文的第二作者,他目前在Facebook工作,担任基础设施研究数据科学家,开发通用时间序列分析工具。

他在佐治亚大学获得了硕士和博士学位。

参考资料

https://ai.facebook.com/blog/large-scale-forecasting-self-supervised-learning-framework-for-hyper-parameter-tuning/

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SSL
    SSL
    +关注

    关注

    0

    文章

    124

    浏览量

    25717
  • 分类器
    +关注

    关注

    0

    文章

    152

    浏览量

    13172

原文标题:华裔女博士生一作:Facebook提出用于超参数调整的自我监督学习框架

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    卷积神经网络的参数调整方法

    卷积神经网络因其在处理具有空间层次结构的数据时的卓越性能而受到青睐。然而,CNN的成功很大程度上依赖于其参数的合理设置。参数调整是一个复杂的过程,涉及到多个
    的头像 发表于 11-15 15:10 205次阅读

    时空引导下的时间序列自监督学习框架

    【导读】最近,香港科技大学、上海AI Lab等多个组织联合发布了一篇时间序列无监督预训练的文章,相比原来的TS2Vec等时间序列表示学习工作,核心在于提出了将空间信息融入到预训练阶段,即在预训练阶段
    的头像 发表于 11-15 11:41 110次阅读
    时空引导下的时间序列自<b class='flag-5'>监督学习</b><b class='flag-5'>框架</b>

    哈尔滨工业大学在分辨显微成像技术领域取得突破性进展

    近日,哈尔滨工业大学仪器学院先进光电成像技术研究室(IPIC)李浩宇教授团队在生物医学分辨显微成像技术领域取得突破性进展。针对目前活体细胞分辨成像领域中光子效率不足的难题,团队提出一种基于无
    的头像 发表于 09-27 06:33 178次阅读
    哈尔滨工业大学在<b class='flag-5'>超</b>分辨显微成像技术领域取得突破性进展

    Linux操作系统运行参数自动调整技术

    Linux操作系统运行参数的自动调整是一个复杂而关键的技术,它可以显著提高系统性能、稳定性和资源利用率。通过使用自适应算法特别是内核态的机器学习框架、性能监控工具和配置管理工具,能够在
    的头像 发表于 08-22 09:53 249次阅读
    Linux操作系统运行<b class='flag-5'>参数</b>自动<b class='flag-5'>调整</b>技术

    【《大语言模型应用指南》阅读体验】+ 基础知识学习

    收集海量的文本数据作为训练材料。这些数据集不仅包括语法结构的学习,还包括对语言的深层次理解,如文化背景、语境含义和情感色彩等。 自监督学习:模型采用自监督学习策略,在大量无标签文本数据上学习
    发表于 08-02 11:03

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 516次阅读

    【《大语言模型应用指南》阅读体验】+ 基础篇

    讲解,包括偏置、权重、激活函数;三要素包括网络结构、损失函数和优化方法。章节最后总结了神经网络参数学习的关键步骤。 1.4章节描述了自然语言处理的相关知识点,包括什么是自然语言处理、文本的向量化和自监督学习
    发表于 07-25 14:33

    神经网络如何用无监督算法训练

    神经网络作为深度学习的重要组成部分,其训练方式多样,其中无监督学习是一种重要的训练策略。无监督学习旨在从未标记的数据中发现数据内在的结构、模式或规律,从而提取有用的特征表示。这种训练方式对于大规模未
    的头像 发表于 07-09 18:06 692次阅读

    深度学习中的无监督学习方法综述

    应用中往往难以实现。因此,无监督学习在深度学习中扮演着越来越重要的角色。本文旨在综述深度学习中的无监督学习方法,包括自编码器、生成对抗网络、聚类算法等,并分析它们的原理、应用场景以及优
    的头像 发表于 07-09 10:50 481次阅读

    谷歌提出大规模ICL方法

    谷歌DeepMind团队近日取得了一项突破性的研究成果。他们提出了强化和无监督两种新型的ICL(In-Context Learning)学习方法,这一创新技术能够在多个领域显著提升模型的性能。
    的头像 发表于 05-14 14:17 320次阅读

    阿里达摩院提出“知识链”框架,降低大模型幻觉

    近日,阿里巴巴达摩院(湖畔实验室)携手新加坡南洋理工大学等研究机构,共同推出了大模型知识链(CoK)框架。该框架不仅可实时检索异构知识源,还能逐步纠正推理错误,有效提高了大模型在回答知识型问题时的准确率,并显著降低了所谓的“幻觉现象”。
    的头像 发表于 05-10 11:46 657次阅读

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。参数调优是机器学习例程中的基本步骤之一。该方法也称为参数
    的头像 发表于 03-23 08:26 561次阅读
    机器<b class='flag-5'>学习</b>8大调参技巧

    谷歌发布ASPIRE训练框架,提升AI选择性预测能力

    框架分为三步骤:“特定任务调整”、“答案采样”以及“自我评估学习”。首先,“特定任务调整”阶段针对基本训练的大型语言模型进一步深化训练,重
    的头像 发表于 01-23 11:19 503次阅读

    基于transformer和自监督学习的路面异常检测方法分享

    铺设异常检测可以帮助减少数据存储、传输、标记和处理的压力。本论文描述了一种基于Transformer和自监督学习的新方法,有助于定位异常区域。
    的头像 发表于 12-06 14:57 1451次阅读
    基于transformer和自<b class='flag-5'>监督学习</b>的路面异常检测方法分享

    香港大学最新提出!实现超现实的人类图像生成:HyperHuman

    最后,为了进一步提高视觉质量,我们提出了一种结构引导细化器来组合预测条件,以更详细地生成更高分辨率。大量的实验表明,我们的框架具有最先进的性能,可以在不同的场景下生成逼真的人类图像。
    的头像 发表于 11-27 16:03 718次阅读
    香港大学最新<b class='flag-5'>提出</b>!实现超现实的人类图像生成:HyperHuman