0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

时空引导下的时间序列自监督学习框架

可靠性杂坛 来源:可靠性杂坛 2024-11-15 11:41 次阅读

【导读】最近,香港科技大学、上海AI Lab等多个组织联合发布了一篇时间序列无监督预训练的文章,相比原来的TS2Vec等时间序列表示学习工作,核心在于提出了将空间信息融入到预训练阶段,即在预训练阶段考虑各个序列之间的关系。因此,本文提出的方法更适合作为时空预测领域的预训练模型。下面为大家详细介绍一下这篇文章。

7bf1ef6c-9073-11ef-a511-92fbcf53809c.png

摘要

相关时间序列分析在许多现实行业中扮演着重要的角色。为进一步的下游任务学习这个大规模数据的有效表示是必要的,但也具有挑战性。在本文中,我们提出了一个通过时空引导表示预测的单个实例的时间步长级表示学习框架。我们评估了我们的表示学习框架在相关时间序列预测和将预测模型转移到有限数据的新实例。在学习到的表示之上训练的线性回归模型表明,我们的模型在大多数情况下表现最好。特别是与表示学习模型相比,我们在PeMS-BAY数据集上将RMSE、MAE和MAPE分别减少了37%、49%和48%。此外,在真实世界的地铁客流数据中,我们的框架展示了传输以推断新的冷启动实例的未来信息的能力,收益分别为15%、19%和18%。

1 背景

近年来,许多关于时间序列自监督学习方法的研究仍存在几个显著的缺点:

最近的研究[13, 14]只学实例级表示,不适合点级任务,如预测和异常检测。尽管它们在许多时间序列下游任务(如分类和聚类)上成功。

当前研究忽视不同实例间的相关性,学习相关时间序列的集成表示,难以转移到现实世界的下游任务,例如子实例预测。

所有基于对比的方法(如TS2Vec)都对数据分布或实例相关性做出假设,可能失去多样性,并可能出现假阴性样本。

7c0ca334-9073-11ef-a511-92fbcf53809c.png

(a)空间相关性:一个车站的客流通常受到其图形邻居的影响。

7c32ac64-9073-11ef-a511-92fbcf53809c.png

(b)每周周期模式的时间相关性与缺失数据问题

图1:相关时间序列的时空相关性的一个例子:[1]、[2]地铁站的乘客流入。(a)空间相关性:相邻车站的客流通常都很相似。(b)时间相关性:一个车站的客流通常具有历史时期的模式。此外,还观察到缺失的数据。

为了解决这些挑战,我们提出了一个通过时空引导的相关时间序列表示学习框架。本文的主要贡献总结如下:

我们构建了一个学习框架,用于学习任意实例在任何时间步长内的点级表示。这具有灵活性,所学习到的表示法可以被微调用于1) 相关的时间序列预测,以及2) 用于新实例的转移任务,而无需重新训练预测模型。为了捕捉空间和时间上的相关性,我们在自监督学习框架中利用了来自预定义相邻矩阵的历史数据和相邻信息。

为了避免在时间序列数据的对比学习范式中经常出现的假阴性,我们在模型中加入了一个没有负样本的自监督学习框架。我们定义了空间和时间目标,并使用蒙版视图来预测目标的表示,以学习相关性。

我们根据实际数据不同下游任务的结果和分析,展示了表示学习框架的有效性和灵活性。我们对预测任务的评估显示了具有可比性能的端到端解决方案,但我们的方法更灵活,可以转移到进入数据集的新实例,而无需重新训练模型。

2 相关工作

2.1预文本任务时间序列学习

通过设计各种预文本任务来提取有用的信息,以帮助模型在下游任务中表现良好。这些预文本任务包括遮盖序列的重构、相对定位、时间洗牌和对比预测编码任务等。这些任务的目的是学习时间序列的有效表示,以便在下游任务中获得更好的性能。此外,还有其他的预文本任务,如引导空间时间表示预测等。

2.2基于对比的时间序列学习

基于对比的时间序列学习是一种时间序列表示学习的方法,其中大多数方法都采用对比学习框架。这些方法通过构建正负样本对来进行自监督学习,其中对比损失试图最大化正样本对之间的相似性,同时最小化负样本对之间的相似性。先前的研究提出了许多方法来选择正负样本对,以提高所学习表示的质量。这些方法包括使用三元组损失随机选择时间段、使用对比预测编码(CPC)等。这些方法的目的是学习时间序列的有效表示,以便在下游任务中获得更好的性能。

3 方法

这边主要介绍提出的模型框架。该模型的编码器由三个组件组成:输入投影层、扩张卷积神经网络模块和MLP预测器。对于每个输入w,输入投影层是一个全连接层,将时间戳t的观测值xi,t映射到高维潜在向量z。然后,应用具有十个残差块的扩张卷积神经网络模块来提取每个时间戳的上下文表示。每个扩张卷积块包含两个1-D卷积层,具有扩张参数(对于第l个块为2的l次方)。扩张卷积使不同领域具有大的感受野。在BYOL的思想下,通过预测视图的不同目标而不是对比来学习表示。在视图和目标通过全连接层f映射到高维潜在向量之后,使用两个扩张卷积神经网络预测器来预测从遮盖视图嵌入的潜在向量中的时空表示。

7c502028-9073-11ef-a511-92fbcf53809c.png

图2:提出的一种相关时间序列的表示学习框架:主干由一个投影到高维空间的线性层,两个具有不同参数的扩张卷积编码器和一个用于根据蒙版视图嵌入的潜在向量来预测时空表示的预测器组成。

4实验结果

4.1相关的时间序列预测

下图为本文提出的表示学习方法在时空预测数据集上的预测效果,可以看到相比TS2Vec,我们的方法有比较明显的效果提升。这足以说明我们提出的引入空间信息的对比学习,对于时空预测类型的问题效果更好。

表1:所提方法和基线MAE、MAPE和RMSE(最好的加粗表示,下同)

7c6ca81a-9073-11ef-a511-92fbcf53809c.png

我们在PEMS-BAY数据集上的性能优于基于时空图的神经网络对PEMS-BAY数据集的短期预测。我们可以看到,与TS2Vec相比,我们的模型有更好的预测趋势。

7c8c51c4-9073-11ef-a511-92fbcf53809c.png

图3.我们的模型和TS2Vec的一个典型预测切片可视化。

4.2 冷启动——将模型转移到数据有限的新实例

如图4所示,由于新的地铁站的建设,地铁网络图结构会发生变化,同时这些新的地铁站通常只有很少的历史数据可用,因此预测它们的未来客流量会变得更加困难,这就是时间序列预测的"cold-start"问题。我们提出的方法在大多数情况下都取得了最好的预测性能(表2)。

7ca14c00-9073-11ef-a511-92fbcf53809c.png

图4新建地铁站数据有限,也改变地铁网络图(绿色突出显示) 表2:新车站的城市地铁:拟建方法的MAE、MAPE、RMSE及基线。

7cc46384-9073-11ef-a511-92fbcf53809c.png

4.3 消融研究

为了验证我们的模型中时间和空间成分的有效性,我们比较了在METRLA数据集上不同超参数α值的模型性能。我们将α的值从0→1,时间间隔为0.25,其中α = 1意味着我们只使用历史信息,而α = 0意味着我们只考虑空间依赖性。

表3:METR-LA对α不同值的消融结果

7ce49ef6-9073-11ef-a511-92fbcf53809c.png

表3显示,当α=为0.5时,我们的模型在短期预测中表现最好。当时间目标的贡献大于空间目标时,或当α=值为0.75时,该模型的长期预测效果更好。

4.4 对丢失的数据具有鲁棒性

我们以METR-LA数据集为例,以三个缺失率、20%、40%和60%的随机缺失数据来评估预测性能。图5显示,在缺失率小于60%的情况下,我们的空间和时间目标都是非常稳健的。请注意,对于较小的α,如α = 0.25,预测性能比α = 0.75稳定。这表明空间目标的设计可以提高表示学习框架的鲁棒性。

7cfd1e9a-9073-11ef-a511-92fbcf53809c.png

图5:METR-LA数据集对不同缺失数据率和α的MAE

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3638

    浏览量

    134415
  • 数据
    +关注

    关注

    8

    文章

    7002

    浏览量

    88937
  • 时间序列
    +关注

    关注

    0

    文章

    31

    浏览量

    10426

原文标题:基于时空引导的时间序列自监督学习

文章出处:【微信号:可靠性杂坛,微信公众号:可靠性杂坛】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    适用于任意数据模态的监督学习数据增强技术

    本文提出了一种适用于任意数据模态的监督学习数据增强技术。   监督学习算法在自然语言处理、计算机视觉等领域取得了重大进展。这些
    的头像 发表于 09-04 10:07 1106次阅读
    适用于任意数据模态的<b class='flag-5'>自</b><b class='flag-5'>监督学习</b>数据增强技术

    基于transformer和监督学习的路面异常检测方法分享

    铺设异常检测可以帮助减少数据存储、传输、标记和处理的压力。本论文描述了一种基于Transformer和监督学习的新方法,有助于定位异常区域。
    的头像 发表于 12-06 14:57 1526次阅读
    基于transformer和<b class='flag-5'>自</b><b class='flag-5'>监督学习</b>的路面异常检测方法分享

    基于半监督学习框架的识别算法

    人体行为识别是计算机视觉研究的热点问题,现有的行为识别方法都是基于监督学习框架.为了取得较好的识别效果,通常需要大量的有标记样本来建模.然而,获取有标记样本是一个费时又费力的工作.为了解决这个
    发表于 01-21 10:41 1次下载

    机器学习算法中有监督和无监督学习的区别

    监督学习的好处之一是,它不需要监督学习必须经历的费力的数据标记过程。但是,要权衡的是,评估其性能的有效性也非常困难。相反,通过将监督学习算法的输出与测试数据的实际标签进行比较,可以很容易地衡量
    的头像 发表于 07-07 10:18 5753次阅读

    监督学习与Transformer相关论文

    将在明年5月4日举行,目前,本次大会投稿已经结束,最后共有3013篇论文提交。ICLR 采用公开评审机制,任何人都可以提前看到这些论文。 为了分析最新研究动向,我们精选了涵盖监督学习
    的头像 发表于 11-02 15:50 2682次阅读
    <b class='flag-5'>自</b><b class='flag-5'>监督学习</b>与Transformer相关论文

    最基础的半监督学习

    导读 最基础的半监督学习的概念,给大家一个感性的认识。 半监督学习(SSL)是一种机器学习技术,其中任务是从一个小的带标签的数据集和相对较大的未带标签的数据中学习得到的。SSL的目标是
    的头像 发表于 11-02 16:08 2645次阅读

    监督学习最基础的3个概念

    导读 今天给大家介绍半监督学习中的3个最基础的概念:一致性正则化,熵最小化和伪标签,并介绍了两个经典的半监督学习方法。 没看一的点这里哈:半监督学习入门基础(一) 半监督学习 (SSL
    的头像 发表于 11-02 16:14 2955次阅读
    半<b class='flag-5'>监督学习</b>最基础的3个概念

    为什么半监督学习是机器学习的未来?

    为什么半监督学习是机器学习的未来。 监督学习是人工智能领域的第一种学习类型。从它的概念开始,无数的算法,从简单的逻辑回归到大规模的神经网络,都已经被研究用来提高精确度和预测能力。 然而
    的头像 发表于 11-27 10:42 3896次阅读

    监督学习:比监督学习做的更好

    监督学习是人工智能领域的第一种学习类型。从它的概念开始,无数的算法,从简单的逻辑回归到大规模的神经网络,都已经被研究用来提高精...
    的头像 发表于 12-08 23:32 1402次阅读

    基于人工智能的监督学习详解

    监督学习让 AI 系统能够从很少的数据中学习知识,这样才能识别和理解世界上更微妙、更不常见的表示形式。
    的头像 发表于 03-30 17:09 5980次阅读
    基于人工智能的<b class='flag-5'>自</b><b class='flag-5'>监督学习</b>详解

    华裔女博士提出:Facebook提出用于超参数调整的自我监督学习框架

    【导读】Facebook的研究人员近日提出了一种用于超参数调整的自我监督学习框架
    的头像 发表于 04-26 09:45 1762次阅读
    华裔女博士提出:Facebook提出用于超参数调整的自我<b class='flag-5'>监督学习</b><b class='flag-5'>框架</b>

    机器学习中的无监督学习应用在哪些领域

    监督学习|机器学习| 集成学习|进化计算| 非监督学习| 半监督学习|
    发表于 01-20 10:52 4955次阅读
    机器<b class='flag-5'>学习</b>中的无<b class='flag-5'>监督学习</b>应用在哪些领域

    监督学习的一些思考

    监督学习的流行是势在必然的。在各种主流有监督学习任务都做到很成熟之后,数据成了最重要的瓶颈。从无标注数据中学习有效信息一直是...
    发表于 01-26 18:50 1次下载
    <b class='flag-5'>自</b><b class='flag-5'>监督学习</b>的一些思考

    设计时空监督学习框架学习3D点云表示

    限数据的情况,半监督学习的显着改进;并且通过转移预训练模型来提升下游任务。例如,通过微调改进了SUN RGB-D和 KITTI 数据集上的 3D 对象检测,以及S3DIS上进行的3D 语义分割。
    的头像 发表于 12-06 10:23 802次阅读

    一个通用的时空预测学习框架

    ,实现了高效的视频预测。   引言 时空预测学习是一种通过学习历史帧来预测未来帧的监督学习范式,可以利用海量的无标注视频数据
    的头像 发表于 06-19 10:27 1450次阅读
    一个通用的<b class='flag-5'>时空</b>预测<b class='flag-5'>学习</b><b class='flag-5'>框架</b>