一个通用的时空预测学习框架-电子发烧友网

本文介绍CVPR2023的中稿论文：Temporal Attention Unit: Towards Efficient Spatiotemporal Predictive Learning。这篇论文介绍了一种用于高效时空预测的时间注意力单元（Temporal Attention Unit，TAU）。该方法改进了现有框架，对时间和空间上的依赖关系分别学习，提出了时间维度上的可并行化时序注意力单元，实现了高效的视频预测。

引言

时空预测学习是一种通过学习历史帧来预测未来帧的自监督学习范式，可以利用海量的无标注视频数据学习丰富的视觉信息，在气象预测、交通流量预测、人体姿势变化估计等领域有着广泛的应用场景。时空预测学习需要考虑视频中的空间相关性和时间演变规律，这是一项具有挑战性的任务。传统的方法主要基于循环神经网络来建模时间依赖关系，但是RNN有着计算效率低、难以捕捉长期依赖、容易出现梯度消失或爆炸等缺点。因此，如何设计一个高效、准确、稳定的时空预测学习模型，是一个亟待解决的问题。为了解决这个问题，我们首先研究现有的方法,并提出时空预测学习的通用框架，如下图所示。

TAU

如下图所示，TAU模型不使用循环神经网络，而是使用注意力机制来并行化地处理时间演变。TAU模型将时空注意力分解为两个部分：帧内静态注意力和帧间动态注意力。帧内静态注意力使用小核心深度卷积和扩张卷积来实现大感受野，从而捕捉帧内的长距离依赖关系。帧间动态注意力使用通道间注意力的方式来学习不同帧之间的通道权重，从而捕捉帧间的变化趋势。

TAU模块将时间注意力分为两部分：帧内静态注意力和帧间动态注意力。前者通过获得的大感受野捕捉帧内的长期依赖关系；而后者以挤压和激发的方式学习通道的注意力权重，以捕捉时间线上的时序演变。最后的注意力是动态注意力和静态注意力结合的产物。受ViTs和大核卷积的启发，研究者使用了深度卷积（DW Conv）、深度扩张卷积（DW-D Conv）和1x1通道卷积来建模大核卷积。

此外，我们还提出了一种新颖的差分散度正则化方法，用于优化时空预测学习的损失函数。该方法同时考虑了帧内误差和帧间变化量。通过将预测帧和真实帧之间的差分转换为概率分布，并计算它们之间的KL散度，来强制模型学习到视频中固有的变化规律。差分散度正则化（differential divergence regularization）是预测帧与其对应的真实帧之间的Kullback-Leibler（KL）散度。具体而言，它是预测帧差分和真实帧差分之间的KL散度。

τ 代表温度参数，经验性地将其设置为0.1以增强概率分布的差异。直观来说，均方误差损失（MSE）仅考虑帧内误差，而差分散度正则化克服了这一缺点，迫使模型学习连续帧之间的差异并意识到固有的变化，以改善模型的预测。

因此目标损失函数：

实验

Moving MNIST

下图是在Moving MNIST上测试的两个实例，对于随机运动的数字，预测与目标的绝对差异很细微，说明TAU能很好地处理时空预测：

相对于SOTA的循环模型，TAU的性能增益是较大的，在三个度量指标下，TAU的表现都超越了其他方法：

TaxiBJ

在真实复杂环境的交通流量数据集上，TAU具有良好的表现：

不同数据的泛化

为了检验模型的泛化能力，我们先在KITTI原始数据上进行训练，接着使用Caltech dataset进行评估，评估时输入前十帧预测下一帧。

灵活长度的预测

我们的模型可以通过模仿RNN，将预测的帧作为输入并递归产生预测来处理灵活长度的预测。对于KTH数据集，人体运动预测任务的难点不仅在于预测帧的灵活长度，还在于涉及人类意识随机性的复杂动力学，这增加了任务的困难程度。TAU可以从给定的10帧中预测接下来的20或40帧，也有出色的表现。

运行效率

此外，我们的模型不仅可以提高视频生成质量，还可以提高计算效率和训练速度。如下图所示，收敛速度极快，50轮训练即可达到MSE 35.0的水准。在相同实验环境下，TAU模型在基准数据集上每个周期只需要2.5分钟，而此前的SOTA方法需要7到30分钟不等。

总结

本文提出了一个通用的时空预测学习框架，使用基于静态和动态结合的时间注意力模块替代循环单元，还引入了差分散度正则化方法来解决仅考虑帧内误差的MSE损失的问题，为高效的时空预测学习提供了新的范式。
责任编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4787

浏览量
101336
数据

数据

+关注

关注
8

文章
7217

浏览量
89915
框架

框架

+关注

关注
0

文章
403

浏览量
17566

深度学习发展的5个主力框架

在这篇文章中，我想向大家介绍推动深度学习发展的5个主力框架。这些框架使数据科学家和工程师更容易为复杂问题构建深度学习解决方案，并执行更复杂的

发表于 05-04 10:30 •4090次阅读

深度<b class='flag-5'>学习</b>发展的5<b class='flag-5'>个</b>主力<b class='flag-5'>框架</b>

PLASTER：一个与深度学习性能有关的框架

PLASTER 是一个与深度学习有关的框架，为致力于开发和部署基于 AI 的服务的人士提供了全方位指导。本文介绍了每个框架元素的测量方式，以

发表于 06-22 15:07 •3579次阅读

谷歌发布机器学习框架：一个名叫NSL的神经结构学习框架

神经结构学习框架（NSL）的作用很大，它可以制作计算机视觉模型、执行自然语言处理（NLP）、从医疗记录或知识图等图形数据集中运行预测，还可以与 TensorFlow 机器学习平台配合使

发表于 09-20 14:30 •3501次阅读

一个跳出人类思维框架的人工智能抗生素预测平台

他们开发了一个跳出人类思维框架的人工智能抗生素预测平台，这个平台不需要知道药物的作用机制，甚至不需要科学家标注化学基团，它能一

发表于 03-10 11:51 •2033次阅读

一个全新的深度学习框架——计图

清华大学计算机系胡事民教授研究团队提出了一个全新的深度学习框架——计图（Jittor）。Jittor是一

发表于 03-26 15:50 •6899次阅读

一种用于交通流预测的深度学习框架

交通流预测作为智能交通系统的一个关键问题，是国内外交通领域的硏究热点。交通流预测的主要挑战在于交通流数据本身具有复杂的时空关联，且易受各种社

发表于 04-14 15:54 •3次下载

基于时空特性的ST-LSTM网络位置预测模型

针对现有位置预测研究多数忽略时间和空间之间关联性的问题，提岀一种基于时空特性的长短期记忆模型（ ST-LSTM）。基于LSTM网络添加单独处理用户移动行为时空信息的

发表于 06-11 11:28 •13次下载

基于预测分析的时空众包在线任务分配算法

基于预测分析的时空众包在线任务分配算法

发表于 06-27 16:12 •6次下载

一个基于参数更新的迁移学习的统一框架

它提出一个基于参数更新的迁移学习的统一框架，建立多种参数优化方法之间的联系，从而方便理解不同方法背后的关键设计，进而设计出只更新更少参数同时

发表于 09-26 10:29 •1387次阅读

时空图神经网络预测学习应用解析

在第四节中，我们介绍了STGNN的基本神经架构，增强了对STGNN中时空学习泛化范式的理解。然而，近年来出现了许多前沿方法来改进时空依赖关系的学习。

发表于 05-11 15:00 •2973次阅读

通用的时空预测学习框架实现高效视频预测案例

TAU模型将时空注意力分解为两个部分：帧内静态注意力和帧间动态注意力。帧内静态注意力使用小核心深度卷积和扩张卷积来实现大感受野，从而捕捉帧内的长距离依赖关系。

发表于 06-19 10:25 •549次阅读

深度学习框架是什么？深度学习框架有哪些？

深度学习框架是什么？深度学习框架有哪些？深度学习框架是一

发表于 08-17 16:03 •2995次阅读

深度学习框架区分训练还是推理吗

深度学习框架区分训练还是推理吗深度学习框架是一个非常重要的技术，它们能够加速深度

发表于 08-17 16:03 •1485次阅读

深度学习框架连接技术

深度学习框架连接技术深度学习框架是一个能够帮助机器学习

发表于 08-17 16:11 •845次阅读

深度学习框架和深度学习算法教程

深度学习框架和深度学习算法教程深度学习是机器学习领域中的一

发表于 08-17 16:11 •1150次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

一个通用的时空预测学习框架

评论

深度学习发展的5个主力框架

PLASTER：一个与深度学习性能有关的框架

谷歌发布机器学习框架：一个名叫NSL的神经结构学习框架

一个跳出人类思维框架的人工智能抗生素预测平台

一个全新的深度学习框架——计图

一种用于交通流预测的深度学习框架

基于时空特性的ST-LSTM网络位置预测模型

基于预测分析的时空众包在线任务分配算法

一个基于参数更新的迁移学习的统一框架

时空图神经网络预测学习应用解析

通用的时空预测学习框架实现高效视频预测案例

深度学习框架是什么？深度学习框架有哪些？

深度学习框架区分训练还是推理吗

深度学习框架连接技术

深度学习框架和深度学习算法教程