我们研究视频到视频的合成问题,其目的是学习从输入源视频(例如,一系列语义分割掩码)到精确描述源视频内容的输出真实感视频的映射功能。
虽然它的图像对应物(图像到图像合成问题)是一个受欢迎的话题,但是视频到视频合成问题在文献中很少探讨。在不了解时间动态的情况下,将现有的图像合成方法直接应用于输入视频通常会导致视觉质量低下的时间不连贯视频。
在本文中,我们提出了一种在生成对抗性学习框架下的新颖的视频合成方法。通过精心设计的生成器和鉴别器架构以及时空对抗目标,我们可以通过多种输入格式(包括分割蒙版,草图和姿势)获得高分辨率,逼真的,时间上连贯的视频结果。在多个基准上进行的实验表明,与强基准相比,我们的方法具有优势。
尤其是,我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。
我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。
我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。
-
视频
+关注
关注
6文章
2017浏览量
75233 -
图像
+关注
关注
2文章
1097浏览量
42485 -
鉴别器
+关注
关注
0文章
8浏览量
8869
发布评论请先 登录
将 MCUX SDK LIN 堆栈集成到 Zephyr OS 中,是否有一种方法可以自动生成它们从 .ldf 文件?
GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选
自动驾驶场景生成方法及优选方案:康谋aiSim 3DGS方案重塑行业标准
京东零售广告创意:统一的布局生成和评估模型
一种无OS的MCU实用软件框架
指令集测试的一种纠错方法
【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用
一种适用于动态环境的自适应先验场景-对象SLAM框架
一种新的无刷直流电机反电动势检测方法
一种新的无刷直流电机反电动势检测方法
一种带通滤波器在无位置传感器转子检测中的应用
一种基于扩散模型的视频生成框架RoboTransfer
NVIDIA recsys-examples在生成式推荐系统中的高效实践
【Firefly自研】高性能全流程视频处理框架:FFMedia
一种在生成对抗性学习框架下的新颖的视频合成方法
评论