0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种在生成对抗性学习框架下的新颖的视频合成方法

倩倩 来源:互联网分析沙龙 2020-04-09 14:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们研究视频到视频的合成问题,其目的是学习从输入源视频(例如,一系列语义分割掩码)到精确描述源视频内容的输出真实感视频的映射功能。

虽然它的图像对应物(图像到图像合成问题)是一个受欢迎的话题,但是视频到视频合成问题在文献中很少探讨。在不了解时间动态的情况下,将现有的图像合成方法直接应用于输入视频通常会导致视觉质量低下的时间不连贯视频。

在本文中,我们提出了一种在生成对抗性学习框架下的新颖的视频合成方法。通过精心设计的生成器和鉴别器架构以及时空对抗目标,我们可以通过多种输入格式(包括分割蒙版,草图和姿势)获得高分辨率,逼真的,时间上连贯的视频结果。在多个基准上进行的实验表明,与强基准相比,我们的方法具有优势。

尤其是,我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。

我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。

我们的模型能够合成长达30秒的街道场景的2K分辨率视频,从而大大提高了视频合成的最新水平。最后,我们将我们的方法应用于未来的视频预测,其性能超过了几个最先进的竞争系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 视频
    +关注

    关注

    6

    文章

    2017

    浏览量

    75233
  • 图像
    +关注

    关注

    2

    文章

    1097

    浏览量

    42485
  • 鉴别器
    +关注

    关注

    0

    文章

    8

    浏览量

    8869
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    将 MCUX SDK LIN 堆栈集成到 Zephyr OS 中,是否有一种方法可以自动生成它们从 .ldf 文件?

    我将 MCUX SDK LIN 堆栈集成到 Zephyr OS 中,现在正在 S32K344-wb 板上对其进行测试,但我想更改 cfg 文件,我想知道是否有一种方法可以自动生成它们从 .ldf 文件。
    发表于 04-24 06:33

    GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选

    GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选 在电子设计领域,时钟和定时生成器对于确保系统的稳定运行和精确同步至关重要。今天,我们就来深入探讨下 Gennum
    的头像 发表于 04-15 10:10 214次阅读

    自动驾驶场景生成方法及优选方案:康谋aiSim 3DGS方案重塑行业标准

    在自动驾驶技术飞速发展的当下,仿真测试的重要性愈发凸显,而 自动驾驶场景生成 作为仿真测试的核心环节,其技术水平直接决定了测试的效率与可靠性。面对传统场景生成方式的诸多痛点,基于生成式AI的4D场景
    的头像 发表于 02-02 17:39 567次阅读

    京东零售广告创意:统的布局生成和评估模型

    至关重要的作用。当前的布局生成方法在能力上具有任务特定性,并且评估标准与人类感知不致,导致其应用范围有限且评估效果不佳。为了解决这些问题,Uni-Layout实现了统一生成、模拟人类的评估以及二者之间的对齐。针对通用
    的头像 发表于 01-13 16:18 1240次阅读
    京东零售广告创意:统<b class='flag-5'>一</b>的布局<b class='flag-5'>生成</b>和评估模型

    一种无OS的MCU实用软件框架

    介绍一种无OS的MCU实用软件框架,包括任务轮询管理,命令管理器、低功耗管理、环形缓冲区等实用模块。系统中广泛利用自定义段技术减少各个模块间的耦合关系,大大提供程序的可维护性。 主要功能 支持模块
    发表于 01-08 06:58

    指令集测试的一种纠错方法

    本文描述在进行指令集测试的一种纠错方法 1.打开测试指令集对应的dump文件 dump文件是指由汇编文件进行反汇编之后,可以供人阅读指令的反汇编文件。其包含了每条指令的具体操作的信息。指令集测试
    发表于 10-24 14:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接
    发表于 09-17 11:45

    一种适用于动态环境的自适应先验场景-对象SLAM框架

    由于传统视觉SLAM在动态场景中容易会出现严重的定位漂移,本文提出了一种新颖的基于场景-对象的可靠性评估框架,该框架通过当前帧质量指标以及相对于可靠参考帧的场景变化,全面评估SLAM的
    的头像 发表于 08-19 14:17 1070次阅读
    <b class='flag-5'>一种</b>适用于动态环境的自适应先验场景-对象SLAM<b class='flag-5'>框架</b>

    一种新的无刷直流电机反电动势检测方法

    无位置传感器无刷直流电机的控制算法是近年来研究的热点之,有霍尔位置信号直流电机根据霍尔状态来确定通断功率器件。利用无刷直流电机的数学模型,根据反电动势检测原理,提出了一种新的线反电动势检测方法
    发表于 08-07 14:29

    一种新的无刷直流电机反电动势检测方法

    无位置传感器无刷直流电机的控制算法是近年来研究的热点之,有霍尔位置信号直流电机根据霍尔状态来确定通断功率器件。利用无刷直流电机的数学模型,根据反电动势检测原理,提出了一种新的线反电动势检测方法
    发表于 08-04 14:59

    一种带通滤波器在无位置传感器转子检测中的应用

    摘 要:论文研究了一种直流无刷电机的无位置传感器的转子位置的硬件电路检测方法。结合传统“反电动势\"方法,分析并设计了一种新的带通滤波器延时检测电路。该电路不仅可以抑制高频分量和消除直
    发表于 08-04 14:56

    一种基于扩散模型的视频生成框架RoboTransfer

    在机器人操作领域,模仿学习是推动具身智能发展的关键路径,但高度依赖大规模、高质量的真实演示数据,面临高昂采集成本与效率瓶颈。仿真器虽提供了低成本数据生成方案,但显著的“模拟到现实”(Sim2Real)鸿沟,制约了仿真数据训练策略的泛化能力与落地应用。
    的头像 发表于 07-09 14:02 994次阅读
    <b class='flag-5'>一种</b>基于扩散模型的<b class='flag-5'>视频生成</b><b class='flag-5'>框架</b>RoboTransfer

    NVIDIA recsys-examples在生成式推荐系统中的高效实践

    在生成式 AI 浪潮的推动下,推荐系统领域正经历深刻变革。传统的深度学习推荐模型 (DLRMs) 虽已展现出定效果,但在捕捉用户兴趣偏好和动态行为序列变化时,常面临可扩展性挑战。生成
    的头像 发表于 07-04 14:43 1375次阅读
    NVIDIA recsys-examples<b class='flag-5'>在生成</b>式推荐系统中的高效实践

    【Firefly自研】高性能全流程视频处理框架:FFMedia

    什么是FFMedia?RK3588系列芯片拥有超强的视频编解码能力,尤其在多路视频并发处理上表现优异。然而我们在视频处理应用开发时,经常面对gstreamer、ffmpeg等通用框架
    的头像 发表于 07-01 16:32 2701次阅读
    【Firefly自研】高性能全流程<b class='flag-5'>视频</b>处理<b class='flag-5'>框架</b>:FFMedia

    4K、多模态、长视频:AI视频生成的下个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可生成多镜头无缝切换的1080P高品质
    的头像 发表于 06-16 00:13 7631次阅读