0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

除了刷屏的Sora,国内外还有哪些AI视频生成工具

Carol Li 来源:电子发烧友网 作者:李弯弯 2024-02-26 08:42 次阅读



电子发烧友网报道(文/李弯弯)近日,OpenAI发布的文生视频模型Sora全网刷屏。相比之前的文生视频模型,Sora无论是视频时长,还是画面精细度,细节完整性,或是多镜头拍摄,都更为突出。Sora的发布也让AI生成视频有了突破性进展。

过去一年多,全球科技公司都在发布各种大模型,然而AI生成内容更多集中在文本和图片方面,AI视频生成方面却进展缓慢。从当前的形势来看,AI视频生成在今年或许会有一番新景象。那么目前国内外都有哪些AI视频生成工具,效果如何呢?

Sora

OpenAI发布的新型视频生成模型Sora,其核心能力是能够生成长达一分钟的高清视频,这一时长远超之前的生成模型。而且,Sora生成的视频不仅画质卓越,细节丰富,而且帧率高、连续性好,几乎达到了无缝衔接的效果。

从OpenAI官网展示的一个视频来看,输入提示词“一位时尚女士走在东京的街道上,街道上充满了温暖的霓虹灯和动画城市标志。她穿着黑色皮夹克、红色长裙和黑色靴子,拿着一个黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信而随意。街道潮湿且反光,形成了五颜六色灯光的镜面效果。许多行人四处走动。”

生成的视频,无论是运镜还是人物、地面、背景的细节,还有拉进镜头后人物面部上的皱纹、毛发、墨镜上的反光,都几乎可以以假乱真,画面稳定不错位。在长达60秒的视频里,画面随镜头的大幅度运动并没有出现错位的情况,整体风格保持了惊人的一致性。

IDC中国预测,Sora将率先在短视频、广告、互动娱乐、影视制作和媒体等行业中得到应用。在这些领域,利用Sora的多模态大模型能力,可以辅助内容行业的工作者更高效地创作视频,不仅加快了生产速度,还提高了产出数量,并为用户带来前所未有的视觉体验。这将助力企业实现成本降低、效率提升,并进一步优化用户体验。

Pika 1.0

在OpenAI发布视频生成模型Sora之前,去年11月29日,美国AI初创公司Pika labs发布的文生视频产品Pika 1.0呈现的效果在当时也相当惊艳。Pika labs是一家成立于去年4月份的初创公司,创始人郭文景和联合创始人兼CTO Chenlin Meng,都是斯坦福大学AI Lab博士生。一位专注于NLP(自然语言处理)和图形学,另一位主攻计算机视觉方向。

据介绍,该公司推出的视频生成模型Pika 1.0能够生成和编辑3D动画、动漫、卡通和电影。视频生成方面,可以通过文字生成视频,也可以图片生成视频。比如,只需输入提示词“马斯克穿着太空服,3D动画”,一个动画版本、穿着太空服准备乘坐火箭上太空的马斯克即可生成,外形、动作、背景等元素均十分逼真,可以媲美花大成本制作的3D动画影像。

Pika 1.0还可以通过原有视频生成更高质量的视频。该公司当时展示了一个骑马的黑白原视频,通过Pika 1.0生成了物种不同风格的动画,几乎涵盖现有电影和动画大部分风格,看上去质量效果非常好。除了视频生成,Pika 1.0还能够进行视频编辑,用户只需要选定编辑区域,就能根据文本提示词修改特定区域。

在当时来看,Pika 1.0的出现可以说效果好于之前的文生视频模型。然而随着现在Sora的出现,Pika或许会感觉到压力。Pika公司创始人郭文景表示,“我们觉得这是一个很振奋人心的消息,我们已经在筹备升级中,将直接对标 Sora。”

Gen-2

相比于OpenAI和Pika,成立于2018年的AI初创公司Runway应该是最早探索视频生成领域的企业。2022年2月,Runway发布了Gen-1,可以对原视频进行风格化的编辑。3月该公司又发布了生成式AI视频模型Gen-2,允许用户输入文本提示生成四秒长视频,8月,Runway添加了一个选项,可以将 Gen-2 中人工智能生成的视频延长至 18 秒。

在随后的几个月,Runway还对Gen-2 做了几次更新。之后更是推出动态笔刷Motion Brush,它是Runway视频生成工具Gen-2的一部分。Runway动态笔刷是一种利用人工智能技术让静止图片中的物体动起来的功能,你只需要在图片上用画笔涂抹你想要动起来的部分,Runway就会自动识别物体的运动轨迹和特征,生成逼真的动态效果。该工具的发布引起业界不小的关注。

在Pika 1.0和Sora出现之前,Runway的Gen-2模型被认为是AI视频制作的顶尖模型,它制作出来的视频效果逼真、流畅、高清。随着OpenAI Sora的发布,Runway接下来或许会有新动作,在Sora发布之后,Runway CEO第一时间在X上发推特称“game on(竞争开始了)”。

Stable Video Diffusion

在图片生成领域遥遥领先的Stability AI,去年11月发布了其最新的AI模型Stable Video Diffusion,这款模型能够通过现有图片生成视频,是基于之前发布的Stable Diffusion文本转图片模型的延伸,不过当时,这款模型并不是对所有人开放的。

据介绍,Stable Video Diffusion当时还处于Stability AI所谓的“研究预览”阶段。想要使用这款模型的人必须同意一些使用条款,其中规定了Stable Video Diffusion的预期应用场景(例如教育或创意工具、设计和其他艺术过程等)和非预期的场景(例如对人或事件的事实或真实的表达)。

从网友对比反馈来看,Stable Video Diffusion生成视频的效果可以与当时被看好的的Runway 和Pika Labs 的AI生成视频相媲美。不过局限性在于,Stability AI的视频生成模型,不能生成没有运动或缓慢的摄像机平移的视频,也不能通过文本进行控制,也不能渲染文字(至少不能清晰地渲染),也不能一致地“正确地”生成人脸和人物。

写在最后

目前来看,在视频生成方面,表现比较优秀的几个模型就是上文提到的OpenAI发布的Sora,以及Pika labs、Runway、Stability AI发布的视频模型。其中Sora无论是在时长,还是运镜、画面细节等方面都更为突出。Stability AI的模型目前还不能进行文本生成视频。

除了这几款视频生成工具之外,还有一些企业在文生视频方面也有动作,包括Adobe,该公司宣布已收购AI视频生成创业公司Rephrase.ai;谷歌,其团队已经发布发布了视频生成模型VideoPoet。

国内的字节跳动、百度、阿里在这方面也有动作。字节跳动此前就推出了一款视频模型Boximator,可以通过文本精准控制生成视频中人物或物体的动作。不过近日,字节跳动对此回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

另外值得关注的是,2月23日消息,谷歌资深科学家、VideoPoet项目负责人蒋路已加入字节跳动旗下短视频社交平台TikTok。字节跳动接下来在视频生成方面的研究还是可以期待一下。

早前就传出百度文心大模型视频生成功能在内测中,不过目前还没进展的消息。阿里在去年底也上线了Animate Anyone模型,通过一张图片就能生成视频,当时有网友用一张照片生成了一段跳舞视频,每一个动作都十分自然,几乎可以乱真,在网络上引起大量传播。

总的来说,目前国内外已经有不少企业在探索视频生成领域,包括国内的字节跳动、百度、阿里,虽然已经逐渐有一些进展。不过相比OpenAI、Pika labs、Runway等的视频模型,还存在差距。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OpenAI
    +关注

    关注

    9

    文章

    1037

    浏览量

    6390
  • 大模型
    +关注

    关注

    2

    文章

    2298

    浏览量

    2405
  • Sora
    +关注

    关注

    0

    文章

    76

    浏览量

    186
收藏 人收藏

    评论

    相关推荐

    阿里云视频生成技术创新!视频生成使用了哪些AI技术和算法

    照片就能让 EMO 合成演戏唱歌视频。   阿里云在视频生成领域的创新   EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院开发的框架,一个音频驱动的 AI 肖像
    的头像 发表于 05-08 00:07 3315次阅读

    智谱AI正研发对标Sora的国产文生视频模型

    智谱AI,这家国内估值超过200亿的AI大模型独角兽企业,正全力投入研发一款与OpenAI的Sora相媲美的国产文生视频模型。据公司内部人士
    的头像 发表于 05-07 09:22 495次阅读

    OpenAI视频生成工具Sora将于年内正式向公众推出

    OpenAI的首席技术官Mira Murati在近期采访中透露,公司正计划在今年晚些时候正式向公众正式推出其视频生成工具Sora。Murati表示,尽管具体的推出时间可能需要几个月,但OpenAI正在积极准备,并期待在未来能够为
    的头像 发表于 03-19 11:41 826次阅读

    新火种AI|围攻光明顶:Sora效应下的AI视频生成竞赛

    Sora的出现,让AI视频生成领域真正“活”了起来
    的头像 发表于 03-16 11:12 590次阅读

    OpenAI表示Sora还有很长的路要走

    近日,OpenAI发布的Sora视频生成器在技术圈内引起了广泛关注。尽管其初步展示的效果令人印象深刻,但该工具目前仍处在研究阶段,距离实际应用还有相当的距离。
    的头像 发表于 02-27 17:38 678次阅读

    OpenAI文生视频模型Sora要点分析

    近日,美国人工智能公司OpenAI发布了首个视频生成模型Sora。不同于此前许多AI大模型文生图或视频时,会出现人物形象前后不一致等问题
    的头像 发表于 02-22 16:37 988次阅读
    OpenAI文生<b class='flag-5'>视频</b>模型<b class='flag-5'>Sora</b>要点分析

    OpenAI 在 AI 生成视频领域扔出一枚“王炸”,视频生成模型“Sora

    ABSTRACT摘要2月16日凌晨,也就是中国大年初七,OpenAI在AI生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora
    的头像 发表于 02-22 08:25 341次阅读
    OpenAI 在 <b class='flag-5'>AI</b> <b class='flag-5'>生成</b><b class='flag-5'>视频</b>领域扔出一枚“王炸”,<b class='flag-5'>视频生成</b>模型“<b class='flag-5'>Sora</b>”

    openai发布首个视频生成模型sora

    美国当地时间2024年2月15日 ,OpenAI正式发布文生视频模型Sora ,并发布了48个文生视频案例和技术报告 ,正式入局视频生成领域 。So
    的头像 发表于 02-21 16:45 1167次阅读

    马斯克称特斯拉视频生成技术超过Sora

    特斯拉CEO埃隆·马斯克在社交媒体平台上发表言论,声称特斯拉所掌握的视频生成技术超越了OpenAI最新发布的Sora模型。马斯克自信地表示,特斯拉在这一领域的技术实力堪称全球顶尖,甚至超越了OpenAI这一人工智能领域的佼佼者。
    的头像 发表于 02-20 14:16 564次阅读

    OpenAI发布Sora模型,瞬间生成高清大片

    近日,人工智能领域的领军企业OpenAI发布了一款名为“Sora”的视频生成AI模型,再次展示了其在AI技术领域的创新实力。Sora以其出色
    的头像 发表于 02-20 13:33 738次阅读

    探索OpenAI Sora视频AI生成技术及其应用如何使用指南

    OpenAI的Sora现已扩展其能力范围,进入视频生成领域,标志着人工智能技术在多媒体内容创作上的一个重大突破。Sora视频AI功能使得用
    的头像 发表于 02-20 12:01 1391次阅读

    OpenAI新年开出王炸,视频生成模型Sora问世

    近日,OpenAI在AI生成视频领域取得重大突破,发布了全新的生成式人工智能模型“Sora”。该模型在
    的头像 发表于 02-20 11:46 723次阅读

    AI视频年大爆发!2023年AI视频生成领域的现状全盘点

    2023年,也是AI视频元年。过去一年究竟有哪些爆款应用诞生,未来视频生成领域面临的难题还有哪些?
    的头像 发表于 02-20 10:40 1113次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视频</b>年大爆发!2023年<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>领域的现状全盘点

    OpenAI发布文生视频模型Sora,引领AI视频生成新纪元

    在人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象力”的视频生成能力,彻底颠覆了传统
    的头像 发表于 02-19 11:03 876次阅读

    OpenAI发布首个视频生成模型Sora

    OpenAI近日宣布推出其全新的文本到视频生成模型——Sora。这一突破性的技术将视频创作带入了一个全新的纪元,为用户提供了前所未有的创作可能性。
    的头像 发表于 02-18 10:07 991次阅读