ABSTRACT摘要
2 月 16 日凌晨,也就是中国大年初七,OpenAI 在 AI 生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
这家旧金山公司周四推出的该工具使用生成人工智能,根据书面命令立即创建短视频。
JAEALOT
2024年2月16日
2 月 16 日凌晨,也就是中国大年初七,OpenAI 在 AI 生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。
这家旧金山公司周四推出的该工具使用生成人工智能,根据书面命令立即创建短视频。
Sora 并不是第一个展示这种技术的产品。但行业分析师指出,该工具迄今为止展示的视频质量很高,并指出它的推出标志着 OpenAI 和文本到视频生成的未来的整体重大飞跃。
尽管如此,与当今快速发展的人工智能领域的所有事物一样,此类技术也引发了人们对潜在道德和社会影响的担忧。
Sora 是一款文本到视频生成器 - 使用生成式 AI 根据书面提示创建长达 60 秒的视频。该模型还可以从现有的静态图像生成视频。
生成式人工智能是人工智能的一个分支,可以创造新的东西。示例包括聊天机器人(如 OpenAI 的 ChatGPT)以及图像生成器(如 DALL-E 和 Midjourney)。让人工智能系统生成视频是更新且更具挑战性的,但依赖于一些相同的技术。
OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根据用户的文本提示创建长达一分钟的视频。
OpenAI 在帖子中表示:“我们正在教人工智能理解和模拟运动中的物理世界,目的是训练模型来帮助人们解决需要现实世界交互的问题。”
OpenAI 在帖子中补充道:“Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。” “该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。”
此外,根据该帖子,生成式人工智能模型可以基于单个图像创建视频,以及扩展现有视频或填充缺失的帧。
Sora 尚未可供公众使用(OpenAI 表示,在正式发布该工具之前,它正在与政策制定者和艺术家进行接触),而且还有很多我们不知道的事情。但自周四宣布以来,该公司已经分享了一些 Sora 生成的视频示例,以展示其功能。
OpenAI 首席执行官 Sam Altman 还利用 X(以前称为Twitter 的平台)要求社交媒体用户及时发送想法。后来,他分享了逼真详细的视频,这些视频响应了“两只金毛猎犬在山顶上播客”和“在海洋上与不同动物进行自行车比赛,运动员在无人机摄像机视图下骑自行车”等提示。
虽然 Sora 生成的视频可以描绘复杂、极其详细的场景,但 OpenAI 指出仍然存在一些弱点,包括一些空间和因果元素。例如,OpenAI 在其网站上补充道,“一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。”
OpenAI 的 Sora 并不是同类产品中的第一个。谷歌、Meta 和初创公司 Runway ML 等公司都展示了类似的技术。
-
机器人
+关注
关注
211文章
28399浏览量
207001 -
AI
+关注
关注
87文章
30807浏览量
268953 -
人工智能
+关注
关注
1791文章
47229浏览量
238345
发布评论请先 登录
相关推荐
评论