Sora到底懂不懂物理世界? Sora开启更多可能-电子发烧友网

OpenAI的视频生成模型Sora持续引发关注，而围绕Sora到底懂不懂物理世界？这个讨论越发火热，甚至是在讨论Sora 到底是不是物理引擎甚至世界模型？

当然Sora 目前看起来似乎还微有瑕疵，但是视频效果已经足以震撼人心，而且OpenAI自己也认为确实还是有很多问题，比如Sora可能会混淆左右，比如Sora难以准确体现随时间推移而发生的事件，但是这些问题似乎都不会是Sora改进的阻碍。

业界当然还有多种声音，比如英伟达高级研究科学家Jim Fan 认为Sora 是一个数据驱动的物理引擎，是一个可学习的模拟器，或者可以说是一个世界模型。

还有图灵奖得主Yann LeCun则认为仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界，生成视频的过程与基于世界模型的因果预测完全不同。

还有观点认为Sora可以说确实是已经嵌入了物理模型，但问题是这个物理模型是否已经就是准确的？逻辑能力依然不行。

不管大牛们怎么看，Sora的能力确实很强大，Sora 生成的视频能够展现出精细的场景，还有生动的角色表情和复杂的镜头动态。文本转视频模型似乎已经非常完美。

有网友评论称“首个大型视频生成模型”的名号肯定没跑了，期待国产大模型反超。

当然未来Sora落地应用，克服算力需求也是一大问题。

这一次Sora 让大家看到了AI的技术已经扩展到了视频领域；Sora的强大令人震惊，业界多认为Sora展示了人工智能在理解真实世界场景并与之互动的能力，这被认为是朝着实现通用人工智能（AGI）的重要一步。未来Sora会将在更多领域得到推广应用。

尽管目前Sora尚未对外开放公测，也未提供内部测试的申请途径。还只是在内部测试，但是全球都充满了期待。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Sora到底懂不懂物理世界? Sora开启更多可能