Sora到底牛在哪 | AI爆发的大趋势下，普通人真正该学的是什么-电子发烧友网

Sora炸裂了的地方，在于它能理解自然语言，知道那个画面该是怎么样的，它学习很多视频内容（大力出奇迹，需要很多算力），而且一上来就是能制作60s的视频，刚好是短视频的需求，之前的AI视频生成的时间都很短（几秒钟).

就说Sora有多火吧，生成的视频上线一个，疯传一个。

明显能看出来Sora生成的视频中的各项细节都让人惊叹，一如去年的ChatGPT，Sora被认为是AGI（通用人工智能）的又一个里程碑时刻。

一.sora的出现可以如何看待:

对于许多行业来说，都应该关注Open AI和sora这些人工智能相关的产品。

尤其是对设计领域来说，比如以前做logo、做海报、宣传册、做操作视频剪辑、拍摄等等相关的行业。

其一是思考，面对这些新技术、新工具，对自己有哪些挑战，应对策略是什么。

其二是结合，基于自己当前的业务，哪些可以利用这些技术进行结合，从而提升自己的效率和业务场景。

比如美图秀秀、稿定设计、剪映等产品，就基于AI立马推出了相关的产品。

（PS：目前 openai 官方还未开放 sora 灰度，不过根据文生图模型 DALL·E 案例，一定是先给 ChatGPT Plus 付费用户使用，需要注册或者升级 GPT Plus 可以看这个教程:升级 ChatGPT Plus 的教程，一分钟完成升级)

二. 以终为始地看，AI爆发的大趋势下，普通人真正该学的是什么？

我觉得有三点：讲故事的能力、结构化思考力和内容专业力。

1. 讲故事的能力

以文生视频为例，先不说Sora，很多人连Pika、Runway都用不利索。

用文字描述一件事、一个观点、一个诉求并不难，但描述一段画面、一个场景、一则完整故事，对绝大多数人是极高的门槛。

Sora不会让影视行业失业，正相反，如果视频生成的AI技术持续普及，会让真正会写故事的人发挥才能，而不是受限于影视行业的潜规则而灰心放弃。

2. 结构化思考力

很多写Sora的文章，都在讲它在模型算法、算力涌现、物理模拟上的创新。对我而言，会更惊讶它在训练视频数据时，以一种结构化提示词方法，解决了视频标注问题：

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set”

本质上看，无论是B端训练数据，还是C端和大模型对话，都用到了结构化表达能力。包括那些所谓“Sora培训”，其实教你的也是怎么写好提示词。举个例子，对这样的场景：

该怎么描述呢？一个在沉思的老爷爷？一个戴眼镜的老爷爷？一个在咖啡厅发呆的老爷爷？可能大部分人想到这儿就结束了。但更加结构化的描述可以是：

主体人物：：一位 60 多岁留着胡须的白发老人

镜头景别：脸部特写

背景环境：巴黎的一家咖啡馆

人物状态：注视着窗外行走的人们，一动不动陷入沉思，后又抿嘴微微一笑

人物细节：穿着一件羊毛大衣和一件纽扣衬衫、头戴棕色贝雷帽，戴着眼镜，像是个教授

环境细节：金色的灯光和背景中的巴黎街道和城市

镜头技术：景深、35 毫米电影胶片，有电影感

具备写出上述提示词的能力，才能真正发挥多模态技术的价值。这背后蕴含着的，就是结构化总结和思考能力。

有句话很形象，写提示词就像客户讲brief，能把需求说清楚，就离正确答案不远了。

3. 内容专业力

这点又说回到创作者本身，我比较喜欢杨远骋老师（「躺岛」和「新世相」联合创始人）的一个观点：

最大的影响会是出现新的创作者，会出现完全不在人们视野里的新的内容偶像，他们有非常好的品位、思维方式和世界观，但受限于表达技术，在过去却连基本的视频制作能力都不具备。

Koji，公众号：十字路口CrossingSora 喧嚣过后，理性浮现 | 我问出了这 5 位顶级创作者的真实想法

是的，除了上文提到的讲故事能力。如果你具备对“好内容”的理解力，懂得怎样更合理地设计脚本、做分镜、上特效、画故事板、运镜、调度、选角、布景、调光、配音、后期等等，AI就是你发挥想象力最好的帮手。能用好 AI 的人，一定能做出更好作品、获得更多收入。

因此我坚定地认为，这波AI趋势，对高潜力的作家、画手、设计师、编剧等创作者，是绝对的利好。如果你也想从中获益，先把“创作一部好内容”作为目标学起来吧。

总的来讲，我认为围着Sora去追新闻没啥必要。能跳出对Sora本身铺天盖地的宣传，去思考这背后该真正掌握的技能是什么。用结构化思维去训练讲故事的能力，成为一名优秀创作者，才是值得为此付出时间的。

三、sora原理常见问题及解答:

Q：训练数据的一个 clip 中如果有场景/镜头的切换，那 casual 3D CNN 还是会和过往的帧都有关系吗？

A：训练数据中大概率是有：一个 clip 有镜头/场景的切换。如果有切换，那么使用 casual 3D CNN 可能会带来问题：在切换前后的内容是不同的，不仅会增加模型训练难度，也会带来瑕疵。这个可能就直接训练了，通过相应数据的训练就能解决。

Q：训练数据的来源？

A：大家猜测有 1）youtube 的视频。2）Shutterstock，之前有公告：Shutterstock 扩大与 OpenAI 的合作伙伴关系，签署新的六年协议以提供高质量的训练数据：渲染引擎的数据，这个网络上大家贴出了一些间接证据。渲染引擎的数据能够针对性地模拟出很多符合 3D 一致性、物理一致性的数据，对于模型的训练应该有很好的帮助。

Q：输出变长的长度、分辨率和长宽比是如何做到的？

A：1. diffusion 过程中，输入的 noise tokens 就添加 factorized positional embedding。比如最直接的实现方式，每个 token 对应有三个数字（t, h, w）分别表示时间、长和宽，然后添加相应的 position embedding 去区分。

训练的时候也采用了变长的长度、分辨率和长宽比。这些 examples 模型在训练的时候见过。

这样，可以做到技术报告中提到的：At inference time, we can control the size of generated videos by arranging randomly-initialized patches in an appropriately-sized grid。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
31982

浏览量
270799
ChatGPT

ChatGPT

+关注

关注
29

文章
1577

浏览量
8174
Sora

Sora

+关注

关注
0

文章
83

浏览量
275

DeepSeek对2025年智能制造领域十大趋势的预测

和行业动态，deepseek预测的2025年智能制造领域十大趋势，涵盖技术创新、生产模式变革及产业生态重塑。生成式AI驱动全流程优化趋势：生成式AI（如工业大模型）将深度融入产品设

发表于 02-17 10:24 •268次阅读

维智科技对DeepSeek的十问十答

DeepSeek这一国产大模型的技术创新给AI生态带来了深刻的影响，那么我们普通人可以在这个浪潮中寻得哪些新的机会？

发表于 02-13 09:41 •158次阅读

朋友圈被DeepSeek刷屏了？普通人如何也能吃上AI红利？

开了家24小时平价米其林餐厅。今天咱们就说说这些AI公司到底在卷什么，以及咱们普通人该怎么搭上这趟车。一、拆解DeepSeek三大技术亮点开源策略与生态建设Dee

发表于 02-11 10:31 •277次阅读

朋友圈被DeepSeek刷屏了？<b class='flag-5'>普通人</b>如何也能吃上<b class='flag-5'>AI</b>红利？

大趋势下企业如何实现智能制造 | 珠海盈致

、成本控制等方面的显著提升。那么，在大趋势下，企业如何实现智能制造呢？一、明确智能制造转型战略企业首先要基于自身现状和市场趋势，制定明确的智能制造转型战略。这包括短期和长期目标，以及实现这些目标的路径和关键

发表于 01-21 13:57 •101次阅读

华为发布2025数据中心能源十大趋势

今日，华为举办2025数据中心能源十大趋势发布会，华为数据中心能源领域总裁尧权全面解读数据中心能源十大趋势，为AI时代数据中心产业发展注入新动力，洞见变革，引领产业跨越式发展。

发表于 01-14 10:24 •192次阅读

OpenAI推出AI视频生成模型Sora

近日，备受期待的OpenAI再次推出了其创新之作——AI视频生成模型Sora。这一新品的发布，无疑为AI技术注入了新的活力。据悉，Sora与OpenAI旗下的

发表于 12-12 09:40 •281次阅读

智慧灯杆到底“智慧”在哪里？条形智能为您专业解读 AI灯杆屏

发表于 11-14 13:51 •305次阅读

智慧灯杆<b class='flag-5'>到底</b>“智慧”<b class='flag-5'>在哪</b>里？条形智能为您专业解读 <b class='flag-5'>AI</b>灯杆屏

Sora还在PPT阶段，“中国版Sora”已经开放使用了！

电子发烧友网报道（文/梁浩斌）今年春节期间，OpenAI的AI文字生成视频模型Sora惊艳全世界，极高的视频生成效果、长达60秒的视频生成长度，让过去Pika Labs推出的Pika 1.0、去年

发表于 06-17 09:07 •3547次阅读

AI浪潮下的十大消费者新趋势

《2030年代十大热门消费趋势——AI赋能的未来》收集了来自全球13座城市6,500名早期采用者对2030年代AI场景的反馈，并将其总结为了十大趋势： 01

发表于 06-05 10:30 •407次阅读

智谱AI刘江：5-10年内AGI会达到普通人水平

在2024亚马逊云科技中国峰会上，智谱AI首席生态官刘江发表了引人注目的观点。他预测，在未来的5至10年内，AGI（通用人工智能）的发展将达到普通人的水平，这将是“我们这一代人遇到的最大的技术突破”。

发表于 05-31 10:33 •851次阅读

智谱AI正研发对标Sora的国产文生视频模型

智谱AI，这家国内估值超过200亿的AI大模型独角兽企业，正全力投入研发一款与OpenAI的Sora相媲美的国产文生视频模型。据公司内部人士透露，该模型预计最快将在今年内发布，将成为AI

发表于 05-07 09:22 •580次阅读

基站式无人机屏蔽器对普通人有威胁吗？

式无人机屏蔽器应运而生。那么，这种看似神秘的设备对普通人是否有威胁呢？今天，深圳市特信电子有限公司就来揭开它的神秘面纱。

发表于 04-08 09:10 •750次阅读

新火种AI|围攻光明顶：Sora效应下的AI视频生成竞赛

Sora的出现，让AI视频生成领域真正“活”了起来

发表于 03-16 11:12 •712次阅读

汤姆猫加速布局AI应用，接入OpenAI Sora模型，探索生成视频素材之道

汤姆猫称，Sora是人工智能不断演进的里程碑之作。类似Sora的各类AI工具能够助其以更高效率、更低成本创建丰富多样且用户体验佳的AI应用产品和服务。

发表于 03-04 13:46 •778次阅读

面对Sora，中国AI可以不急不躁不焦虑

AISora

脑极体
发布于 :2024年02月23日 00:51:52

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Sora到底牛在哪 | AI爆发的大趋势下，普通人真正该学的是什么

评论