AI视频创作一条龙！达摩院“寻光”平台炸场WAIC，突破可控编辑难题-电子发烧友网

卡奥斯智能交互引擎是卡奥斯基于海尔近40年工业生产经验积累和卡奥斯7年工业互联网平台建设的最佳实践，基于大语言模型和RAG技术，集合海量工业领域生态资源方优质产品和知识服务，旨在通过智能搜索、连续交互，实时生成个性化的内容和智能化产品推荐，为用户提供快速、可靠的交互式搜索服务，首创了聚焦工业领域的智能交互引擎。

详情戳：卡奥斯智能交互引擎

AIGC时代，视频创作这事儿真的不一样了。

就像这样，轻轻一圈，选定目标立刻变身单独图层，再丝滑嵌入不同的背景视频，场景变换so easy~

想要调整一下镜头角度，交给AI，同样能一键完成：

还能一键消除、修改目标：

后期再也不用加班加到手抽筋（doge）。

划！重！点！这还不是实验室里的单一技术demo，而是马上就要开放内测，让创作者们直接可以用起来的一站式AI视频创作平台——“寻光”。

就是说，传统上分散在不同制作流程中的剧本创作、分镜图设计、视频素材编辑等步骤，现在都可以在AI加持下，在同一个平台上流畅完成。

这就是阿里达摩院在上海世界人工智能大会上带来的最新惊喜。

演示一出，现场的观众都坐不住了。

而达摩院官方，也透露出了AI视频领域新成果背后更大的“野心”：

不对标Sora，而是走自己的路，希望更快让AI生产力匹配人类想象力。

“寻梦光影间”

所谓寻光，意指“寻梦光影间”：

即通过人工智能技术，提供全新的视频创作模式。

与Sora等今年备受关注的AI视频生成模型不同，寻光关注到的，是“Sora之后，视频工作流的变革”。

达摩院认为，Sora等AI视频生成模型给足了人们对视频生产方式彻底变革的想象力，但一方面，AI视频内容的可控编辑，包括对复杂剧情的理解、生成对象的一致性等，仍然是当前算法所面临的一大挑战。

另一方面，业界尚没有统一的AI视频编辑平台，能让创作者们一站式体验到AI加持的视频创作全流程。

举个例子，OpenAI创始成员Andrej Karpathy最近也玩上了AI视频，整出了个AI版《傲慢与偏见》。

在这个短片的制作过程中，他用到的工具包括Claude、Ideogram、Luma、ElevenLabs、VEED……而他本人也抱怨说：

老实说这个工作流非常混乱，工具与工具之间存在大量的复制粘贴，3个片段的简单小视频就花了我大约1个小时的时间。
这里面存在一个巨大的机会。谁正在打造100%的AI原生视频制作平台？

达摩院打造寻光，定位为PUGC一站式AI视频创作平台，目标正是针对以上问题，用AI能力重塑传统视频制作的全流程。

具体来说，寻光可以辅助用户创作剧本、分镜图等，支持对生成及上传素材进行丰富的AI编辑，包括人物控制、场景控制、运镜控制、目标新增/消除/修改等10多种功能。

并且在交互方面，主打“让视频编辑像操作PPT一样简单”。

以分镜设计环节为例，上传到寻光的原始视频素材，会由算法切分成多个分镜头。

在创作空间里，用户可以方便地查看到每一个分镜头，并用简单的拖拽操作对其进行调整。

在新建的空白分镜中，除了添加已有素材，寻光平台还支持用户调用多种多模态生成模型，生产新的内容。

而在编辑功能方面，寻光强调的是精细化的编辑和控制：在AI加持下，依据用户意图，在语义层面而不是像素层面实现编辑；同时，视频里的人体、人脸、前景、背景等任意局部目标，都可以进行精细化的编辑和修改。

在现场，达摩院视觉技术实验室高级算法专家陈威华着重提到了基于视频图层的编辑能力。

以前景图层功能为例，用户通过文本输入，即可生成符合描述的、具有透明背景的视频，并且一键就能将其融合到其他背景视频当中。

寻光也支持图层拆解功能，用户在视频第一帧选择想要提取的物体，算法就会自动跟踪，把整段视频中对应的目标拆解出来，形成独立的带透明背景的视频图层。

飘动的头发也扣得很精细的那种：

另外，在对视频全局元素的编辑方面，风格迁移上，寻光平台提供了20+不同风格。

运镜控制上，左右平移、上下平移、推进拉远、左右环绕等都能支持。

在对视频局部元素的编辑方面，除了目标消除，寻光平台还能实现人脸的精准控制：

△

视频取自国风武侠动漫《少年白马醉春风》第三集

轻轻一拉实现运动控制：

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30946

浏览量
269185
人工智能

人工智能

+关注

关注
1791

文章
47314

浏览量
238599

可灵AI全球首发视频模型定制功能，助力AI视频创作

近日，快手旗下的可灵AI在全球范围内率先推出了视频模型定制功能，这一创新之举成功解决了AI视频生成过程中人物IP稳定性不足的

发表于 11-26 14:02 •513次阅读

行家放话！骁龙8至尊版是一条大冰龙：彻底稳了

10月12日消息，iQOO产品经理戈蓝V表示，高通骁龙8至尊版是一条大冰龙，很难想象，过去的好多重载游戏在我这台手机上变成了中轻载，等通子发布会后再细聊。此前博主数码闲聊站浅测了高通骁龙8至尊版量产

发表于 10-17 12:26 •439次阅读

行家放话！骁<b class='flag-5'>龙</b>8至尊版是<b class='flag-5'>一条</b>大冰龙：彻底稳了

Adobe发布人工智能视频创作工具:Firefly Video Model

Adobe公司于10月15日正式揭晓了其最新研发的人工智能视频创作工具——Firefly Video Model。这一创新解决方案旨在借助AI技术，赋能

发表于 10-15 16:20 •735次阅读

AI 大模型行业应用：企业如何走出一条智能化蜕变之路？

随着 chatGPT 的横空问世，我们对于人工智能在日常生活中的应用场景逐渐了解，无论是搜索、问答、文生图还是文生视频都出现了很多创意，甚至 AI 还可以做诗，输入一条指令，就可以让它当场赋诗

发表于 09-27 18:16 •696次阅读

即梦AI上线，字节跳动挑战Sora等AI创作平台

字节跳动近期动作频频，其剪映团队精心研发的“即梦AI”移动版已正式登陆苹果App Store，标志着字节在AI创作领域的又一重要布局。即梦AI

发表于 08-07 16:47 •607次阅读

商汤发布首个“可控”人物视频生成大模型Vimi

近日，商汤科技在人工智能领域再次取得重大突破，正式发布了其首个面向消费者的“可控”人物视频生成大模型——Vimi。这一创新技术的问世，标志着视频

发表于 07-04 15:29 •756次阅读

谷歌AI新突破：为无声视频智能配音

近日，谷歌DeepMind团队公布了一项革命性的技术——利用AI为无声视频生成背景音乐的“video-to-audio”技术。这一技术的出现，不仅为

发表于 06-21 10:50 •496次阅读

AI角色创作平台「捏Ta」完成超千万元融资

AI角色创作平台“捏Ta”（公司名为“看见概念”）近期完成了天使轮和Pre-A轮融资，总额超千万元。

发表于 04-12 10:41 •867次阅读

迪思与百度智能云联手发布AI视频创作模型

迪思传媒与百度智能云联手研发的AI视频创作模型D&S-AI Video于3月25日正式亮相，并成功集成至迪思AI智链

发表于 03-26 11:46 •714次阅读

云知声AIGC内容创作平台蓝藻AI全新升级

近日，云知声AIGC内容创作平台蓝藻AI宣布完成全新升级，并推出超值会员服务，旨在为广大创作者提供更丰富多元的声音选择，助力内容创作更高效、

发表于 03-16 14:05 •1258次阅读

Stability AI与Morph AI共同推出一体化AI视频创作工具

近日，业界领先的AI技术公司Stability AI与中国AI创业公司Morph AI达成重要合作。双方宣布共同推出一款革新性的all-in

发表于 03-05 10:44 •885次阅读

阿里达摩院北京公司新增AI业务

阿里巴巴达摩院（北京）科技有限公司近日进行了工商变更，经营范围有所调整。具体来说，公司去除了智联网、芯片技术、量子计算等数据通信、电子产品、软件和硬件技术及产品的研究、开发等业务，而新增了人工智能应用软件开发、人工智能基础软件开发，以及第

发表于 02-23 11:39 •1049次阅读

OpenAI 在 AI 生成视频领域扔出一枚“王炸”，视频生成模型“Sora”

ABSTRACT摘要2月16日凌晨，也就是中国大年初七，OpenAI在AI生成视频领域扔出一枚“王炸”，宣布推出全新的生成式人工智能模型“Sora”。这家旧金山公司周四推出的该工具使用

发表于 02-22 08:25 •391次阅读

UCB_SWAP配置信息共16条，写入一条有效配置后，上一条需写1使配置无效是为什么？

UCB_SWAP配置信息共16条，写入一条有效配置后，上一条需写1使配置无效。经过实测发现配置是从下至上检索，取最后一条有效配置，而不是从上至下检索，取第

发表于 01-24 08:31

云知声全新推出AIGC内容创作平台蓝藻AI

近日，云知声基于智能语音技术和山海大模型技术，全新推出AIGC内容创作平台——蓝藻AI，为创作者提供AI声音克隆、

发表于 01-10 13:38 •843次阅读

搜索历史

AI视频创作一条龙！达摩院“寻光”平台炸场WAIC，突破可控编辑难题

评论

可灵AI全球首发视频模型定制功能，助力AI视频创作

行家放话！骁龙8至尊版是一条大冰龙：彻底稳了

Adobe发布人工智能视频创作工具:Firefly Video Model

AI 大模型行业应用：企业如何走出一条智能化蜕变之路？

即梦AI上线，字节跳动挑战Sora等AI创作平台

商汤发布首个“可控”人物视频生成大模型Vimi

谷歌AI新突破：为无声视频智能配音

AI角色创作平台「捏Ta」完成超千万元融资

迪思与百度智能云联手发布AI视频创作模型

云知声AIGC内容创作平台蓝藻AI全新升级

Stability AI与Morph AI共同推出一体化AI视频创作工具

阿里达摩院北京公司新增AI业务

OpenAI 在 AI 生成视频领域扔出一枚“王炸”，视频生成模型“Sora”

UCB_SWAP配置信息共16条，写入一条有效配置后，上一条需写1使配置无效是为什么？

云知声全新推出AIGC内容创作平台蓝藻AI