Sora爆红，多模态大模型是下一发展阶段-电子发烧友网

“大语言模型为 AI 产业带来新的生机，然而语言模型的应用场景有限。要全面打开生成式 AI 的想象力，还是要依托多模态大模型。”IDC 中国研究总监卢言霞近日表示。Sora在文生视频领域真正迈出了第一步，真正做到生成式 AI 驱动生成短视频。接下来也将刺激其他科技巨头加快在该领域的技术攻关力度以及产品发布速度。

哪些公司有潜力快速推出类似产品呢？根据卢言霞的判断，几个最有潜力的群体包括，在大模型以及 AI 领域投入最为领先的科技巨头，如 BAT、科大讯飞等；在计算机视觉领域拥有深厚积累的公司，比如商汤、海康一类的公司；以及短视频类公司；更可大胆想象，也或许会培训出多模态大模型的全新创企。

多模态大模型将率先在短视频、广告、互娱、影视、媒体等领域采用，辅助人类员工生成视频，既可以提高生产速度又可以提高生产数量，还可以创造全新的视觉感受，能够帮助企业真正实现降本增效、提升用户体验。

根据预测，未来 5 年，生成式 AI 生成的文本类文件、图像类文件、视频类文件、软件代码类文件数量将会越来越平均。而这其中，与图像文件相关的数据量可能是文本文件的 100 倍，视频文件是图像文件的 10 倍。整体来看，由于 GenAI 的采用和使用日益增多，近期和远期所创建数据的增长速度都将快于近几年。

卢言霞指出，多模态大模型行业发展的挑战在于：

• 高质量数据的稀缺：图像、视频类数据掌握在少数公司手中。这些数据也需要标注，甚至重新采集，才能用于大模型的训练。
• 多模态大模型对算力的消耗更高，算力的可获取性以及成本将是挑战之一。
• 顶尖的大模型研发人才，也是行业发展的稀缺资源。

此外，多模态大模型将带来更严峻的安全方面的挑战。一方面多模态大模型将读取更多的图像、视频类数据，这些图像视频数据是否合规是否安全，需要得到保障；另一方面，生成的视频与真实世界之间的差异，是否会影响到人身安全、社会稳定、企业安全等，也需要注意。

当前 Sora 生成的是1分钟的视频，对于行业已经是重大突破，何时能生成2分钟、5分钟以上的视频还未知，无论如何多模态大模型的应用都将是颠覆性的。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

海康威视发布多模态大模型文搜存储系列产品

多模态大模型为安防行业带来重大技术革新，基于观澜大模型技术体系，海康威视将大参数量、大样本量的图文多模态

发表于 02-18 10:33 •175次阅读

商汤日日新多模态大模型权威评测第一

刚刚，商汤科技日日新SenseNova多模态大模型，在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第

发表于 12-20 10:39 •416次阅读

成都汇阳投资关于Sora 正式上线，多模态模型的里程碑

事件 12月10日,OpenAl正式上线 Sora,并向包括美国在内的多数国家用户开放,用户可在OpenAI官网上体验Sora。同时,Sora 被包含在ChatGPT Plus

发表于 12-16 14:39 •318次阅读

一文理解多模态大语言模型——下

/understanding-multimodal-llms 《一文理解多模态大语言模型 - 上》介绍了什么是多

发表于 12-03 15:18 •270次阅读

一文理解多模态大语言模型——上

/understanding-multimodal-llms 在过去几个月中， OpenVINO™ 架构师 Yury阅读了众多有关多模态大语言模型的论文和博客，在此基础上，推荐了一篇解

发表于 12-02 18:29 •550次阅读

利用OpenVINO部署Qwen2多模态模型

多模态大模型的核心思想是将不同媒体数据（如文本、图像、音频和视频等）进行融合，通过学习不同模态之间的关联，实现更加智能化的信息处理。简单来说，多

发表于 10-18 09:39 •639次阅读

苹果发布300亿参数多模态AI大模型MM1.5

苹果近日推出了全新的多模态AI大模型MM1.5，该模型拥有高达300亿的参数规模，是在前代MM1架构的基础上进一步

发表于 10-14 15:50 •352次阅读

云知声推出山海多模态大模型

在人工智能技术的浩瀚星海中，多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后，云知声以创新之姿，推出了其匠心独运的山海多模态大

发表于 08-27 15:20 •457次阅读

依图多模态大模型伙伴CTO精研班圆满举办

大模型在不同行业领域的应用前景;7月19日， “依图科技多模态大模型伙伴CTO精研班”在杭州圆满举办，让更多的伙伴们深度体验了依图多

发表于 07-23 15:16 •507次阅读

Sora还在PPT阶段，“中国版Sora”已经开放使用了！

电子发烧友网报道（文/梁浩斌）今年春节期间，OpenAI的AI文字生成视频模型Sora惊艳全世界，极高的视频生成效果、长达60秒的视频生成长度，让过去Pika Labs推出的Pika 1.0、去年

发表于 06-17 09:07 •3557次阅读

李未可科技正式推出WAKE-AI多模态AI大模型

文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕 GPS 轨迹+视觉+语音打造新一代 LLM-Based的自然交互，同时多

发表于 04-18 17:01 •679次阅读

AI机器人迎来多模态模型

配备 GR00T 模型的机器人由于需要“吸收消化”外界的多模态信息，还要快速完成理解、决策、行动等一系列动作，因此对于算力的需求是巨量的。

发表于 04-12 10:39 •324次阅读

苹果发布300亿参数MM1多模态大模型

近日，科技巨头苹果公司在一篇由多位专家共同撰写的论文中，正式公布了其最新的多模态大模型研究成果——MM1。这款具有高达300亿参数的多

发表于 03-19 11:19 •981次阅读

Sora短期不会向公众开放还处于反馈获取阶段

Sora短期不会向公众开放还处于反馈获取阶段据外媒报道Sora核心团队在一次采访中透露，Sora短期不会向公众开放，

发表于 03-14 14:55 •726次阅读

蚂蚁集团推出20亿参数多模态遥感基础模型SkySense

近日，蚂蚁集团联合武汉大学宣布成功研发出20亿参数多模态遥感基础模型SkySense。这一创新模型由蚂蚁集团的AI创新研发部门NextEvo

发表于 03-04 11:22 •925次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

Sora爆红，多模态大模型是下一发展阶段

评论

海康威视发布多模态大模型文搜存储系列产品

商汤日日新多模态大模型权威评测第一

成都汇阳投资关于Sora 正式上线，多模态模型的里程碑

一文理解多模态大语言模型——下

一文理解多模态大语言模型——上

利用OpenVINO部署Qwen2多模态模型

苹果发布300亿参数多模态AI大模型MM1.5

云知声推出山海多模态大模型

依图多模态大模型伙伴CTO精研班圆满举办

Sora还在PPT阶段，“中国版Sora”已经开放使用了！

李未可科技正式推出WAKE-AI多模态AI大模型

AI机器人迎来多模态模型

苹果发布300亿参数MM1多模态大模型

Sora短期不会向公众开放还处于反馈获取阶段

蚂蚁集团推出20亿参数多模态遥感基础模型SkySense