0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

文生视频,硬件成本是最大拦路虎

E4Life 来源:电子发烧友网 作者:周凯扬 2024-02-26 09:13 次阅读



电子发烧友网报道(文/周凯扬)自文本与图片类的AIGC爆火以来,几乎所有互联网公司和应用开发商都在跟进。然而近期随着Sora的爆火,决定开发同类应用的厂商却少之又少,这就不得不谈到硬件成本的问题,毕竟一个能够实现文生视频的应用,服务器成本要远远高于GPT类应用。

从文生视频模型的配置谈硬件成本

对于目前市面上的一些文生视频模型而言,其配置往往决定了体验的好坏。就拿Runway的Gen-2模型来说,其最大的特点在于可以生成4K级别分辨率的视频,且具备影视级别的构图和运镜,支持图片和文本的指令输入。

然后是最近一炮走红的Sora,其将最大时长做到了1分钟,且支持符合部分物理规律的世界模型,以及多镜头的切换等。不过与Gen-2模型一样,其对分辨率也进行了限制,甚至只能生成1080p的视频。

其他文生视频模型的配置则更加捉襟见肘,比如Meta的Emu Video只能生成最长4秒的512x512分辨率视频等等。从以上文生视频模型看来,由于为了确保画面一致性,视频分辨率、视频长度和每秒帧数往往决定了生成单个视频的硬件负载。目前对于硬件要求最高的应该是Runway的Gen-2和OpenAI的Sora。

这也是为何文生视频应用均采用订阅模式,甚至是按量订阅的付费策略,比如生成视频的项目数量、存储空间、导出质量等,文生视频考验的不仅是服务器算力,还有存储成本。毕竟为了方便用户回溯,这些生成的视频依然需要存储在服务器上一段时间。

就以Runway为例,要想完全无限制地生成视频功能,每月订阅费用高达76美元,且这仅仅意味着450s的Gen-2视频生成,如果用户需要生成更多内容,则还需要额外购买。可见为了维持服务器费用,文生视频应用面临的成本压力要远大于GPT类应用。

不只是云端,硬件成本也决定了本地部署的难度

从ChatGPT和Stable Diffusion这两个最火的AIGC应用就可以看出,硬件是开发这类应用的最大门槛之一。基于低成本硬件打造的类ChatGPT应用响应时间慢,生成内容质量差。而Stable Diffusion这类文生图模型,已经可以在消费级硬件上实现不错的效果,甚至可以普及到一些低功耗的端侧设备上。

但对于Sora这类文生视频的模型而言,要想在消费级实现本地部署可谓是难于登天,在完成内容的基本生成工作后,还需要经历风格化、分镜、遮罩、渲染和自定义等一系列流程,可以说不仅考验硬件的AI算力,也对视频渲染能力提出了更高的要求。

据了解,一批开源开发者已经在构建OpenAI Sora的复制版本,且可以在使用消费级英伟达GPU的高配电脑上跑通。不过马斯克也评论道,他也认为这是可行的,但是帧渲染速率会非常低。如果需要花上数小时,才能生成出一个质量较差的4秒视频,对于绝大多数用户来说,必然不是好的体验。

写在最后

要论硬件成本的话,对于应用开发者和用户而言,文生视频目前还是一个较为昂贵的“玩具”。但我们也不能否认其前景,随着算力成本逐渐下降,未来文生视频不仅可以作为内容创作途径,也可以作为辅助工具,替代掉一部分重复性工作,尤其是在广告视频行业。

不过这类应用的出现,也会让我们开始重新审视起GPU在AIGC硬件市场的地位,毕竟多出了图形渲染这一额外的硬件要求,其他的ASIC方案在这方面固然会逊色GPU一筹。再加上英伟达GPU在物理仿真上的优势,或许文生视频会给英伟达带来更多的市场机遇。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30072

    浏览量

    268333
  • AIGC
    +关注

    关注

    1

    文章

    354

    浏览量

    1504
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2449
  • Sora
    +关注

    关注

    0

    文章

    76

    浏览量

    188
收藏 人收藏

    评论

    相关推荐

    康谋分享 | 数据隐私和匿名化:PIPL与GDPR下,如何确保数据合规?(二)

    自动驾驶技术飞速发展,但数据隐私安全成拦路虎?别担心,本文带您深入剖析PIPL与GDPR在数据处理行为及基础合法性方面的异同之处,帮助您准确把握法规要求,从而利用匿名化处理工具有效应对跨境数据传输等挑战!
    的头像 发表于 10-30 09:30 204次阅读
    康谋分享 | 数据隐私和匿名化:PIPL与GDPR下,如何确保数据合规?(二)

    智谱AI正在研发国产文生视频模型,对标OpenAI Sora

    国内AI领域的独角兽企业智谱AI正全力研发一款与OpenAI的Sora相媲美的国产文生视频模型。据悉,该模型的技术研发已取得显著进展,预计最快将于今年内正式对外发布。
    的头像 发表于 05-13 11:14 616次阅读

    智谱AI正研发对标Sora的国产文生视频模型

    智谱AI,这家国内估值超过200亿的AI大模型独角兽企业,正全力投入研发一款与OpenAI的Sora相媲美的国产文生视频模型。据公司内部人士透露,该模型预计最快将在今年内发布,将成为AI视频生成领域的一大亮点。
    的头像 发表于 05-07 09:22 496次阅读

    OpenAI发布文生视频大模型Sora、英伟达市值超谷歌

    OpenAI加入文生视频大模型的战局,AI大模型进入视频生成的阶段,这将进一步刺激AI芯片的需求。 OpenAI发布文生视频大模型Sora,
    的头像 发表于 03-28 18:13 823次阅读

    7万张H100打造的OpenAI文生视频Sora功能原理详解|Sora注册全攻略

    近日,OpenAI发布的基于Transformer架构的文生视频Sora,可谓是在AI圈掀起新的热潮。该模型具有强大的视频生成能力,可产生高达一分钟的高清视频,并且用户可以自由指定
    的头像 发表于 02-29 11:48 980次阅读
    7万张H100打造的OpenAI<b class='flag-5'>文生</b><b class='flag-5'>视频</b>Sora功能原理详解|Sora注册全攻略

    OpenAI文生视频模型Sora要点分析

    近日,美国人工智能公司OpenAI发布了首个视频生成模型Sora。不同于此前许多AI大模型文生图或视频时,会出现人物形象前后不一致等问题
    的头像 发表于 02-22 16:37 993次阅读
    OpenAI<b class='flag-5'>文生</b><b class='flag-5'>视频</b>模型Sora要点分析

    OpenAI新推文生视频大模型Sora引发热议,首批受益者涌现

    在科技浪潮中,OpenAI再次引领潮流。继2023年的文生文大语言模型之后,2024年春节期间,OpenAI推出的文生视频大模型Sora迅速成为全球科技界的焦点。这款模型能够根据文本内容生成高质量的
    的头像 发表于 02-22 14:15 671次阅读

    OpenAI发布人工智能文生视频大模型Sora

    近日,人工智能领域的领军企业OpenAI宣布推出其最新的人工智能文生视频大模型——Sora。这款模型在继承DALL-E 3卓越画质和遵循指令能力的基础上,实现了对真实物理世界的深度模拟,为视频制作领域带来了前所未有的变革。
    的头像 发表于 02-20 13:54 810次阅读

    OpenAI发布文生视频模型Sora,开启AI内容创作新纪元

    近日,人工智能领域的领军企业OpenAI在其官网上正式发布了名为Sora的文生视频大模型。这款模型具备根据用户提示生成长达一分钟视频的能力,并在视频连贯性、角色一致性等方面表现出色,几
    的头像 发表于 02-20 13:44 607次阅读

    英伟达市值跃居全球第四 文生视频大模型Sora带动

    英伟达市值跃居全球第四 文生视频大模型Sora带动 文生视频大模型Sora引发市场关注;OpenAI的首款文生
    的头像 发表于 02-19 16:48 959次阅读

    OpenAI发布文生视频模型Sora,引领AI视频生成新纪元

    在人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象力”的视频生成能力,彻底颠覆了传统视频
    的头像 发表于 02-19 11:03 879次阅读

    OpenAI推出全新文生视频模型Sora

    近日,全球领先的人工智能研究公司OpenAI宣布推出其最新的文生视频大模型“Sora”。该模型具有突破性的功能,能够根据用户提供的文本指令或静态图像,自动生成长达1分钟的高清视频。这些视频
    的头像 发表于 02-19 10:56 765次阅读

    奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

    奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相 2月16日凌晨OpenAI的首个文生视频模型Sora正式亮相。Sora只需输入文字,便可生成一段长达60秒的高
    的头像 发表于 02-18 17:41 934次阅读

    OpenOCD是什么?J-Link、J-Trace、Open JTAG的区别

    最近在调试一些单板,对于这个调试工具我真的是又爱又恨,熟悉了那就是金箍棒,不熟悉那就是拦路虎
    的头像 发表于 12-12 09:43 1.2w次阅读
    OpenOCD是什么?J-Link、J-Trace、Open JTAG的区别

    连接器的真正成本是多少?

    连接器通常是根据购买价格来选择的,而没有充分考虑与使用它们相关的成本。连接器的真正成本是多少?
    的头像 发表于 12-01 16:14 1305次阅读