0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2022,我们追逐群星,也在追逐AIGC的无尽可能

脑极体 来源:脑极体 作者:脑极体 2022-12-30 15:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2022年,是中国人追逐群星的里程碑之年。

今年10月31日,中国天宫空间站的第二个科学实验模块——梦天实验舱,搭载长征五号B遥四运载火箭发射升空。随着之后天实验舱成功与之前发射的天和核心舱完成精准对接,中国空间站历史性地完成了“合体”。至此,中国空间站距离建成仅剩一步之遥。

从天舟四号到天舟五号,从问天舱到梦天舱,从神舟十四号到神舟十五号,取得一系列航天成果的2022,同时也是中国载人航天工程立项实施30周年。三十年奋进勃发,让中国人史无前例地接近星辰,接近宇宙中的无限可能。

而在科技赛场的另一条关键跑道上,2022同样至关重要。近日,新华社与百度文心一格联合推出了一支AIGC视频——《AI描绘天宫盛宴》。这支视频画面全部由AI自动生成,用充满中国韵味的笔触,回顾了中国载人航天的三十年辉煌历程。众多网友感叹,AI生成内容竟然在极短时间内就达成了这种效果,实在难以想象。

2022年,被业界称为AIGC元年。伴随着AI作画大规模商业化落地,这一能力开始为全球用户所接受。AIGC的饱含巨大商业价值的下一站,就是AI生成内容。而在AIGC的“宇宙探索”中,中国人同样不落人后。以百度文心大模型为代表的中国力量,正在带领全球AI产业接近AIGC的无限可能。

2022年,文心大模型在AI生成内容这条赛道上不停探索,给出了一系列让人眼前一亮的成绩。在其背后,既可以看到大模型在AI作画领域的技术趋于完备,又可以看到中文、中国文化背景下的AIGC全面发展。面向AIGC的群星,文心大模型已经成为中国AI产业的一座“空间站”。探索AIGC更多可能,文心大模型的成绩单

在全球经济普遍遇冷的2022,AI技术却是一片繁荣。从AI作画到AI对话,各种AI技术创新在全球范围内火爆出圈。而所有AI能力中最让人看好其商业前景的,则是AIGC的下一站——AI生成内容。

我们处在一个被短视频颠覆和重构的时代。短视频平台已经在全球范围内形成了用户最多、影响力大的媒介形式。AI与视频的结合,正变成新的巨型风口。在2022年,百度文心大模型先后带来了一系列视频生成作品,其完善的效果与创意性地表达,赢得了业界与公众的一致认可。

在百度2022万象大会期间,数字人度晓晓作词作曲演唱的MV《启航星》正式上线。这也成为成为首支全AIGC生成的音乐MV。《启航星》MV视频依托百度推出的AI艺术和创意辅助平台——文心一格,根据歌词自动生成画面。其不仅探索了数字人、AI生成内容等技术的边界,更为MV制作、AI与音乐产业结合展现出了清晰的路径。

10月20日,《人民日报》发布AI根据二十大报告中部分词语描绘的未来中国图景视频,该视频由百度飞桨、文心一格提供技术支持。根据内容描述,文心大模型准确描绘出了未来中国的发展图卷。笔触老练自然,完全没有传统意义上认为AIGC内容会有的生涩感与不和谐。

等到《AI描绘天宫盛宴》到来,我们可以看到文心大模型生成的视频内容更加具有整体性风格,画面调动也更有逻辑性,并且内容能够与中国传统文化,比如《西游记》中蟠桃盛宴,进行有机且巧妙的结合。

在这一哥哥AI生成内容背后,我们可以看到文心大模型走出了两条路:技术之路,与文化之路。

AI生成内容的技术难点,正被一个个打破

“最先进的 AI 动画生成技术在中国。”

这句话,是今年8月文心ERNIE-ViLG 2.0模型通过百度API服务的方式进行开放公测后,一位外国开发者留在评论区的。几个月之后,这样的肯定依旧令我们振奋。数年前,绝大部分人可能会觉得中国难以在AI生成内容中实现领先,但现在这一切已经做到了。

究其根本,在于文心大模型持续面向AIGC的技术挑战发起一波波冲锋。今年在文心大模型支持的多部破圈视频里,我们可以看到其中的技术力表现持续升级。简单感、不流畅、缺乏创意风格等AI生成内容的传统问题,正在一个个被文心打破。

在这背后,是文心大模型ERNIE-ViLG 2.0跨模态图文生成能力的帮助和支持。基于ERNIE-ViLG 2.0,可以实现从文本内容到视频内容中,转化的可控性与细节描述能力不断提升。而这源于秉承着百度在文心大模型当中探索的知识增强方向,为ERNIE-ViLG 2.0找到了核心的升级方向。ERNIE-ViLG 2.0采用基于知识增强算法的混合降噪专家建模,是全球首个将知识增强与AIGC相互结合的大模型。其最终表现,在权威评测集 MS-COCO 和人工盲评上均超越了 Stable Diffusion、DALL-E 2等主流模型,在AI生成内容等方面,取得全球业界的最佳效果,在语义可控性、图像清晰度等方面均展现出了显著优势。

从《AI描绘天宫盛宴》中,我们可以看到画面可控性、复杂构图和细节刻画能力都达到了新的水平高度。AI生成内容不再是生成一帧帧图片合成视频,而是基于统一风格,完整、连续地展现出了视频全貌。这就是知识增强路径为AIGC带来的不同之处。

当时间来到2023,中国AI行业、AI开发者,以及广大视频创作者,将得到全球领先的AI生成内容能力作为发展引擎——这就是文心大模型,这座“空间站”的战略意义。

更懂中国,更懂未来

另一方面,我们可以在《AI描绘天宫盛宴》看到一种我们非常熟悉的审美风格,其神韵非常类似1961年上海美术电影制片厂制作的《大闹天宫》。那既是中国动画史的开端,也是深刻国民DNA的文化记忆。

用这种审美意蕴展现中国航天三十年的故事,是非常容易获得国人共鸣,产生审美与文化认同的。这一点其实非常重要,AIGC的最终价值在于文化传播。试想一下,如果AI生成的内容不懂一个国家的语言、文化、典故以及审美意味,那么最终做出来的内容是否可能实现高效率、有认同的传播?

从这个角度看,中国的AI大模型发展与AIGC能力建设就显得更加富有不可替代性。我们不能等到AI生成内容大规模落地时,一味照搬符合他国文化与英语语言习惯的内容给中国观众看。而文心对中文数据、中文知识的学习,以及对中国文化、中国审美的理解,则适当地填补了这个空白。从文心一格对中文的理解能力,以及最终生成内容中展现的中国意境,就可以看到目前适合中国环境的AIGC。我们不需要在基础能力和技术上进行漫长的模仿与追赶,而是可以站在更高点,直视AIGC最前沿、最令人激动的可能性。

2022年,是中国人追逐群星之年,也是中国人追逐AIGC之梦的一年。伴随着更多AI生成内容火爆出全,更多AIGC的行业化方案落地,更多平台化能力开放,文心一格正在打开科技与文化融合创新的想象空间,文心大模型正在成为AIGC发展的新引擎。

在文心这座“空间站”,我们已能看到智能世界的浩瀚星空。

审核编辑黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302535
  • AIGC
    +关注

    关注

    1

    文章

    393

    浏览量

    3269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模拟前端设计的智能革命

    当智能家居突然“变笨”,问题往往出在最基础的数据入口——模拟前端(AFE)。追逐算法与算力之际,这个将现实世界信号转化为数字信息的“感官”常被忽视,成为制约AI性能的关键瓶颈。
    的头像 发表于 03-14 16:29 2334次阅读
    模拟前端设计的智能革命

    纽扣电池给单片机供电问题

    差异性,导致单片机的供电可能是3.1V,可能是2.9V,这样的差异会影响到单片机的基准电压导致adc采样值不稳定。对于这种情况,我该如何处理,使得使用不同纽扣电池时,adc采样值尽可能
    发表于 03-14 14:57

    开关电源布局原则

    的讨论。这些元件不应该离电感器太近。 走线和接地层 使所有的电源(大电流)走线尽可能短、直、粗。一块标准PCB板上,最好使走线的每安绝对最小宽度为15mil(0.381mm)。电感器、输出电容器和输出二极管应该
    发表于 01-15 06:16

    规划模块自动驾驶系统中主要干了啥事?

    规划模块自动驾驶系统中主要用来执行决定“行驶路径”与“行驶方式”的任务。它接收来自定位、感知、地图、预测等模块的信息,进行综合处理后,制定出一条既符合法规、保障安全,又尽可能舒适高效的行驶路线。
    的头像 发表于 12-13 12:07 2395次阅读

    单片机系统进行扩展时需要遵循的原则有哪些

    尽可能选择典型电路,并符合单片机常规用法。为硬件系统的尺度化、模块化打下良好的基础。 2、系统扩展与外围设备的配置水平应充分知足应用系统的功能要求,并留有适当余地,以便进行二次开发。 3、硬件结构应
    发表于 12-09 07:56

    德州仪器GaN器件释放光伏系统更多潜能

    如何尽可能高效地利用太阳能,光伏逆变器的性能是技术创新的核心。其中一项创新涉及使用氮化镓 (GaN)。
    的头像 发表于 12-04 14:10 4254次阅读

    使用直接寻址方式提高速度

    嵌入式系统,特别是资源受限的环境中,尽量使用直接寻址方式来提高速度是一个有效的优化策略。以下是一些具体方法和示例,帮助你尽可能多地使用直接寻址的变量,从而提高系统性能。 直接寻址的优势 直接寻址
    发表于 12-04 06:28

    集成电路中场效应晶体管的寄生参数提取方法

    栅极电阻的存在对电路性能的影响很大,会引入热噪声,增大电路的噪声系数,影响器件的开关速度和最大振荡频率,因此版图设计时,要考虑尽可能地减小栅极电阻。
    的头像 发表于 09-22 10:51 1145次阅读
    集成电路中场效应晶体管的寄生参数提取方法

    如何使用 M252 PSIO 实现 ARGB2 LED 定时,实现彩虹、剧场追逐彩虹等灯光效果?

    使用 M252 PSIO 实现 ARGB2 LED 定时,实现彩虹、剧场追逐彩虹等灯光效果
    发表于 08-20 06:58

    TDK TLVR电感器服务器电源电路的应用

    精度提供磁芯电压,则电压为1V时的公差必须控制±30mV。对于服务器专用电源,即使超过1000A的大电流负载骤变的驱动条件下,输出电压必须尽可能保持稳定。
    的头像 发表于 08-18 10:46 4w次阅读
    TDK TLVR电感器<b class='flag-5'>在</b>服务器电源电路的应用

    “出发吧!新疆”AIGC宣传片创作大赛全球征片中

    升级的创新突破。 「出发吧!新疆」2025新疆文旅AIGC宣传片创作大赛线下沙龙会。   7月6日当天,北京举办了一场AIGC宣传片创作大赛线下沙龙,大赛评审团专家、资深AIGC创作
    的头像 发表于 07-14 10:38 780次阅读
    “出发吧!新疆”<b class='flag-5'>AIGC</b>宣传片创作大赛全球征片中

    直线模组精度等级是如何划分的?

    直线模组的精度是非常重要的指标,尽可能减少精度误差,才能让发挥出直线模组所在设备的稳定性。
    的头像 发表于 06-30 17:53 1286次阅读
    直线模组精度等级是如何划分的?

    将 TypeC 连接到 DisplayPort 转换电缆时,可能无法检测到 CC 线路,可能无法显示屏幕,为什么?

    CYPD5225-96BZXI 设计具有 2 个 Type-C 端口的设备。 将 TypeC 连接到 DisplayPort 转换电缆时,可能无法检测到 CC 线路,可能无法显示屏幕。 ■详细信息
    发表于 05-28 08:11

    如何在Visual Studio 2022中运行FX3吞吐量基准测试工具?

    Visual Studio 2022 中运行此工具的步骤吗? 此外,是否有我可能错过的可执行文件(例如在 GitHub 上)? 预先感谢您的帮助!
    发表于 05-13 08:05

    【Simcenter Flotherm】加速完成热设计,尽可能地减少返工和物理原型设计,腾出宝贵的工程资源用于创新开拓

    优势提前进行热设计可避免后期设计返工,消除对物理原型设计的需求拖放式库功能实现完整的工作流嵌入和供应链支持合理设计的冷却解决方案可最大限度地减少产品重量和成本可用于选择从产品概念到最终设计的冷却策略Smartparts支持快速建模快速强大的网格划分和解决方案支持全自动设计空间探索和设计优化用户界面支持日语和简体中文独特的Flexx授权许可选项允许运行Simc
    的头像 发表于 04-22 14:42 1232次阅读
    【Simcenter Flotherm】加速完成热设计,<b class='flag-5'>尽可能</b>地减少返工和物理原型设计,腾出宝贵的工程资源用于创新开拓