1872年,斯坦福找到了一位科学家进行连续摄影并由此创造了人类历史上第一个“视频”。1877年,爱迪生在其“圆筒留声机”上录制了《玛丽有只小羊羔》的几秒钟歌词,标志着人类历史上的第一条音频记录。由此,人类正式进入了音视频时代。
在人类漫长的历史长河中,文字、图画是记录和传递信息的主要方式,直到音视频出现,才将人类记录信息的方式升级到了一个更高维度。从黑白电视再到8K杜比全景声超清音视频,音视频产业经过一百多年的发展,已然成长为万亿级产业。
01
风口之上的多重挑战
在数字化浪潮的推动下,AI、大模型与音视频的结合正成为产业焦点,引领着一场全新的内容革命。从 AI 作曲到智能配音,从视频生成到虚拟形象,AI 在音频、视频创作领域的应用正在全面开花。
不久前的2024中国新媒体大会上,一系列获奖的AI融媒精品案例彰显了文化与科技的“双向奔赴”,其中包括5G密集视音频传输系统、视频内容生产与传播一体化完整技术方案等,AI已重新定义音视频生产力的“新范式”,人工智能和音视频领域融合趋势日渐显著,同时音视频服务已广泛应用于互娱、广电传媒、教育、金融等各种行业,对场景的渗透愈发深入,“人工智能+音视频”技术正加速赋能千行百业。
与此同时,这一核心变革的背后,也对AI算力提出了更高要求。
视频生成模型的数据处理挑战
视频生成模型需要处理包括图像、音频和视频在内的大量数据,样本数据模态多样化、数据质量参差不齐,导致数据处理链路环节多、工程复杂。另外大量的多模态数据处理也对数据存储以及异构算力资源调度提出了极高的需求。
算力需求及成本挑战
音视频AI技术快速发展伴随着算力需求激增,随之是高昂的算力成本。细腻的画面质感、流畅的帧率,还有精准的特效处理,这一切都需要强大的算力支持,以某影片为例,该影片有1600个视觉特效镜头,用单机渲染,需要1700多年,即便用1000台主机,也要耗时约1.7年,算力需求及算力成本都将是天文数字。
02
软硬协同,锚定性能升级
作为中国领先的国产软硬一体产品及服务提供商,拓维信息持续深耕人工智能等前沿技术领域,长期坚持AI算力研发投入,自主研发的兆瀚CTS5301-L AI服务器作为一款专为 “AI+” 时代而生的算力新星,是音视频行业 “减负”与实现创意的最佳拍档。
1
智能算力,多维赋能
兆瀚CTS5301-L AI服务器拥有卓越的AI性能和强大的异构计算能力,全面支持昇腾Atlas 300I Duo等多款行业主流高性能加速卡,最大算力可达1.98PFlops@FP16,全面适用于大模型微调/推理、大模型训练、CV模型推理等多重场景,为支持多模态大模型、计算机视觉(CV)大模型推理等领域处理复杂音视频制作任务提供强大的基础设施支撑。
2
高效渲染,极致视效
兆瀚CTS5301-L AI服务器具备卓越的AI计算能力以及灵活的配置选项,无论是文本生成图像,数据传输还是复杂的图形渲染、视频解码等需求,兆瀚CTS5301-L AI服务器皆能提供多样化算力支撑,大幅缩短渲染时间、降低渲染成本,打造极致的视觉体验。此外兆瀚CTS5301-L AI服务器的整机功耗降低了30%,整机TCO提升了20%,大幅降低 AI 算力使用成本。
3
AIGC,创意无界
除了高质量渲染与超强算力支撑,提升内容制作的效率,兆瀚CTS5301-L AI服务器还支持多种行业主流的高性能加速卡,能够适配多种AI模型和框架,包括但不限于盘古、GLM、GPT-3、STABLE Diffusion等,广泛的兼容性能够满足不同的内容生成类场景对更强大计算资源的需求。
AI技术的进步不断拓展创意的疆界,无论是创造高品质的视觉作品,还是实现精确的语音合成,兆瀚CTS5301-L AI服务器都是音视频行业创意道路上的「硬」核后盾。
未来,拓维信息将携旗下“兆瀚”持续为医疗、金融、教育、娱乐等诸多领域的音视频解决方案提供智能算力底座,助力各行业在数字化转型的道路上实现更高效、更智能的音视频内容创作与传播,携手迈向一个创意无限、精彩纷呈的数字新纪元。
-
音视频
+关注
关注
4文章
463浏览量
29852 -
算力
+关注
关注
1文章
925浏览量
14731 -
AIGC
+关注
关注
1文章
354浏览量
1504
发布评论请先 登录
相关推荐
评论