不久之前,Meta公开了他们在自研芯片上的进展,包括其第一代AI加速器MTIA,以及用于视频转码的MSVP。作为有些“下坡路”倾向的互联网大厂,Meta依然选择自研硬件和芯片,可见Meta对AI的重视。
自研AI加速器MTIA
Meta过去的服务器架构主要依靠CPU来运行AI负载,但随着AI模型对算力和内存的要求不断提高,致使其不得不开始转向特化的方案,比如GPU和NNPI之类的其他硬件加速器。可由于高性能GPU的成本持续走高,Meta很快就转向了自研ASIC方案。
其实早在2020年,他们就设计了第一代的MTIA ASIC,不过当时仅仅只是用于MTIA的部分内部工作负载,主要是为Pytorch和Meta的推荐模型联合设计出来的,用于推理加速。第一代MTIA基于台积电7nm工艺打造,性能达到了102.4TOPS@INT8和51.2 TFLOPS@FP16,功耗仅有25W。
MTIA v1裸片 / Meta
单个MTIA加速器集成了64个处理单元(PE),最高128GB的片外LPDDR5内存和128MB的片上SRAM。值得一提的是,每个处理单元都由两个RISC-V处理器核心构成,其中一个还配备了向量扩展。
从Meta公布的v1版系统设计上可以看出,MTIA加速器装在了一个小型的双M.2主板上,方便设计者轻松地集成在服务器中,通过PCIe 4.0 x8接口与主CPU相连,板卡功耗仅有35W。
当然了,作为OCP的创始者,Meta也在服务器的设计上采用了OCP的Yosemite V3规范,每个服务器包含12个加速器,并使用PCIe Switch相连,根据Meta的说法,加速器的数目和服务器的配置参数是为了优化目前及未来的负载而精心选择的。
自研视频转码芯片MSVP
值得注意的是,MTIA v1还只是他们在2020年开发的第一代AI加速器,Meta的目标是设计一系列推荐用MTIA ASIC。不过,MTIA v1在自研程度上或许没有我们想象得那么深入,比如其RISC-V核心很可能是来自第三方IP厂商的。
而与MTIA一并公开的MSVP,却是Meta首个真正意义上的内部自研ASIC方案,专为解决Meta的视频点播和直播负载而设计,甚至考虑到了其AR/VR业务。Meta认为,这类转码芯片的存在,会为Meta未来在元宇宙上布局的生成式AI短视频,提供更多支持。
MSVP / Meta
据Meta强调,Facebook网站上的视频流量每天就有40亿播放量,所以提升压缩效率,提供更高的稳定性、可靠性以及近乎无限的扩展性,就成了他们对自研视频转码芯片的要求。从MSVP的设计架构上来看,除了多处理器的CPU子系统外,芯片大部分由转码核心构成。
在解码性能上,MSVP支持主流的H.264、HEVC、VP9和AV1编码,最大支持10bit色深和YUV420色度采样。而在编码性能上,MSVP仅支持H.264和VP9编码,最大支持8bit色深。
Meta给出的数据中,每个MSVP可以在最高图像质量输出时实现4K 15FPS的峰值转码速度,在标准图像质量下实现4K 60FPS的转码速度,且单个PICe模块的功耗只有10W左右。由于采用了硬件转码加速,MSVP是ibx264软件编码速度的9倍,是libVPX软件编码速度的50倍。
写在最后
Meta最重要的一大营收来源就是广告业务,所以相对其他互联网公司,他们会将深度学习推荐模型(DLRM)放在第一位。随着模型大小和复杂程度不断增加,如何跟上这股趋势同时保证ROI,就成了他们的主要问题。MTIA代表了他们在自研AI基础设施上走出的重要一步。至于MSVP,则代表了Meta想要进一步发展短视频、AR/VR内容的同时,减少网络带宽提高传播力度的解决方案。未来Meta要想逆流而上,这些自研芯片无疑会提供不小的助力。
-
Meta
+关注
关注
0文章
270浏览量
11378 -
RISC-V
+关注
关注
45文章
2271浏览量
46132
发布评论请先 登录
相关推荐
评论