0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook开源服务27亿用户的硬件3件套

DPVg_AI_era 来源:lp 2019-03-16 09:23 次阅读

面对每个月27亿活跃用户产生的数据量,Facebook将重心从通用硬件转向AI专用硬件。在今天的开放计算项目全球峰会上,发布并开源了3款AI硬件,分别是面向训练的Zion、面向推理的Kings Canyon及面向视频转码的Mount Shasta。

一个全家桶app,每个月要服务27亿人,不容易呐!不信你问Facebook。

为了应对大量的算力要求,这家位于Menlo Park的技术巨头,硬是从通用硬件转移到了专用加速器。这些加速器的作用,是保证其数据中心的性能,功耗和效率,特别是在AI领域。

今天,Facebook一口气推出了3款硬件产品,分别是用于AI模型培训的“下一代”硬件平台Zion;以及针对AI推理优化的定制专用集成电路Kings Canyon;以及视频转码Mount Shasta。并捐赠给旗下的开放计算项目使用。

Open Compute Project(OCP)是Facebook在2011年4月发起的一個数据中心开放架构技术发展组织,目前成员包括Intel、Red Hat、Facebook、Mozilla、Rackspace、NTT Data、百度、高盛以及Google等。https://benchlife.info/8597-2/

Facebook称这三款硬件产品将大大加速AI的训练和推理。“人工智能用于各种服务,以帮助人们进行日常互动,并为他们提供独特的个性化体验,” Facebook工程师Kevin Lee,Vijay Rao和William Christie Arnold在博客文章中写道,“在整个Facebook的基础设施中使用人工智能工作负载,能够增强各服务之间的相关性,并改善我们的用户体验。”

Zion

Zion为AI训练创建Block

和Block之间通信

Zion专为处理包括CNN,LSTM和SparseNN在内的神经网络架构的“频谱”而量身定制。包括三个部分:拥有8个NUMA CPU插槽的服务器;配备了8加速器芯片组,以及一个厂商中立(vendor-agnostic )的OCP加速器模块(OAM)。

Zion的高内存容量和高带宽,得益于两个高速fabric,一个用来连接所有的CPU,另一个用来连接所有的加速器。除此之外,还得益于其灵活的架构,可以使用顶部扩展到单个机架中的多个服务器机架式(TOR)网络交换机

“加速器内存带宽高但容量低,所以我们通过对模型进行分区来解决这个问题:将频繁访问的数据驻留在加速器上,而访问频率较低的数据驻留在带有CPU的DDR内存里,“Lee,Rao和Arnold解释道,“所有CPU和加速器的计算和通信都是平衡的,并通过高速和低速互连,极大地提高了效率。”

Kings Canyon

Zion为AI推理创建Block

和Block之间通信

至于专为推理任务而设计的Kings Canyon共分四个部分:Kings Canyon推理M.2模块;Twin Lakes单插槽服务器;Glacier Point v2载卡;以及Facebook的Yosemite v2机箱。Facebook表示正在与Esperanto、Habana,英特尔,Marvell和高通公司合作,开发能够同时支持INT8和高精度FP16工作负载的ASIC芯片。

ASIC不运行通用代码,需要专门的编译器将图形转换为在这些加速器上执行的指令。Glow编译器的目标是从更高级别的软件堆栈中抽象出特定于供应商的硬件,以使基础架构与供应商无关。它接受来自PyTorch 1.0等框架的计算图,并为这些ML加速器生成高度优化的代码。

Glow编译器

Kings Canyon中的每台服务器都结合了M.2 Kings Canyon加速器,以及一个连接Twin Lakes服务器的Glacier Point v2载卡。其中两个被安装到Yosemite v2 sled中,并通过NIC链接到TOR开关。Kings Canyon模块包括一个ASIC,一个内存及其他支持组件,比如通过PCIe通道与加速器模块通信的CPU。而Glacier Point v2包含一个集成的PCIe交换机,允许服务器同时访问所有模块。

“通过适当的将模型进行分割,我们得以运行非常大的深度学习模型。例如,对于SparseNN模型,如果单个节点的内存容量不够用,就在两个节点之间对模型进行分片,从而增加模型可用的内存量。“Lee,Rao和Arnold说过,“这两个节点通过多主机NIC连接,允许高速交换。”

Mount Shasta

Mount Shasta是与Broadcom和Verisilicon合作开发的ASIC,专为视频转码而开发。在Facebook的数据中心内,它将被安装在带有集成散热器的M.2模块上,位于可容纳多个M.2模块的Glacier Point v2(GPv2)载板中。

Facebook表示,平均而言,预计这些芯片的效率会比目前的服务器“高出许多倍”。它的目标是在10W功率范围内,以60fps速度输入流编码效率至少比4K高出一倍。

“我们希望Zion、Kings Canyon和Mount Shasta的设计,能够满足我们在AI训练、AI推理和视频转码方面不断增长的工作量。”Lee,Rao和Arnold写道,“我们将采取硬件和软件协同设计,不断改进硬件产品的效率。但一家厂商的能力终归有限,希望更多的厂商都能够进入Facebook的生态中,共同努力。“

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    795

    浏览量

    37751
  • Facebook
    +关注

    关注

    3

    文章

    1429

    浏览量

    54643
  • ai硬件
    +关注

    关注

    0

    文章

    12

    浏览量

    2389

原文标题:Facebook开源AI硬件,一口气推出“三件套”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    3D打印汽车零部模型定制服务,多种材料、快速打印-CASAIM

    在汽车行业中,3D打印技术正以其独特的优势,推动着从设计到快速制造的革命性变化。3D打印技术不仅加快了原型制作的流程,还为最终零部的生产提供了新的可能性。以下是CASAIM的3D打印
    的头像 发表于 11-20 16:21 131次阅读
    <b class='flag-5'>3</b>D打印汽车零部<b class='flag-5'>件</b>模型定制<b class='flag-5'>服务</b>,多种材料、快速打印-CASAIM

    亿华云服务器怎么样靠谱吗?

    广大用户的青睐。公司采用企业级硬件及网络架构,为用户提供极致性能、安全可靠的云服务。无论是从性能稳定性、安全防护、产品线丰富度还是客户服务
    的头像 发表于 11-20 09:44 111次阅读

    服务器数据恢复—EXT3系统下误删除数据的恢复案例

    服务器数据恢复环境: 邮件服务器中有一组由8块盘组成的RAID5阵列, 上层是Linux操作系统+EXT3系统。 服务器故障:
    的头像 发表于 10-23 15:11 127次阅读
    <b class='flag-5'>服务</b>器数据恢复—EXT<b class='flag-5'>3</b>文<b class='flag-5'>件</b>系统下误删除数据的恢复案例

    3D打印汽车零部建模设计3D打印服务

    传统的汽车零制造过程需要经过多个环节,包括设计、制造、装配等,耗时且复杂。而采用3D打印技术制造汽车零可以大幅度缩短生产周期。设计人员可以通过CAD软件直接进行零设计,并将设计文
    的头像 发表于 07-21 15:01 498次阅读
    <b class='flag-5'>3</b>D打印汽车零部<b class='flag-5'>件</b>建模设计<b class='flag-5'>3</b>D打印<b class='flag-5'>服务</b>

    tcp方式连接不了服务器了,服务器代码还能开源吗?

    是在维护服务器吗?已经两天了。http方式还可以连接上,就tcp的方式不行了.服务器代码能开源吗?让我们自己搭建服务器用。
    发表于 07-15 06:53

    Meta推出最强开源模型Llama 3 要挑战GPT

    Meta推出最强开源模型Llama 3 要挑战GPT Facebook母公司Meta Platforms(META.US)推出了开源AI大模型“Llama”的最新升级版本“Llama
    的头像 发表于 04-19 17:00 800次阅读

    基于网络的设计平台Canva收购了Affinity创意软件套

    基于网络的设计平台Canva收购了Affinity创意软件套件,将自己定位为Adobe数字设计行业的挑战者。
    的头像 发表于 04-01 17:29 746次阅读

    荷兰要斥资27亿美元“留”ASML

    据百能云芯电.子元器.商.城了解,荷兰政府宣布将投资25亿欧元(合27亿美元)用于改善埃因霍温地区的交通和其他基础设施,以确保荷兰最大的公司ASML将其业务留在国内。ASML是欧洲最
    的头像 发表于 03-29 16:54 300次阅读

    硬件测试服务项目的重要性和作用

    硬件测试服务项目是确保硬件设备性能稳定、质量可靠的关键环节。它涉及对硬件产品进行全面、细致的检查和验证,以确保其满足设计要求并具备优良的用户
    的头像 发表于 03-28 09:54 676次阅读
    <b class='flag-5'>硬件</b>测试<b class='flag-5'>服务</b>项目的重要性和作用

    Meta服务器宕机逾3小时,马斯克调侃:“此刻正阅读的你……”

    3 月 6 日报道,今日多家 Meta 旗下服务,如Instagram和Facebook遭遇严重全球服务中断,超过三小时无法正常运作。
    的头像 发表于 03-06 13:53 474次阅读

    OpenHarmony开源GPU库Mesa3D适配说明

    本文档主要讲解在OpenHarmony中,Mesa3D的适配方法及原理说明。 环境说明: OHOS版本: 适用3.2-Beta3及以上 内核版本: linux-5.10 硬件环境
    发表于 12-25 11:38

    Facebook开源StyleX如何在JavaScript中写CSS呢?

    Meta(原 Facebook开源了全新的 CSS-in-JS 库 StyleX。
    的头像 发表于 12-14 10:03 670次阅读

    东芝与罗姆投资27亿美元联合生产功率芯片

    近日,据路透社消息,东芝和罗姆表示,他们将投资 3883 亿日元(27 亿美元)联合生产功率芯片。
    的头像 发表于 12-14 09:30 645次阅读

    R8C/3JT 组 用户手册: 硬件

    R8C/3JT 组 用户手册: 硬件
    发表于 12-07 18:30 0次下载
    R8C/<b class='flag-5'>3</b>JT 组 <b class='flag-5'>用户</b>手册: <b class='flag-5'>硬件</b>

    Banana Pi BPI-W3 开源硬件开发板应用特点

    Banana Pi BPI-W3 开源硬件开发板是一款强大的开源硬件开发板,具有广泛的功能和应用。在本篇文章中,我将详细介绍 BPI-W3 的特点、性能以及应用领域。这将包括
    的头像 发表于 12-01 15:44 582次阅读