0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

世界上最复杂的AI芯片Colossus MK2或GC200 IPU?

倩倩 来源:绿色消费网 2020-07-20 14:58 次阅读

一家英国芯片初创公司推出了它声称是世界上最复杂的AI芯片Colossus MK2或GC200 IPU(智能处理单元)。Graphcore将其MK2与Nvidia的适用于AI应用的Ampere A100 GPU进行对比。

MK2及其前身MK1专为处理非常大型的机器学习模型而设计。MK2处理器具有1,472个独立的处理器核心和8,832个独立的并行线程,所有这些均由900MB的处理器内RAM支持。

Graphcore表示,MK2的BERT-Large训练性能比MK1改进了9.3倍,BERT-3Layer推理性能提高了8.5倍,EfficientNet-B3培训的性能提高了7.4倍。

BERT,即来自变压器的双向编码器表示形式,是Google为基于自然语言的搜索而开发的自然语言处理预训练技术。

Graphcore不仅会提供芯片。对于一家相对较新的创业公司(成立于2016年),Graphcore围绕其芯片构建了卓越的生态系统。大多数芯片初创公司只关注其硅片,但是Graphcore提供了更多的东西。

它通过其新的IPU机器M2000出售GC200,该IPU机器M2000在1U盒中包含四个GC200芯片,并提供1 petaflop的总计算能力。Graphcore指出,您可以从直接连接到现有x86服务器的单个IPU-Machine M2000盒子开始,或者添加总共八个连接到一台服务器的IPU-Machine M2000。对于大型系统,它提供IPU-POD64,其中包括内置在标准19英寸机架中的16台IPU-Machine M2000。

通过Graphcore的全新IPU-Fabric技术可以大规模连接IPU-Machine M2000和IPU-POD,该技术是专为机器智能通信而设计的,并提供了专用的低延迟结构,可以在整个数据中心连接IPU。

Graphcore的Virtual-IPU软件与工作量管理和编排软件集成在一起,可为许多不同的用户提供培训和推理服务,并且它允许对可用资源进行调整,并根据工作进行重新配置。

这家初创公司表示,其新硬件完全是即插即用的,客户将能够将多达64,000个IPU连接在一起,总共拥有16 exaFLOP的计算能力。

这是一个很大的要求。英特尔ARMAMD富士通和Nvidia仍在朝着exaflop的目标迈进,而Graphcore声称是后者的16倍。

Graphcore的另一个关键要素是其Poplar软件堆栈,该堆栈由IPU从头开始设计,并与标准机器学习框架完全集成,因此开发人员可以轻松移植现有模型,并在熟悉的环境中快速启动并运行。对于希望完全控制以利用IPU发挥最大性能的开发人员,Poplar支持使用Python和C ++直接进行IPU编程

Graphcore有一些重要的MK2系统早期采用者,包括牛津大学,美国能源部的劳伦斯·伯克利国家实验室和JP Morgan,后者致力于自然语言处理和语音识别

IPU-Machine M2000和IPU-POD64系统现已开始预订,并于2020年第四季度开始批量生产。早期访问客户可以通过Graphcore的云合作伙伴Cirrascale在云中评估IPU-POD系统。它计划在未来几个月内宣布OEM和渠道合作伙伴。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19159

    浏览量

    229097
  • 芯片
    +关注

    关注

    453

    文章

    50387

    浏览量

    421757
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132402
收藏 人收藏

    评论

    相关推荐

    NVIDIA Colossus超级计算机集群突破10万颗Hopper GPU

    NVIDIA近日宣布,其位于田纳西州孟菲斯市的xAI Colossus超级计算机集群规模已壮大至10万颗NVIDIA Hopper GPU。这一里程碑式的成就,再次彰显了NVIDIA在AI计算领域
    的头像 发表于 10-30 10:29 261次阅读

    NVIDIA 以太网加速 xAI 构建的全球最大 AI 超级计算机

    、超大规模的 AI 工厂提供卓越性能而设计的 RDMA(Remote Direct Memory Access)网络。   Colossus世界上最大的 AI 超级计算机,目前正被
    发表于 10-30 09:33 120次阅读
    NVIDIA 以太网加速 xAI 构建的全球最大 <b class='flag-5'>AI</b> 超级计算机

    马斯克官宣超级AI训练集群Colossus上线

    Colossus再启新程,计划在未来数月内新增10万张GPU,其中半数为更先进的H200型号,这一举措预示着其算力将实现翻倍增长,开启AI训练的新纪元。
    的头像 发表于 09-04 16:13 353次阅读

    格科微量产第二代单芯片3200万像素图像传感器GC32E2,搭载DAG升级HDR影像体验

    近日,格科微成功量产高性能的第二代单芯片3200万像素图像传感器——GC32E2GC32E2搭配单帧高动态DAG HDR技术,预览、拍照、录像时,均能以更低功耗输出明暗细节丰富、无伪影的影像
    发表于 06-19 16:16 1111次阅读
    格科微量产第二代单<b class='flag-5'>芯片</b>3200万像素图像传感器<b class='flag-5'>GC32E2</b>,搭载DAG升级HDR影像体验

    格科微量产第二代单芯片3200万像素图像传感器GC32E2

    近日,格科微成功量产高性能的第二代单芯片3200万像素图像传感器——GC32E2GC32E2搭配单帧高动态DAG HDR技术,预览、拍照、录像时,均能以更低功耗输出明暗细节丰富、无伪影的影像。
    的头像 发表于 06-19 14:38 713次阅读

    AI芯片哪里买?

    AI芯片
    芯广场
    发布于 :2024年05月31日 16:58:19

    2.4GHz ISM射频前端芯片GC1103在无线遥控玩具中的应用

    2.4GHz ISM射频前端芯片GC1103在无线遥控玩具中的应用
    的头像 发表于 05-23 09:54 518次阅读
    2.4GHz ISM射频前端<b class='flag-5'>芯片</b><b class='flag-5'>GC</b>1103在无线遥控玩具中的应用

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    2024年3月19日,[英伟达]CEO[黄仁勋]在GTC大会上公布了新一代AI芯片架构BLACKWELL,并推出基于该架构的超级芯片GB200,将助推数据处理、工程模拟、电子设计自动化
    发表于 05-13 17:16

    苹果云服务器处理AI复杂任务,低端芯片负责简单任务

    根据外媒彭博社报道,苹果公司已经开始将高端芯片(例如M系芯片)安装至云计算服务器,以承担AI复杂任务;相反,一些较初级的AI功能则会在iPh
    的头像 发表于 05-10 15:12 516次阅读

    risc-v多核芯片AI方面的应用

    RISC-V多核芯片AI方面的应用主要体现在其低功耗、低成本、灵活可扩展以及能够更好地适应AI算法的不同需求等特点。 首先,RISC-V适合用于高效设计实现,其内核面积更小,功耗更
    发表于 04-28 09:20

    AI芯片未来会控制这个世界吗?

    AI芯片行业资讯
    芯广场
    发布于 :2024年03月27日 18:21:28

    GC9008 12V 全桥驱动芯片,可替代TMI8118,应用于摄像机、消费类产品

    GC9008 是一款 12V 全桥驱动芯片,为提供高性价比的方案。它能提供 0.1A 的持续输出电流。可以工作在 4.5~15V 的电源电压。 具有 PWM(IN1/IN2)输入接
    发表于 01-30 15:44

    意法半导体开发出世界上最大的影像传感器

    传感器由意法半导体专门为世界上最先进的摄影系统 Big Sky定制,能够为拉斯维加斯的Sphere球幕拍摄超高分辨率影像。
    的头像 发表于 01-18 10:02 595次阅读

    双通道5V高细分步进驱动芯片GC6151概述

    GC6151是双通道5V低电压步进电机驱动器,具有低噪声、低振动的特点,特别适用于相机的变焦和对焦系统,万向节,摇头机和其他精密,低噪声扫描隧道显微镜控制系统。该芯片为每个通道集成了256微步驱动器
    的头像 发表于 12-07 14:19 680次阅读
    双通道5V高细分步进驱动<b class='flag-5'>芯片</b><b class='flag-5'>GC</b>6151概述

    立体声数模转换芯片GC4344的性能有哪些?

    multi-bitΔΣ调制器,而且本芯片可以通过检测信号频率和主时钟频率,在 2KHz 和200KHz 之间自动调节采样率。
    的头像 发表于 12-06 15:15 692次阅读
    立体声数模转换<b class='flag-5'>芯片</b><b class='flag-5'>GC</b>4344的性能有哪些?