0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

升腾910和含光800性能对比 昇腾910和含光800性能对比

工程师邓生 2023-08-31 17:31 次阅读

有网友关注升腾910和含光800性能对比;升腾910一般认为就是华为的昇腾910;而含光800则是阿里巴巴发布的含光800AI芯片

2019年9月25日,阿里巴巴发布含光800AI芯片;含光800是高性能的AI推理芯片。该芯片推理性能达到78563 IPS,能效比500 IPS/W。

含光800AI芯片基于RISC-V和阿里自有算法,含光800芯片性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

含光800AI芯片相比传统GPU算力,性价比提升100%。根据云栖大会的现场演示结果显示,比如拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

据阿里介绍含光NPU采用TSMC 12nm工艺制程,可提供全球最高单芯片AI推理性能。 在HGAI模型的推理应用中,含光NPU每秒钟可处理高达78000 IPS的图片,是同类处理器的数十倍性能。

目前含光800目前已被应用到阿里巴巴旗下的的多个业务场景,比如图像视频分析、城市大脑、搜索优化等等。

2019年8月23日,华为发布AI芯片Ascend 910(昇腾910)。

据华为官方介绍,昇腾910AI处理器,基于自研华为达芬奇架构3D Cube技术,实现业界最佳AI性能与能效,架构灵活伸缩,支持云边端全栈全场景应用。

除了基于达芬奇架构的AI核外,昇腾910还集成了多个CPU、DVPP和任务调度器(Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。

昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,为构建横向扩展(Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS是华为自研的高速互联接口,片内RoCE可用于节点间直接互联。最新的PCIe 4.0的吞吐量比上一代提升一倍。

昇腾910算力是国际顶尖AI芯片的2倍,相当50个当前最新最强的CPU;其训练速度,也比当前最新最强的芯片提升了50%-100%。同时华为还发布了配套的新一代AI开源计算框架MindSpore。两者搭配性能最大化利用芯片算力。

新一代的AI开源计算框架MindSpore创新编程范式,使得工程师更容易使用;该计算框架可满足终端、边缘计算、云全场景需求,能更好保护数据隐私;可开源,形成广阔应用生态。

昇腾910半精度(FP16)算力达256 TFLOPS。(还有一个说法是昇腾910的半精度(FP16)算力达到320 TFLOPS);而整数精度(INT8)算力达到 640 TOPS,(还有一个说法是整数精度(INT8)算力达到512 Tera-OPS;小编认为一个数值可能是设计参数值,一个可能是极值)功耗 310W,采用 7nm 先进工艺。此外,昇腾 910 集成了 HCCS、PCIe 4.0 和 RoCE v2 接口,为构建横向扩展 (Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。

比如华为的Atlas 900 AI训练集群,算力达到了256 PFLOPS。要实现这样的算力,如果采用通用CPU需要6195个机柜,用GPU需要208个机柜,而NPU如昇腾只要128个机柜,这归功于昇腾架构对深度学习业务的优化。而且最终,华为只用了16个机柜来实现。

此外,昇腾910为国产AI芯片助力,华为盘古大模型从算力(昇腾算力,昇腾的底层架构也是华为自创的)、芯片使能、AI框架(MindSpore AI计算框架)到AI平台(AI开发生产线ModelArts)实现了全栈自主创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19096

    浏览量

    228792
  • RISC-V
    +关注

    关注

    44

    文章

    2203

    浏览量

    45951
  • AI芯片
    +关注

    关注

    17

    文章

    1850

    浏览量

    34838
  • 昇腾910
    +关注

    关注

    0

    文章

    14

    浏览量

    6773
  • 含光800
    +关注

    关注

    0

    文章

    3

    浏览量

    1697
收藏 人收藏

    评论

    相关推荐

    大型伏电站变压器800V变380V或800V变400V 提升伏发电效能的必备装备

    大型伏电站变压器:800V 变 380V 或 800V 变 400V,伏发电效能提升的关键 在大型伏电站的运行中,变压器扮演着至关重要
    的头像 发表于 11-08 15:05 53次阅读
    大型<b class='flag-5'>光</b>伏电站变压器<b class='flag-5'>800</b>V变380V或<b class='flag-5'>800</b>V变400V 提升<b class='flag-5'>光</b>伏发电效能的必备装备

    PCIe 4.0与PCIe 3.0的性能对比

    随着科技的快速发展,计算机硬件也在不断地更新换代。PCI Express(PCIe)作为一种高速串行计算机扩展总线标准,广泛应用于计算机硬件连接,如显卡、固态硬盘等。 1. 带宽对比 PCIe
    的头像 发表于 11-06 09:22 273次阅读

    DLPC910设备的DLP产品咨询

    电子发烧友网站提供《DLPC910设备的DLP产品咨询.pdf》资料免费下载
    发表于 08-29 09:40 0次下载
    DLPC<b class='flag-5'>910</b>设备的DLP产品咨询

    DLPC910的datasheet中未看到pindelay数据,DLPC910和DMD之间的LVDS总线是否要考虑pindelay的影响?

    如标题所述,DLPC910的datasheet中未看到pindelay数据,DLPC910和DMD之间的LVDS总线是否要考虑pindelay的影响
    发表于 08-16 06:18

    ICL5101与ICL5102性能对比

    ICL5101与ICL5102性能对比-中文
    发表于 06-17 14:26 1次下载

    800G模块面对AI发展的增长之路

    800G的需求量庞大,客户需求没有减少。根据交付计划的进展,预计未来几个季度的出货量将进一步增加。 根据多家机构的研究报告,800G模块在人工智能算力产业链中扮演着至关重要的角色,被认为是其中确定性最高的环节之一。
    的头像 发表于 04-28 18:07 738次阅读
    <b class='flag-5'>800</b>G<b class='flag-5'>光</b>模块面对AI发展的增长之路

    800G模块的两种主流封装

    随着信息时代的快速发展,网络通信的数据传输速率也在不断提升。800G模块作为当前网络通信领域的重要组件,其封装类型对于模块的性能和可靠性具有重要影响。本文小易将为大家介绍800G
    的头像 发表于 04-24 16:20 754次阅读

    易天800G OSFP SR8模块最新产品解决方案

    800G OSFP SR8模块是一种可热插拔的光纤收发模块,它被设计用于数据中心800G SR8以太网链路。该模块采用了最新的100G PAM4和VCSEL技术,可以实现100m以内的800
    的头像 发表于 03-22 17:51 1053次阅读
    易天<b class='flag-5'>800</b>G OSFP SR8<b class='flag-5'>光</b>模块最新产品解决方案

    赛勒科技新型高性能800G硅引擎即将亮相OFC 2024

    南通赛勒光电科技有限公司(简称“赛勒科技”)在近日重磅推出了专为AI集群和数据中心设计的新一代产品——新型高性能800G硅引擎。这款备受瞩目的创新产品即将在盛大的2024年度光纤通信大会(OFC)上亮相,展出时间定于3月26日
    的头像 发表于 03-22 10:07 794次阅读

    800G模块的应用场景

    随着科技发展,数据中心对光模块需求大增。800G模块作为一种高速传输技术,应用场景扩展并引起广泛关注。主要应用于数据中心、云计算和网络通信等领域,满足现代社会对高带宽、快速数据传输的需求。
    的头像 发表于 03-11 15:30 571次阅读

    英伟达和华为/海思主流GPU型号性能参考

    一句话总结,H100 vs. A100:3 倍性能,2 倍价格 值得注意的是,HCCS vs. NVLINK的GPU 间带宽。 对于 8 卡 A800910B 模块而言,910
    发表于 12-29 11:43 5162次阅读
    英伟达和华为/海思主流GPU型号<b class='flag-5'>性能</b>参考

    以太网通讯与485通讯性能对比

    以太网通讯与485通讯性能对比  以太网通讯和485通讯是两种常用的工业通讯方式,它们在性能方面有着不同的特点和优势。本文将对以太网通讯和485通讯的性能进行详尽、详实、细致的对比,以
    的头像 发表于 12-11 17:07 2154次阅读

    R128平台SPI与DBI接口的性能对比

    R128平台SPI与DBI接口的性能对比
    的头像 发表于 11-15 09:08 951次阅读
    R128平台SPI与DBI接口的<b class='flag-5'>性能对比</b>

    NVMe SSD性能影响因素分析

    NVMe SSD 厂商Spec给出的性能非常完美,前面也给出了NVMe SSD和磁盘之间的性能对比,NVMe SSD的性能的确比磁盘高很多。
    的头像 发表于 11-13 11:39 1063次阅读
    NVMe SSD<b class='flag-5'>性能</b>影响因素分析

    800G数据中心的DAC、AOC和模块的并行布线解决方案介绍

    上期,易飞扬发布营销报告,阐明Al应用的兴起与普及将驱动数据中心网络架构变革,从而促进数据中心基础设施投资增长,进而带动了400G/800G模块市场的增长。 目前多款800G交换机芯片已发布
    的头像 发表于 11-10 09:24 1396次阅读