0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM发布全新架构CPU、GPU及AI内核 性能全面提升

DPVg_AI_era 来源:yxw 2019-05-29 17:11 次阅读

近日,ARM发布了下一代架构设计方案,三款重磅利器腾空出世:Cortex-A77 CPU、Mali-G77 GPU和ARM ML处理器,性能全面提升。ARM表示,新的旗舰级IP将定义2020年高端智能手机性能,提供新一代的人工智能体验。

ARM祭出了三把利器。

昨日,全球领先半导体知识产权(IP)提供商ARM重磅发布了下一代架构设计方案,其中包括:

Cortex-A77 CPU;

Mali-G77 GPU;

ARM ML处理器。

ARM表示,新的旗舰级IP将定义2020年高端智能手机性能,提供新一代的人工智能体验。

而在此前,新智元也报道了ARM宣布暂停与华为的合作的相关消息,或许此次ARM发布的旗舰级IP将与华为无缘。

不过,华为目前已经获得了ARM8架构的永久授权(ARM8是ARM公司的32/64位指令集,目前的处理器都是这一指令集的产物)。也有可能完全自主设计ARM处理器,并掌握核心技术和完整知识产权,具备长期自主研发ARM处理器的能力。

(对Cortex和Mali不了解?没关系,新智元在文末附了它俩的全家福!)

代号Deimos,新一代CPU性能大幅提升

去年的ARM发布的Cortex-A76其实是一个非常成功的核心架构,全新的架构体系与7nm TSMC工艺的结合,带来了巨大的性能和效率飞跃,麒麟980和骁龙855就是很好的例子。

但ARM真正的竞争对手主要来自苹果的CPU设计团队。仅从CPU来说,目前,苹果的A11、A12仍然有着较为明显的性能、效率优势。

ARM发布的Cortex-A77代号为Deimos(戴莫斯,畏惧之神),与上一代A76可谓是一脉相承,很大程度上保持了上一代的特性。

从官方给出的参数来看,有如下几个关键特性:

依旧采用Armv8.2架构,支持 AArch32 和 AArch64;

64KB L1指令和数据缓存;

256或512KB L2缓存;

以及高达4Mb L3缓存

ARM表示,Cortex-A77和Cortex-A76保持相同的3.GHz峰值频率目标。但预计厂商不会在新一代Soc达到这么高的频率。

Cortex-A77将更多的计算能力用于设备安全的边缘计算上。这些计算能力使用范围包括AI摄像机、视觉场景检测、3D扫描、生物特征用户ID(人脸识别)、语音识别、游戏中的ML和AR中的ML等。

从性能角度来看,Cortex-A77相比于A76有了许多性能上改进:

单线程性能提升20%;

FP性能提升35%;

内存宽带提升15%。

更高的性能也意味着能更好地响应支持AR的新应用程序以及带来的体验。通过Cortex-A77,手机游戏领域的增强现实技术在未来几年有望实现大幅增长。并且Cortex-A77还将支持5G,爱立信在2018年11月的移动报告中预测,到2024年,将有大约15亿台智能手机设备具备5G功能。

而众所周知,对于计算密集型ML、AR和其他新出现的设备来说,5G是一个基本需求。它将带来更快的速度、大带宽(5到20 Gbps)、8K分辨率的流媒体和360度视频

ARM GPU采用全新架构Valhall,性能大跃进

除了Cortex-A77之外,ARM还重磅发布了新一代Mali-G77。

划重点:Mali-G77采用了全新架构,Valhall。而在G71-G76采用的架构都是Bifrost。

Mali-G77在性能、密度和效率方面取得了一些重大改进。虽然去年的Mali-G76引入了对执行引擎计算架构的一些重大更改,但G77的改进更大,并且脱离了ARM相对不同寻常的计算核心设计。

据ARM官方宣称,Mali-G77较前代产品相比:

效能提升30%、性能提升30%、机器学习性能提升60%;

每mm²性能较A76预计提升1.4倍;

在相同的工艺和相同的性能下,实现30%的同比能效改进;

并且比Mali-G72节省50%的功耗。

从官方给出的性能来看,ARM Mali-G77的性能已然接近目前苹果A12的性能,同时也超过了高通Adreno 640的性能。

ARM ML NPU

随着智能手机和计算机继续利用AI来实现摄影中的场景识别或增强现实中的物体识别等功能。同时,许多公司也构建了专门的神经处理单元来处理这些任务,从而减轻了CPU和GPU的压力。

而此次,ARM还发布了其最新的NPU,提供了高达两倍的能效,并且是上一代内存压缩的三倍。与开源的ARM NN软件框架相结合,ARM表示该芯片的八核版本可提供高达32 TOP/s的性能。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9027

    浏览量

    366435
  • 内核
    +关注

    关注

    3

    文章

    1360

    浏览量

    40183
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10802

    浏览量

    210771
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4673

    浏览量

    128555

原文标题:ARM发布全新架构CPU、GPU及AI内核,华为或将无缘

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    GPU服务器AI网络架构设计

    众所周知,在大型模型训练中,通常采用每台服务器配备多个GPU的集群架构。在上一篇文章《高性能GPU服务器AI网络
    的头像 发表于 11-05 16:20 108次阅读
    <b class='flag-5'>GPU</b>服务器<b class='flag-5'>AI</b>网络<b class='flag-5'>架构</b>设计

    《算力芯片 高性能 CPU/GPU/NPU 微架构分析》第1-4章阅读心得——算力之巅:从基准测试到CPU架构的深度探索

    。这一方法突显了现代超算的核心优势——并行计算能力。举一个具体实例来说,天河二号采用了异构架构,集成了英特尔至强处理器和中国自主研发的申威众核加速器。这种CPU与协处理器的结合不仅提升了整体计算
    发表于 10-19 01:21

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU、NPU,给我们剖析了算力芯片的微架构。书中有对芯片方案商处理器的讲解,理论联系实际,使读者能更好理解算力芯片。 全书共11章,由浅入深,较系统全面进行讲解。下面目录对全书内容有一个整体了解
    发表于 10-15 22:08

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    和像素统一的G80到现在重金难求的H100;AMD的Zen系列CPU和RDNA系列GPU两线作战;中国的高性能计算芯片逐步获得更多TOP500排名;华为Ascend 910 NPU芯片也成为A
    发表于 09-02 10:09

    ai服务器是什么架构类型

    架构AI服务器通常具有较高的通用性,可以运行各种人工智能算法。但是,CPU架构AI服务器在处理大规模并行计算时,
    的头像 发表于 07-02 09:51 865次阅读

    英伟达或将推出融合Arm与Blackwell内核AI PC芯片

    近日,业内传出英伟达正在研发一款全新芯片的传闻。据悉,这款芯片将结合下一代Arm Cortex CPU内核与英伟达自家的Blackwell GPU
    的头像 发表于 05-31 10:31 553次阅读

    Arm发布针对旗舰智能手机的新一代CPUGPU IP

    全球领先的芯片设计公司Arm宣布了针对旗舰智能手机市场的全新CPUGPU IP设计方案——Cortex-X925 CPU和Immortal
    的头像 发表于 05-31 09:44 517次阅读

    ARM发布旗舰手机芯片:性能提升AI性能增强、节能减耗

    ARM为Cortex-X系列CPU重新命名,以强调其性能的显著提升。据称,X925的单核性能较X4提升
    的头像 发表于 05-30 11:26 556次阅读

    Arm发布Arm v9架构CPUGPU IP及设计软件,助力AI计算

    长期以来,全球智能手机处理器均采用Arm架构,包括苹果、高通、联发科在内的众多厂商均依赖Arm提供的IP,且该应用范围已逐渐扩展至个人电脑与数据中心领域。
    的头像 发表于 05-30 09:17 681次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    ,推理能力提升 15 倍 GB200由两个B200Blackwell GPU和一个基于Arm的Grace CPU组成,采用[台积电]4纳米工艺制程,共有2080亿个[晶体管],其
    发表于 05-13 17:16

    天玑9300旗舰芯:全大核CPU架构性能与能效的提升

    “全大核”CPU 架构设计打破常规,摒弃小核,采用超大核(Arm Cortex-X)与大核(Arm Cortex-A)的组合,以更高时钟频率提升
    的头像 发表于 05-06 10:22 553次阅读

    Arm推动生成式AI落地边缘!全新Ethos-U85 AI加速器支持Transformer 架构性能提升四倍

    等领先企业均已推出搭载 Ethos-U 的量产芯片。最近,Arm发布Arm Ethos-U85 AI加速器,这款加速器在性能、算力、应用场
    的头像 发表于 04-16 09:10 4476次阅读
    <b class='flag-5'>Arm</b>推动生成式<b class='flag-5'>AI</b>落地边缘!<b class='flag-5'>全新</b>Ethos-U85 <b class='flag-5'>AI</b>加速器支持Transformer <b class='flag-5'>架构</b>,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>四倍

    X-Silicon发布RISC-V新架构 实现CPU/GPU一体化

    X-Silicon 的芯片与其他架构不同,其设计将 CPUGPU 的功能整合到单核架构中。这与英特尔和 AMD 的典型设计不同,前者有独立的
    发表于 04-08 11:34 523次阅读
    X-Silicon<b class='flag-5'>发布</b>RISC-V新<b class='flag-5'>架构</b> 实现<b class='flag-5'>CPU</b>/<b class='flag-5'>GPU</b>一体化

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA 软件实现了跨  Blackwell GPU、新交换机和 BlueField-3 SuperNIC 的分布式计算,大幅提升AI、数据处理、高性能计算和云工作负载的
    发表于 03-19 10:05 306次阅读
    NVIDIA <b class='flag-5'>发布</b><b class='flag-5'>全新</b>交换机,<b class='flag-5'>全面</b>优化万亿参数级 <b class='flag-5'>GPU</b> 计算和 <b class='flag-5'>AI</b> 基础设施

    Intel酷睿Ultra CPU IPC性能实测

    Intel全新的酷睿Ultra号称公司有史以来最具革命性的产品,拥有全新制造工艺、CPU/GPU架构、分离式模块化
    的头像 发表于 01-04 09:49 1413次阅读
    Intel酷睿Ultra <b class='flag-5'>CPU</b> IPC<b class='flag-5'>性能</b>实测