0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm Neoverse V1–性能分析和遥测规范的自顶向下方法

jf_9aVl32Dp 来源:Arm软件开发者 2023-03-02 13:48 次阅读

Arm Neoverse V1 性能分析方法白皮书(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf)现在可以下载了,它可以帮助您为基于V1的产品系统优化应用程序代码

白皮书是对上一篇“Arm Neoverse N1:性能分析方法”(https://community.arm.com/arm-community-blogs/b/tools-software-ides-blog/posts/arm-neoverse-n1-performance-analysis-methodology)的更新,涵盖了从N1到V1内核的新功能和更新。此资源可用于了解和优化V1平台上应用程序的性能。

为了充分利用您花费的分析和优化时间,选择正确的PMU事件并遵循具有用户友好软件度量的结构化方法是非常重要的。在白皮书中,我们介绍了Neoverse V1的Arm自顶向下分析方法。

在本博客中,我们概述了从N1到V1内核的更新,并概述了本白皮书的内容。我们还引用了其他有用的资源,以充分利用Neoverse V1平台。

ArmNeoverse V1支持自上而下的1级指标。

Arm Neoverse V1平台是第一个Arm核心,为自上而下的方法学1级指标支持全套事件和指标。这些指标对于性能分析和优化是一个巨大的增值。

这些指标提供了SLOT级别处理器流水线利用率的详细细分,从而能够评估处理器效率和识别瓶颈。该功能是Arm Neoverse V1平台性能分析功能的一个主要增强,此外还有其他可用于进一步分析的微架构探索指标。

Arm Neoverse V1遥测规范:性能分析的事件和指标。

Arm Neoverse V1遥测规范,包括软件产品特定事件描述和衍生分析指标,可在Arm Neovere V1性能分析方法白皮书附录B和C中找到。

Arm遥测解决方案库

白皮书中引用的机器可读JSON文件中提供的遥测数据和压力工作负载套件现在可以在GitLab遥测解决方案库(https://gitlab.arm.com/telemetry-solution/telemetry-solution)中找到。

Neoverse V1 PMU事件和指标备忘单

在这个过程中,熟悉Arm Neoverse微体系结构,包括其复杂的管道和多级内存层次结构,可能会有所帮助。由于Neoverse内核提供了100多个硬件计数器可供选择,因此确定重点关注的事件的优先级非常重要。为了帮助完成这项任务,我们创建了列出事件及其相应派生度量的备忘单。

5d7bda8a-b06d-11ed-bfe3-dac502259ad0.jpg

表1。Neoverse V1核心活动备忘单

主要参考文献

以下两份文件提供了对Neoverse V1进行性能分析所需的所有信息,是我们推荐的参考文件:

1) Arm Neoverse V1性能分析方法白皮书(https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf):本白皮书介绍了一种性能分析方法,并介绍了如何在Arm Neovere V1平台上进行工作负载表征。这是对上一篇Neoverse N1白皮书的更新,该白皮书介绍了性能分析方法,并展示了如何在Arm Neoverse N1平台上进行工作负载表征。如果您是Arm平台和性能分析工具(如Linuxperf)的新手,我们建议您先阅读本白皮书。

2) Arm Neoverse V1 PMU指南(直接下载):本文档全面概述了所有硬件PMU事件,包括在性能分析中有效使用事件所需的微架构和架构细节。

Arm Neoverse V1核心

Arm Neoverse V1是一个核心,旨在为苛刻的云、HPC和AI/ML辅助工作负载提供最大的单线程性能。Neoverse V1是第一个包含可扩展向量扩展(SVE)的Neoverse处理器,可实现最大向量性能、HPC代码重用和使用寿命。Neoverse V1支持Bfloat16和Int8 MatMul指令。与Neoverse N1相比,这些指令可以为TensorFlow、PyTorch、OneDNN等机器学习框架提供高达3倍的性能。Neoverse V1 CPU目前可用于AWS EC2实例,由AWS Graviton3和AWS Graviton 3E处理器提供支持。

结论

我们自上而下的方法分析和遥测规范现在可用于Neoverse V1平台。我们将很快开始将这些信息上传到Linux perf工具。V系列内核,如V1,旨在在Neoverse系列CPU IP中提供最大的单线程性能。Neoverse V1性能分析方法白皮书和V1 PMU指南可以帮助开发人员从V1架构中获得最大性能。我们鼓励所有使用基于V1的平台(包括AWS Graviton3和Graviton3E)的开发人员学习和使用它。

白皮书下载地址:https://armkeil.blob.core.windows.net/developer/Files/pdf/white-paper/neoverse-v1-core-performance-analysis.pdf

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19125

    浏览量

    228881
  • ARM
    ARM
    +关注

    关注

    134

    文章

    9030

    浏览量

    366570
  • 应用程序
    +关注

    关注

    37

    文章

    3238

    浏览量

    57556

原文标题:Arm Neoverse V1–性能分析和遥测规范的自顶向下方法

文章出处:【微信号:Arm软件开发者,微信公众号:Arm软件开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    深度解析Neoverse V1Arm的重要意义

    2018年10月,Arm首次宣布推出面向云到边缘基础设施产品Neoverse及其初步路线图,并承诺平台效能30%的年增长率指标将持续到2022年及以后。 根据Neoverse平台PPA设计原则,N
    的头像 发表于 05-19 17:49 5279次阅读
    深度解析<b class='flag-5'>Neoverse</b> <b class='flag-5'>V1</b>对<b class='flag-5'>Arm</b>的重要意义

    Arm Neoverse家族新增V1和N2两大平台,突破高性能计算瓶颈

    带来 50%和 40%的性能提升。此外,Arm也同时发布了CMN-700,作为构建基于Neoverse V1和 N2 平台高性能SoC的关键
    的头像 发表于 04-30 16:20 9103次阅读

    基于向下技术的工程机械Digital Prototyping设计方法及应用

    【作者】:刘雪冬【来源】:《华南理工大学》2009年【摘要】:向下的设计方法及装配建模技术是在消费品行业应用比较成熟的一种设计方法和理论
    发表于 04-24 09:20

    如何实现扩频通信调制器向下的设计?

    如何实现扩频通信调制器向下的设计?如何实现扩频通信调制器的仿真测试?
    发表于 04-29 06:46

    Arm Neoverse V1的AWS Graviton3在深度学习推理工作负载方面的作用

    ) 与 AWS Graviton2 (c6g) 的性能特点AWS Graviton3 (c7g) 引入了 Arm Neoverse V1 CPU,与 AWS Graviton2 (c6
    发表于 08-31 15:03

    ARM Neoverse N1 Core性能分析方法

    使用Neoverse N1 CPU上的性能监测单元(PMU)功能来确定和消除性能瓶颈的工作负载表征方法。目标受众是从事软件优化、调优和开发的
    发表于 08-09 06:01

    Arm Neoverse V1 PMU指南

    ®体系结构参考手册。有关Neoverse V1的更多详细描述,请请参阅Arm®NeoverseV1技术参考手册。 本文档不讨论使用软件开
    发表于 08-09 07:30

    Arm Neoverse™ N1 PMU指南

    ARMv8-A。 有关Neoverse N1的更多详细说明,请参阅ARM®Neoverse™N1技术参考手册。 本文档不讨论使用软件开发工具
    发表于 08-12 07:10

    ARM Neoverse™N1核心技术参考手册

    Neoverse™N1内核是一款高性能、低功耗的ARM产品,采用ARM®V8-A架构。
    发表于 08-29 08:05

    ARM NeoverseV1参考设计软件开发人员指南

    支持两种RD-V1配置: ·RD-V1 FVP型号配置-M,这是一款单芯片系统,具有16个ARM®NeoverseV1内核。 ·RD-
    发表于 08-29 06:59

    通过模块之间的调用实现向下的设计

    通过模块之间的调用实现向下的设计目的:学习状态机的嵌套使用实现层次化、结构化设计。
    发表于 02-11 05:53 2438次阅读
    通过模块之间的调用实现<b class='flag-5'>自</b><b class='flag-5'>顶</b><b class='flag-5'>向下</b>的设计

    互联网巨头纷纷启用Arm CPU架构,Arm最新Neoverse V1和N2平台加速云服务器芯片

    V1平台。 NeoverseN2 和V1,较N1性能分别提升40%和50% Neoverse V1
    发表于 09-30 14:46 1174次阅读

    计算机网络:向下

    本文档包含Jim Kurose和Keith Ross编写的《计算机网络:向下方法(第7版)》复习题和问题的参考答案。这些答案只对指导老师有效。请不要复制或者分发给其他人(即使是其他指导老师)。请
    发表于 03-13 14:23 0次下载

    eda向下的设计方法 eda自顶向下设计优点

    EDA(Electronic Design Automation,电子设计自动化)向下的设计方法是一种常见的电子电路设计方法。该
    发表于 04-10 16:49 3721次阅读

    ArmArm Neoverse计算子系统(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    3和Neoverse CSS N3代表了Arm计算子系统产品组合的最新进展。 Neoverse CSS V3是高性能
    的头像 发表于 04-24 17:53 963次阅读
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>计算子系统(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3