SVE架构特性和指令基本用法介绍-电子发烧友网

SVE（Scalable Vector Extension）是arm AArch64架构下的下一代SIMD指令集，旨在加速高性能计算，SVE引入了很多新的架构特点，比如

• 可变矢量长度

• 每通道预测

• 聚集加载和分散存储

• 横向操作

本文将对SVE做个基本介绍。

1. SIMD指令发展史 intel vs arm

从上图我们可以看出，SIMD指令总体趋势是向着越来越长的方向发展的，到了arm SVE，最长可以支持2048位的矢量操作。

2. 背景

Armv7的高级SIMD （即arm NEON 或“MPE” 多媒体处理引擎）指令集自2005年发布，已经面世十几年了。Armv7 NEON的主要特性如下：

• 支持8/16/32位整数操作，支持非IEEE兼容单精度浮点操作，支持指令条件执行

• 32个64位矢量寄存器，也可视为16个128位矢量寄存器

• 旨在CPU端加速多媒体处理任务

在升级到armv8架构时，AArch64 NEON指令集做出了许多改进，比如：

• 支持IEEE兼容单精度和双精度浮点操作和64位整数矢量操作

• 32个128位矢量寄存器

• 这些改进使NEON指令集更适用于通用计算，而不仅仅是多媒体计算

但是到了现在，armv8的新市场需要更彻底的SIMD指令改进。我们需要能够并行处理非常规数据和复杂数据结构，也需要更长的矢量，SVE因此而生，SVE旨在加速高性能计算。

3. SVE特性

SVE是armv8 AArch64架构的下一代SIMD指令集，它不是NEON的替代，而是聚焦于高性能计算。主要特性如下：

• 可变矢量长度

• 128位的整数倍。最高可支持2048位

• 不同的实现可以适应不同的应用场景，不用更改指令集

• 每通道预测

• 支持复杂嵌套循环和if/then/else条件跳转，没有循环尾数。

• 聚集加载和分散存储支持复杂数据结构，如步长数据存取、数组索引，链表等。

• 横向操作

• 支持基本的reduction操作，降低循环依赖性

4. SVE寄存器

SVE寄存器有两种：矢量寄存器和预测寄存器。

SVE共有32个可变长矢量寄存器Z0-Z31（128位的整数倍，最高可达2048位），其中Z0-Z31的低128位［127:0］，与AArch64 SIMD&FP寄存器V0-V31共享硬件资源。假设SVE的矢量长度为256，其矢量寄存器视图如下。SVE支持8/16/32/64位整数操作和单精度/双精度浮点操作。

SVE预测寄存器用于控制每通道操作，有16个可变长预测寄存器P0-P15。每一个预测寄存器的位对应矢量寄存器的字节。假设SVE的矢量长度为256，预测寄存器在管理32位和64位操作时，其视图如下。在控制32位数据操作时，如果Pg寄存器的最低为1，则该通道操作为激活状态，该通道操作结果被正常存储到目的寄存器；如果Pg寄存器的最低为0，则该通道操作为未激活状态，该通道操作结果不会被存储到目的寄存器，目的寄存器的该通道数据有两种可能：

• 指令指定为Pg/z - 清零模式，该通道数据被清零。

• 指令指定为Pg/m – 合并模式，该通道数据保持原值

5. SVE指令实例

下面我们通过一些实例来介绍常用SVE指令的用法。

a. 矢量加法

大家也许都熟悉NEON的指令格式（如下），NEON指令通过对指令助记符添加“f”前缀来区分整数操作和浮点操作，如“add”和“fadd”；另外通过寄存器后缀“.2s”、“.4s”、“.2d”表示操作两个32位、四个32位数据、两个64位数据。

• add v0.4s， v0.4s， v1.4s

• fadd v0.2s， v0.2s， v1.2s

• fadd v0.2d， v0.2d， v1.2d

SVE指令也通过对指令助记符添加 “f” 前缀来区分整数操作和浮点操作。但是SVE是未知矢量长度编程，因此在指令中我们只需要指明操作数据类型就可以了。

• add z0.s， z0.s， z1.s

• fadd z0.s， z0.s， z1.s

• fadd z0.d， z0.d， z1.d

b. 矢量加载

对于加载指令，NEON指令通过助记符“ld1”、“ld2”表示加载一维数组、二维数组；通过寄存器后缀“.8h”、“.4s”表示加载八个16位、四个32位数据。

• ld1 {v0.8h}，［x1］

• ld1 {v0.4s}，［x1］

• ld2 {v0.4s， v1，4s}，［x1］

SVE加载指令添加指令助记符后缀 “h“、”w“表示读取存储元素宽度；寄存器后缀”.h“、”.s“表示元素在寄存器中的宽度。寄存器元素宽度必须大于等于读取存储宽度。对于加载指令，读取元素可以通过符号扩展或者零扩展填充到矢量寄存器；对于存储指令，每个矢量元素被截断后存储到内存中。

• ld1h {z0.h}， p0/z，［x1］

• ld1w {z0.s}， p0/z，［x1］

• ld2w {z0.s， z1.s}， p0/z，［x1］

6. 小结

本文简单介绍了SVE架构特性和指令基本用法，后续还会再写文章介绍如何在C程序中利用SVE。

原文标题：一文了解SIMD指令集SVE（可伸缩矢量扩展），加速高性能计算

文章出处：【微信公众号：安芯教育科技】欢迎添加关注！文章转载请注明出处。

责任编辑：haq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

指令集

指令集

+关注

关注
0

文章
222

浏览量
23366
SIMD

SIMD

+关注

关注
0

文章
33

浏览量
10274

原文标题：一文了解SIMD指令集SVE(可伸缩矢量扩展)，加速高性能计算

文章出处：【微信号：Ithingedu，微信公众号：安芯教育科技】欢迎添加关注！文章转载请注明出处。

Matter SVE认证经验分享

Spec Validation Event（SVE）活动都能更好地验证设备是否符合最新的Matter认证测试要求，这篇文章就是参加SVE活动的经验分享。

发表于 11-13 09:16 •168次阅读

数控车床m99指令的用法

我们将详细介绍M99指令的用法。　　一、M99指令的基本含义　　M99指令是数控车床编程中的一个辅助功能代码，其基本含义是“程序结束并返回到

发表于 10-23 15:52 •351次阅读

指令集架构与微架构的区别

指令集架构（Instruction Set Architecture，ISA）与微架构（Microarchitecture）是计算机体系结构中的两个重要概念，它们在处理器的设计和实现中扮演着不同的角色。以下是对两者区别的详细阐述

发表于 10-05 15:10 •401次阅读

简述微处理器的指令集架构

微处理器的指令集架构（Instruction Set Architecture，ISA）是计算机体系结构中的核心组成部分，它定义了计算机能够执行的指令集合、数据类型、寄存器、内存访问方式等，是连接

发表于 10-05 14:59 •300次阅读

微处理器的指令集架构介绍

微处理器的指令集架构（Instruction Set Architecture，ISA）是计算机体系结构中至关重要的部分，它定义了微处理器能够执行的操作和指令的集合，以及这些指令如何被

发表于 08-22 10:53 •929次阅读

三菱PLC传送指令的用法

三菱PLC（可编程逻辑控制器）在工业自动化领域中扮演着至关重要的角色。其中，传送指令（MOV）作为PLC编程中的基础指令之一，其正确使用对于实现数据的准确、高效传输至关重要。本文将详细讲解三菱PLC传送指令（MOV）的

发表于 06-18 09:41 •3764次阅读

PLC中SFTL指令的用法

Left Logical）指令是PLC指令集中的一种重要指令，用于处理数据的左移操作。本文将详细阐述PLC指令SFTL的用法，包括其定义、

发表于 06-15 17:48 •2962次阅读

数控车床m99指令的用法

详细介绍M99指令的用法。一、M99指令的基本含义 M99指令是数控车床编程中的一个辅助功能代码，其基本含义是“程序结束并返回到程序开始处

发表于 06-14 15:52 •4419次阅读

嵌入式系统的概念与范围开发指令集架构要怎么选才合适？

想要搭建一套嵌入式系统，首先得确认想要采用的指令集架构（Instruction Set Architectures, ISA），各家的指令集架构各有其优缺点与拥护者，本文将为您大致

发表于 03-28 09:35 •729次阅读

嵌入式系统的概念与范围开发 <b class='flag-5'>指令</b>集<b class='flag-5'>架构</b>要怎么选才合适？

loop指令的用法及功能

循环指令是计算机编程中的一种基本控制结构，用于重复执行特定的代码块，以实现重复操作、批处理和自动化等功能。循环指令在编程中具有广泛的应用场景，并且使用循环可以大大提高代码效率和减少冗余。循环指令

发表于 02-14 16:12 •2047次阅读

【RISC-V开放架构设计之道|阅读体验】理解指令设计思想的好指导

感谢电子发烧友论坛和电子工业出版社提供的试读机会。在上一篇文章中我们简单地介绍了《RISC-V开放架构设计之道》这本书的情况，今天来谈谈它在指令设计方面的特色。我以前在课堂讲授过x86和ARM

发表于 01-28 16:58

【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

（Andrew Waterman），SiFive 的总工程师和联合创始人。SiFive 由RISC-V 架构的发明者们创办，旨在提供基于RISC-V 的低成本定制芯片。和其他介绍指令集架构

发表于 01-23 20:08

三菱FX系列PLC置位与复位指令的使用教程

有关三菱PLC置位与复位指令的功能说明，以FX2N为例，介绍其基本逻辑指令和步进指令及用法，置位与复位指

发表于 12-26 10:19 •4346次阅读

现代处理器的主要指令集架构

现代处理器的主要指令集架构（ISA）包括：x86指令集架构、RISC指令集架构。

发表于 12-11 09:55 •4330次阅读

plsy指令具体用法

、WAV等。下面将详细介绍plsy的用法。安装：在使用plsy之前，首先需要在Unix系统中安装。你可以通过在终端上运行以下命令来安装plsy： sudo apt-get install plsy

发表于 12-08 14:10 •2184次阅读

搜索历史

SVE架构特性和指令基本用法介绍

评论

Matter SVE认证经验分享

数控车床m99指令的用法

指令集架构与微架构的区别

简述微处理器的指令集架构

微处理器的指令集架构介绍

三菱PLC传送指令的用法

PLC中SFTL指令的用法

数控车床m99指令的用法

嵌入式系统的概念与范围开发指令集架构要怎么选才合适？

loop指令的用法及功能

【RISC-V开放架构设计之道|阅读体验】理解指令设计思想的好指导

【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

三菱FX系列PLC置位与复位指令的使用教程

现代处理器的主要指令集架构

plsy指令具体用法