大模型的位置编码和外推性问题一样吗

作者 | 王嘉宁

整理 | NewBeeNLP

现如今很多大模型都开始支持超过4096长度的推理，例如GPT-4支持超过30k，ChatGLM2-6B也支持最长为32K的文本。但是由于显存资源的限制，这些大模型在真正在训练过程中不一定要训练这么长的文本，通常在预训练时只会设计到4k左右。

因此 如何确保在模型推理阶段可以支持远远超过预训练时的长度 ，是目前大模型的核心问题之一，我们将这一问题归为 大模型的外推性 。

大模型的外推性目前主要在这两个方面考虑，也是提升最有效的两个角度：

寻找或设计合适的位置编码；

设计局部注意力机制。

本文从这两方面进行深度探讨大模型的位置编码和外推性问题。

一、位置编码基础介绍

对于一个token ，其表征向量记作，对于一个句子则表示为。那么可以通过一个映射函数将这个句子中的token表征为：

其中和表示第和第个token。

1.1 绝对位置编码

在Transformer中，采用正余弦函数来表示绝对位置，公式如下：

这种编码方式又叫做 Sinusoidal编码 。直觉上看，第个位置的表征向量维度是，这个向量的奇数位置元素使用余弦值，偶数位置元素使用正弦值。
可视化图如下所示：

相邻的位置编码向量很相似，较远的位置编码向量差异很大，说明基于正余弦函数的绝对位置可以表征位置的相关性；

不需要显式地学习位置，提高效率。

最后映射函数可以定义如下所示。即输入表征为token的表征和其对应的绝对位置表征。

该表征通常是直接将位置表征与Word表征直接相加。

1.2 相对位置编码

（1）显式的相对位置

对于第和第个位置的token，其相对位置可以表示为，即两个token之间的相对距离，且由最大最小值做约束（相对位置不能超过最大值或小于最小值）。

因此，相比于绝对位置，相对位置只需要有表征向量即可，即在计算两个token之间的attention值时，只需要在attention计算过程中注入这两个位置对应的相对位置对应的相对位置表征向量即可：

这样一来，只需要有限个位置编码，就可以表达出任意长度的相对位置（因为进行了截断），不管是选择可训练式的还是三角函数式的，都可以达到处理任意长度文本的需求。

该表征通常是直接将位置表征与Word表征直接相加。
参考论文：《Self-Attention with Relative Position Representations》

（2）Transformer-XL（XLNet）

将第和第个位置的QK计算进行了分解。引入了一些可学习的参数：

其中表示待学习的第个token的相对位置向量，表示待学习的第个token的相对位置向量。通过分解让相对位置注入在attention的计算过程中。

该表征通常是在Attention计算过程中融入绝对位置。

（3）Transformer-XL的改进

第二和第四项使用相对位置表征来替换绝对位置表征。同时加入新的可训练参数和。

该表征方法在T5模型中被首次使用，参考论文：《Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer》

该表征通常是在Attention计算过程中融入相对位置。

（4）可训练偏置项

Transformer-XL中的位置表征是将QK分解为4项，而后面3个够项都有跟位置有关的参数，可以直接将后面的3项之和抽象为一个偏置：

进一步改造还可以得到：

以及：

这三种方法均是对Transformer-XL的表征形式进行改进。

二、RoPE旋转位置编码

RoPE（Rotary Position Embedding）的出发点就是“ 通过绝对位置编码的方式实现相对位置编码 ”，或者可以说是实现 相对位置编码和绝对位置编码的结合 。

这样做既有理论上的优雅之处，也有实践上的实用之处，比如它可以拓展到线性Attention中就是主要因为这一点。

2.1 复数的引入

假设和是对应位置的二维行向量（即每个位置都有两个向量来表征位置），因此这个二维向量可以用复数来代替（包括实部和虚部），因此他们的内积可以作为其对应的Attention值。

内积的计算可以由两个复数实现：，其中表示共轭复数，表示取复数中的实部。

两个二维向量的内积，等于把它们当复数看时，一个复数与另一个复数的共轭的乘积的实部。

因此当分别对和融入绝对位置时，即得到：

RoPE求解过程推导了如何确定获得每个位置编码是。

可以发现，当乘以绝对位置和时，等价于复数运算中乘以，即相当于在复数空间中是相对位置，这样就巧妙地通过复数运算的形式将绝对位置转换为相对位置。

复数乘法的几何意义是向量的旋转，假设表示向量在位置的位置编码，则有：

其中

等价于

后面两项的乘积本质就是向量（或）的两个二维行向量。

当向量维度为时（为偶数），则可以扩展为：

每两个为一组二维向量，一共有个组合，可以直接拼接作为维度的旋转位置编码。
二维扩展到多维的解读：Transformer升级之路：4、二维位置的旋转式位置编码 - 科学空间|Scientific SpacesTransformer升级之路：6、旋转位置编码的完备性分析 - 科学空间|Scientific Spaces

2.2 RoPE的实现

当输入一个句子“Enhanced Transformer with Rotary Position Embedding”时，首先获得其Query和Key向量q、 k，其对应的维度均为d，然后对于向量中相邻两个元素为一组，可以得到 d/2组（图中左下部分相同颜色的两个元素作为一组，对于每一组，一个文本则可以得到两个行向量）；

获得每个词的绝对位置编号（该句子由6个词，位置编号分别为1，2，3，4，5，6），假设取“Enhanced”单词为例，其第一组元素为θ1，位置为 m=1，那么通过旋转位置编码可以的到新的元素值。

所有单词的d/2个组合都按照这种形式进行“旋转”，即可得到新的位置编码（右下角）

RoPE一种线性的实现如下所示：

RoPE的性质

（1）远程衰减

从图中我们可以可以看到随着相对距离的变大，内积结果有衰减趋势的出现。因此，选择，确实能带来一定的远程衰减性。当然，能带来远程衰减性的不止这个选择，几乎任意的光滑单调函数都可以。如果以为初始化，将视为可训练参数，然后训练一段时间后发现并没有显著更新，因此干脆就直接固定了。

（2）优势

用一个旋转矩阵rotation matrix来对绝对位置进行编码，于此同时，meanwhile；

在自注意力机制中导入显式的位置依赖。

自由的序列长度；

随着相对位置的增大，而逐步延缓退化（=衰减）的inter-token dependency；

用相对位置编码来“武装”线性自注意力。

具体来说，RoPE 使用 旋转矩阵对绝对位置进行编码 ，同时将 显式的相对位置依赖性纳入自注意公式中 。

【核心的两个点，一个是“旋转矩阵”，一个是“显式的相对位置依赖”】。

三、长文本外推性

外推性 的含义是在长文本表征过程中，如何在训练阶段只需要学习有限的长度，即可以在推理阶段能够延伸长度至若干倍且依然保持不错的性能和效果。

长度外推性是一个训练和预测的长度不一致的问题，主要体现在两个方面：

预测的时候用到了没训练过的位置编码（不论是绝对位置还是相对位置）；

预测的时候注意力机制所处理的token数量远超训练时的数量。

解决长文本外推性问题的一个简单有效的方法是Attention Mask，如图所示：

通过类似滑动窗口的结构，约束一个每个token只能对局部区域的token计算Attention值，因此对于相对位置大小不会超过窗口大小，解决了第一个问题；

Attention只会在窗口内计算，避免了对大量的token的Attention进行加权平均导致最终权重过度“平滑”现象。

在实现过程中，本质上是在计算完之后减去一个矩阵，即，其中的形状如下图所示：

可以看出，蓝色区域（即滑动窗口内的局部区域）为0，说明保持原始的Attention归一化前的值；其他区域则为一个INT内最大的整数，说明Attention值是一个非常小的数（在softmax归一化后几乎为0）。

3.1 ALIBI

论文：《Train Short, Test Long: Attention with Linear Biases Enables Input Length Extrapolation》

其与上面的思想一样，只是改进了上面的 M矩阵为，即Attention在归一化前的计算为：，其中为超参数，Transformer的多头注意力中的每个头的值可设置不同。矩阵的形状如下所示：

相比于原始的方法，相对距离越长，值就越大，越远的位置Attention值被归一化后就约小，相对于“滑动窗口”采用的方法是hard（在窗口内就计算attention，不在窗口内不计算），AIBLI是比较soft的（离得近attention就会比较大，离得远就比较小）。

3.2 KERPLE

论文：《KERPLE: Kernelized Relative Positional Embedding for Length Extrapolation》

其对ALIBI进行了一些改进，引入了两个可学习的参数和来“动态”学习局部区域。如下图所示，左侧为原始的，通过引入参数来动态减去AIBLI中的矩阵：

定义了两种模式，分别是power和logarithmic，分别对应没有对数和有对数的形式：

在logarithmic模式中，控制了整体的量，相当于ALIBI中的， c是一个常数。苏神版简化写作：

3.3 Sandwich

论文：《Receptive Field Alignment Enables Transformer Length Extrapolation》

Sandwich与KEPRLE是同一个作者提出的，其对KEPRLE进行了少量改进，即对应的公式改写为：，其中和可以使用Sinusoidal编码表示，即：

由于Sinusoidal编码在单调性上等价于，都是线性递增形式，因此Sandwich只是改头换面了。

3.4 XPOS

论文：《A Length-Extrapolatable Transformer》
参考解读：Transformer升级之路：7、长度外推性与局部注意力

其在RoPE的基础上引入了局部注意力。RoPE的本质是：

其中：

在第2大节中已经介绍了RoPE是通过使用复数来实现绝对位置表示相对位置的。XPOS通过引入一个新的标量，即有：

由于RoPE相对位置是，而不是，因此XPOS约束在了单向Transformer，从而避免了负数出现。

XPOS又设计了一个局部感知的注意力机制Blockwise Causal Attention，进一步提升了局部注意力的性能，提升了长文本的外推性。

四、外推性的其他探索

（1）混合注意力Mask

在解决长文本位置表征时，典型的代表有Transformer-XL、BigBird、LongFormer，他们除了局部注意力机制以外，还引入了随机位置的性质：

如上图，第2张图为局部注意力（滑动窗口），第3章图为有限的全局感知（例如只限制前两个token可以看见所有的token）。而第一张图则是随机mask，以缓解过度hard的局部注意力。三者注意力混合起来后得到第四张图，这也是普遍训练超长文本大模型时采用的方法。

（2）随机位置表征

论文：《Randomized Positional Encodings Boost Length Generalization of Transformers》

绝对位置表征时，会存在位置上的OOV问题，随机位置编码则是通过在训练过程中采用如下策略：

对应的代码也很简单：

def random_position_ids(N, L=2048):
    """从[0, L)中随机不重复挑N个整数，并从小到大排列
    """
    return np.sort(np.random.permutation(L)[:N])

苏神对随机位置编码的新探索：

对应的代码为：

def random_position_ids(N):
    """先随机采样n，然后从[0, n]均匀取N个点
    """
    n = sample_from_xxx()
    return np.linspace(0, 1, N) * n

（3） Attention Scale

原始的Attention计算公式为：

只需要简单的改成下面即可：

其中是训练时的最大长度，是预测时的位置，通常来说。直觉来看，就是直接在计算时，根据其相对位置来控制Attention的值。当和距离很远时，的值会很大，会使得整体Attention归一化后会比较平缓，有助于解决外推性问题。

（4）全局依赖

滑动窗口的方法如果在一层Transformer Layer里看，本质上类似长度为的N-Gram模型，即如下图所示：

如果Transformer又层，那么，从输入层开始，长度为的窗口内的信息，可以在经过层之后传给一个更广的区域，区域长度为，如下图所示：

苏神给出的一种新的想法，就是假设我有层Transformer，则可以在前层利用这种扩张特性，得到最终长度的区域后，在最后一层采用上面提到的 logn Attention Scale方法，讲前层扩张的信息快速在最后一层与所有token进行交互。引入苏神的原文为：

这种局部注意力+Attention Scale的结合也是一种很巧妙的idea。实验也发现这种策略的外推性很惊艳。

编辑：黄飞

阅读全文

人工智能(229987) 人工智能(229987)
GPT(14803) GPT(14803)
位置编码器(5494) 位置编码器(5494)
大模型(810) 大模型(810)

深度解析大语言模型的位置编码及其外推性

我们先来回顾一下绝对位置编码的问题。绝对位置编码通过可学习的 Positional Embedding 来编码位置信息，这种方案直接对不同的位置随机初始化一个 postion embedding，然后与 word embedding 相加后输入模型。

2024-01-16 11:37:12

302

***与Altium Designer一样吗

2015-09-02 19:36:06

一样的c文件但keil的输出文件不一样

是一模一样的啊，还有都能编译通过和下载，不知道这是什么原因，还有就是我对比发现这两个工程的输出文件的有差别，是不是keil没有设置好导致输出文件不一样，进而导致程序运行结果不一样啊，求高手指点一下，先拜谢了！！！！！

2019-03-07 08:26:26

外推接单yilong

yilong接单，QQ：1728369763。承接：外推（按效果计费）、营销神器注册群发(顶帖)规则定制、易语言软件群发定制、百度百科、百度知道（提问加采纳）、删负面、***（永久版）、新闻源（各大

2015-01-30 16:05:32

编码器的型号？

谁对编码器有了解，在示波器上拆下两个旋钮编码器，外观是一模一样的，就是有一种有循环档位一个没有，再拆开以后发现里面不太一样，想在网上买这两种但不知道该怎么选型号

2021-11-18 15:21:43

DSP能像ARM一样跑系统吗？

本帖最后由 mr.pengyongche 于 2013-4-30 03:25 编辑平时听的太多ARM跑系统了，不知道在DSp上能跑系统不？？刚开始学DSP，感觉上DSP一样很强大啊，怎么没听过在DSP上跑系统的呢？？好希望DSP也能像ARM一样跑系统

2011-03-23 13:52:54

FCC认证中的蓝牙测试和WIFI测试是一样的吗？

FCC认证测试大同小异，FCC认证中的蓝牙测试和WIFI测试标准是一样的，只是WIFI设备与蓝牙相比，一般功率要大一些，蓝牙的功率通常只有-6~4db，而WIFI功率要比这大许多。但是这两种设备申请

2015-10-28 14:59:08

FOC算法有位置传感器控制永磁同步电机offset的补偿角度如果设置和实际不一样有什么后果？

使用FOC算法有位置传感器控制永磁同步电机时，程序中有一个参数是补偿角度。我想问的是这个角度如果设置的和实际补偿角度不一样会有什么后果？会影响电机转动吗？

2018-09-21 14:14:40

PMSM增量编码器初始位置是通过什么方式实现的

我想问一下，TI的PMSM的例程库里，增量编码器永磁同步电机，初始位置是通过什么方式实现的。在例程的那个位置，谢谢

2018-10-30 15:58:42

RM6510T外推亚成微COOL MOS规格书

RM6510T外推亚成微COOL MOS规格书*附件：RM6510T-(OTP)外置MOS副边反馈.pdf

2022-07-20 21:14:25

RT_Thread的算法和uCosIII的调度算法一样吗？

我看官方手册说设置时configMAX_PRIORITIES不能超过32，有没有谁试过改成255的或者更大的，小弟改了几下都不行！还有能问问FreeRTOS的任务调度算法和RT_Thread的不一样，RT_Thread的算法和uCosIII的调度算法一样呢？

2020-06-18 09:00:40

STM32 Arduino是如何读取编码器和旋转位置方向的

旋转编码器的原理是什么？如何去编写STM32配置Arduino的程序？STM32 Arduino是如何读取编码器和旋转位置方向的？

2021-11-15 08:01:24

controlsuite例程函数不太一样

HVPM_Sensored还有HVBLDC_Sensored历程中，在DeviceInit();中，有如下函数这与其他通用例程的 InitPieVectTable();函数不太一样，如请问是什么意思，有区别吗，互换可以吗

2018-10-25 15:33:14

dht91和sht71除了样式不同外，还有什么不一样的地方呢

2015-06-10 07:26:46

ffc和fpc接口是一样的吗？

这两种接口是一样的吗，是不是通用的

2023-09-27 06:38:22

labview采集编码器线性位置信息

labview现在可以采集编码器的位置信息，但是由于是增量的编码器，每次程序暂停后再运行，编码器的位置信息会自动清零，而不是在上一次数据的基础上增大或者减小请教该如何解决。

2019-10-23 09:54:56

mega328 PWM两个管脚的参数是一样的，但是波形却不一样是为什么?

mega328 PWM两个管脚的参数是一样的，但是波形却不一样

2023-11-03 06:01:29

zstack调试的时候，断点乱飞，打断点的位置和显示的不一样，然后调试也和运行的行不一致，这是什么问题呢？

2018-05-15 01:21:17

【触觉智能 Purple Pi开发板试用】视频采集编码与推流开发

**【触觉智能 Purple Pi开发板试用】视频的采集编码与推流开发 **大信在前面的工作基础上，本次将进一步深入测试一下它的音视频支持功能。本次开发测试主要研究Purple Pi开发板对摄像头

2022-10-11 01:40:19

不同的走线层，一样的STUB

就是一样的。那看起来这种case下走靠上还是靠下层真没有影响？很多时候当你有一个认为正确的结论时，往往需要经得住很多人的敲打。例如有同事就提出，要不给他们赋了收发模型看看眼图是不是也一样？好，这个主意

2019-10-22 15:20:26

为什么c语言中a和b的值不一样，c和d的值不一样？

];a = sizeof(table1);b = sizeof((u8)table1);c = sizeof(table2);d = sizeof((u32)table2);为什么a和b的值不一样啊？？？为什么c和d的值不一样啊？？？

2019-09-29 08:50:29

为什么我的泪滴不一样

我的泪滴怎么和网上的不一样？？

2019-03-13 15:23:22

二维图片控制，鼠标滚轮缩放图片，如何像 CAD 一样，，位置不变，

各位老师，大家好，二维图片控制，鼠标滚轮缩放图片，如何像 CAD一样，，位置不变，*附件：缩放.rar

2023-08-29 19:51:39

关于BP神经网络预测模型的确定！！

请问用matlab编程进行BP神经网络预测时，训练结果很多都是合适的，但如何确定最合适的？且如何用最合适的BP模型进行外推预测？

2014-02-08 14:23:06

关于FPGA 的最高时序和采样速率是一样吗？

本帖最后由 641734667 于 2016-1-22 11:05 编辑 FPGA 综合编译报告中的最高时序和其采样速率是一样吗？求大神能回答我一下吗？要是不一样，那最高时序是指的什么意思？

2016-01-22 11:04:12

发射频率315M载波频率38KHZ一样吗?

在遥控器中为什么有的发射频率为315M，在NEC编码的遥控器中载波频率是38KHZ，这两个概念一样吗？还有遥控器按编码方式分大约分几类，代表芯片有哪些呢？

2015-04-20 10:17:18

各类电机位置编码器及其接口的概述

电机位置编码器广泛用于伺服驱动器、机器人、机床、印刷机、纺织机和电梯等工业电机控制应用。用接口把这些编码器连接到您系统的其它部分会带来一些棘手的电磁兼容（EMC）问题。为帮您应对这些挑战，笔者将以

2018-09-05 16:07:42

同型号的电机同时启动怎么转速不一样？

变速箱已经换了2两个还是一样。电源是通过一个接触器传送过去的。现在还是一个动作快一个动作慢，电流应该一样，电压也稳定，而且电动机的绕线电阻也一样。

2023-12-21 06:41:15

同样的电机，电压等级、功率等都一样，为什么电机的励磁电压不一样呢？

请教了好多人，都没有个真正的答案。同样的电机，电压等级、功率等都一样，为什么电机的励磁电压不一样呢？？

2023-11-17 08:28:35

怎么样才能让红线跟蓝线一样稳定？

求解决啊，红线怎么想蓝线一样稳定

2019-08-07 00:12:10

怎么知道Proteus中自带的元件有无仿真模型？

今天添加了几组元件（好多个一样的，又是编号，又是调整位置，花了好多时间），仿真时Proteus告知“No model specified for ***”，经查是Proteus中没有该元件的仿真模型。郁闷啊。。请问怎么提前知道原价是否有仿真模型？？谢谢

2013-09-11 15:20:14

我看MS51有三种Flash大小的，除了Flash大小不同外，其他配置一样吗？

我看MS51有三种Flash大小的，除了Flash大小不同外，其他配置一样吗

2023-06-15 10:15:16

手机版论坛竟和PC版的一样

``今天偶然发现论坛有手机版的，马上上去看看。结果用手机输入那个网址，载入后，发现何PC版的论坛页面一样，真郁闷希望坛主和管理人员解决下不附实际的问题``

2011-06-29 16:57:12

数据类型不一样和接口怎么解决

要怎么解决接口和产生的数据类型不一样的问题，然后利用MYRIO的模拟输出通道接到示波器里面为什么没有波形啊，数据类型应该是不一样，要怎么解决这个问题呢？

2017-05-09 01:00:04

新一代视频编码器怎么样？

2021-06-02 06:39:01

新手请教：LabView是否有向MATLAB一样自带不同系统的模型？

RT：LabView是否有向MATLAB一样自带的不同系统的模型？学习

2016-02-20 15:26:34

求编码器仿真模型

在捣鼓温度控制器仿真，需要用到编码器，型号为EC11E.原理图都画好了，其他仿真模型也都有了，就是编码器仿真模型找不到，求救！！！！

2015-07-15 01:30:44

求解：示波器测所有管脚波形都一样。

今天用示波器测不同电压值的直流电源，所有管脚的波形和电压值都一样，看波形有点类似纹波的波形，大概是下图这样的为什么所有管脚都是这样呢？无论我测试+5V,+8V+18V都一样，而且峰峰值电压大小也没有区别。以前测过该电源的这些管脚，是很好的直流，波形不是这样的。求解答，是示波器设置的问题吗？

2015-01-08 12:02:39

海盗船推窄版Vengeance内存电压更低

版本。复仇者LP和标准版一样电压为1.5V，适合搭配第二代Intel Core智能处理器。其中白色版本电压为1.35V。具体规格参数如下：海盗船推窄版Vengeance内存电压更低，复仇者系列内存

2011-08-02 10:19:54

消息邮箱发送空消息和非空消息产生一样的效果

,OS_POST_OPT_BROADCAST);和 OSMboxPostOpt(SeMbox,(void *)1,OS_POST_OPT_BROADCAST);发送空消息和非空消息怎么产生一样的效果啊？书上不是说不能发送空消息吗，怎么效果跟非空是一样的？谢谢

2019-05-08 06:36:10

用matlab编程进行BP神经网络预测时如何确定最合适的，BP模型

请问用matlab编程进行BP神经网络预测时，训练结果很多都是合适的，但如何确定最合适的？且如何用最合适的BP模型进行外推预测？

2014-02-08 14:19:12

用udp发送数据，电脑本机上接受的数据和发送的数据一样，但是用wireshark 监控数据完全不一样？？

用udp发送数据，电脑本机上接受的数据和发送的数据一样，但是用wireshark 监控数据完全不一样？？怎么处理数据，让wireshark 监控数据和发送数据一样

2019-07-22 16:52:49

线损校准，为啥不一样

线损校准，为啥不一样，今天测试时发现，校准是，信号源频率不一样，线损差别很大，有1dB 多！！！

2016-06-05 13:58:19

请教下，在通信数据一样的情况下，主板还有可能是通过...

求助：A外呼板与主板是配套。主板接收外呼板发过来的信号，再判断是执行什么功能。B外呼板为完全仿A外呼板功能，现B外呼板与A外呼板发送给主板的数据与及主板回应给两种外呼板的数据是一样的，但是此时主板却

2013-05-18 10:15:37

请问一下运动控制卡中伺服电机的规划位置与编码器位置的区别是什么？

2021-10-12 11:24:30

请问F103zet6扩展512k的外内存怎么向使用内部的内存一样使用？

设置片内和片外内存空间的，如下图（2），但是IAR只能设置一个内存空间。所目前问题是不知道IAR要怎么设置才能达到使用内部外部内存时向使用内存一样的效果？比如说使用malloc申请内存。keil编译器

2018-11-12 08:50:56

请问ip与ipr一样吗？

原子大哥，你好！最近在学习开发板的时候，发现一个问题，上图是mdk4.0上面的nvic定义，下图是不完全手册上的定义，两种定义的数组大小区别很大，而且定义的名称也略有区别，这对中断的定义影响很大，mdk4.0的定义是对的吗？另外ip与ipr一样吗？初学者，请原子大哥不吝赐教。

2020-08-04 05:24:55

请问keil5代码一样但运行结果不一样是怎么回事？

在用keil5的时候，两个一模一样的代码执行的结果不一样。经过多次测试都是这样的现象。不知道是不是我的环境配置有问题还是其他的？

2019-06-13 04:35:19

调试RK1126发现RTSP推流的时候调用VENC编码

最近在调试RK1126 平台发现RTSP推流的时候调用 VENC编码会一直打印如下log 我想把他注释掉不让它打这个log搜了下发现这个代码是在mpp_final_encoder.cc里面

2022-10-08 16:31:44

起点外推软件哪家强？

起点外推软件团队，VIP形式包月，每日放出定时发布高权重网站软件。每月至少三十款外推软件。1,【每日每款软件都是不同的高权重网站】2,【每日下载软件后设置内容放VPS里即可发布】3,【自动打码，拨号

2016-03-05 14:54:05

输出怎么和输入一样

问：K64的MCU能不能配置一个输出脚让他输出的波形和另一个脚的输入波形一样？怎么设？？

2017-05-16 11:49:03

这个仿真例程设置的参数一样，为何会出现不一样的仿真结果？

2019-12-23 09:08:46

基于信息编码的装备器材编码体系及模型构建

针对装备器材信息编码的需求，论述了信息编码体系的设计方法。结合装备器材管理信息化实际，构建了装备器材信息编码体系和信息编码管理系统模型，为装备器材管理信息化建

2010-01-18 11:23:08

装备器材编码管理系统模型的构建

装备器材编码管理系统是对装备器材编码数据进行标准化处理的基础数据库系统。本文构建了装备器材编码管理系统的功能模型、结构体系和集成模型，为开发编码管理系统提供了

2010-01-22 13:56:54

光电编码器位置检测研究与应用

针对位置检测的需要，提出了一种光电编码器位置检测系统。首先阐述了光电编码器的工作原理，并对基于MSP430单片机位置检测系统的硬件和软件系统进行了详细的论述。结论证明，

2011-08-02 17:02:09

EnDat 2.2-位置编码器双向数字接口

EnDat 2.2-位置编码器双向数字接口。

2016-03-14 15:50:00

大模型时代后，游戏体验从此不一样

大模型

脑极体发布于 2023-09-01 20:01:28

5 v双位置编码器接口参考设计

该TI设计基于双标准实现适用于位置或旋转编码器的硬件接口解决方案。它既支持bis点对点配置又支持bis总线配置。构件块包括5 v的bis编码器电源（采用创新的智能e-Fuse技术）和可靠的全双工

2017-05-08 17:13:03

电机位置编码器接口设计

2017-11-17 01:53:52

2544

编码器原理和位置测量

除此之外，有些正交编码器还包含被称为零信号或者参考信号的第三个输出通道。这个通道每旋转一圈输出一个单脉冲。你可以使用这个单脉冲来精确计算某个参考位置。在绝大多数编码器中，这个信号称为Z轴或者索引。

2019-12-19 09:09:58

11851

如何将位置编码器主协议集成到Sitara™处理器应用

的另一个应用，即帮助把您选择的数字位置编码器主接口集成入Sitara处理器内。首先，让我们来看下包含位置编码器的系统层面方块图——见图1。诸如伺服驱动器等应用通常都配有集成了数字位置反馈编码器的电机

2021-11-10 09:38:57

494

如何将位置编码器主协议集成入Sitara™处理器应用

2022-11-02 08:16:19

如何将位置编码器主协议集成入Sitara处理器应用

首先，让我们来看下包含位置编码器的系统层面方块图——见图1。诸如伺服驱动器等应用通常都配有集成了数字位置反馈编码器的电机。位置编码作为传感器，能够精准测量电机轴的角度（以度为单位）或线性轴（以微米为单位）的距离。

2023-04-12 09:14:16

999

PyTorch教程11.6之自注意力和位置编码

电子发烧友网站提供《PyTorch教程11.6之自注意力和位置编码.pdf》资料免费下载

2023-06-05 15:05:22

基于transformer的编码器-解码器模型的工作原理

与基于 RNN 的编码器-解码器模型类似，基于 transformer 的编码器-解码器模型由一个编码器和一个解码器组成，且其编码器和解码器均由残差注意力模块 (residual attention blocks) 堆叠而成。

2023-06-11 14:17:34

1145

基于 Transformers 的编码器-解码器模型

基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果的结晶。本文简要介绍了神经编码器-解码器模型的历史，更多背景知识，建议读者阅读

2023-06-16 16:53:21

432

神经编码器-解码器模型的历史

2023-06-20 15:42:00

429

浅谈LLaMA 中的旋转式位置编码

对于位置编码，常规的做法是在计算 query, key 和 value 向量之前，会计算一个位置编码向量 pi 加到词嵌入 xi 上，位置编码向量 pi 同样也是 d 维向量，然后再乘以对应的变换矩阵 W{q,k,v}：

2023-07-10 10:12:16

1875

增量型编码器和绝对值编码器控制位置一样吗

增量型编码器和绝对值编码器是两种常见的位置控制装置，它们在控制位置方面有着不同的工作原理和特点。虽然它们都可以用于位置控制，但是在某些方面存在差异。首先，增量型编码器是通过检测位置变化的增量来确定

2023-08-18 14:43:50

477

简单了解ADI的位置编码器信号链解决方案

位置编码器（也称为电机编码器）可提供准确的位置和扭矩控制，支持未来工厂的先进运动控制应用。借助精密位置编码器，能够以更少的工序步骤和更短的时间加工复杂的部件，并且能耗更低，从而提高生产质量和产量，实现可持续性发展。

2023-11-13 16:29:01

295

编码器零点位置怎么看编码器零位怎样确定

一些编码器会在其旋转轴上标记一个特殊的标记点，例如一个凹槽或凸起。通过在编码器旋转到特定位置时对标记点进行检测，可以确定零位。

2024-01-18 14:49:40

222

编码器零点位置怎么看 | 编码器零位怎样确定

编码器零点位置怎么看要确定编码器的零点位置，可以通过以下几种方式进行观察： 1. 物理标记点：一些编码器在其旋转轴上具有专门的物理标记点，例如凹槽或凸起。通过观察轴上的标记点，可以确定零点位置

2024-02-18 18:28:19

737

脉冲编码器位置未确定如何解除，脉冲编码器位置怎么调

再次通电后，如果仍然显示“脉冲编码器位置未确定”，可以在关节进给的模式下，使出现问题的轴朝任一方向旋转，直到按下RESET键时不再出现报警。

2024-02-25 11:21:16

271

已全部加载完成

搜索历史

大模型的位置编码和外推性问题一样吗

评论