基于STE的QAT算法-电子发烧友网

在对激活进行伪量化前先将激活截断在（0,1）之间, 这样的做法是基于一些经典的网络结构中，比如AlexNet与RestNet中，大部分的激活都会落在这个范围里的。

对于weight，则是先通过这样的一个非线性函数对weight进行映射，tanh(w)将weight的值域缩放到-1到+1之间，再除以2倍的tanh(w)绝对最大值加上1/2最终weight被映射到了0到1之间，再对其进行量化与反量化，再将输出结果通过乘2减1仿射变换到-1到1之间。

这里的quant与dequant操作在原论文中是被表示为一个quantize_k的操作,k指的是k位的量化，其实本质上就和我们之前提到的量化公式相似，就是把1/s替换成了2^k-1。

但DoReFa-Net的这个方式对于其它一些activation取值分布较广的网络就显得有点过于死板了，所以就有另一个改进版本的算法Parameterized Clipping Activation，PACT针对activation的伪量化这一部分，将截断门限alpha设为可学习的参数，然后通过梯度下降来寻找更优的门限。

因为alpha被设为可学习参数，所以这一部分的导数就可以由小于alpha的部分为0，大于等于alpha的部分为1。

大家看到PACT的这个函数其实和ReLU很像，对大于零的部分做一个截断操作，其实PACT原本思想也是想要替代ReLU。但问题是并非所有的模型结构用的都是ReLU这个激活函数，所以为了让PACT的应用范围更广，PaddlePaddle也也对其做了一定的改进，对大于零和小于零的激活值都做了相同的限制，使它能够在某些情况下得到更好的量化范围，以降低量化损失。

除此之外，还有一个常被使用到的算法，Learned Step Size Quantization，与PACT相似的是它也是通过训练来确定量化参数，但不同的是PACT学习的是截断门限，而LSQ直接将Scale定为一个可学习的参数。

我们先来看它的计算公式，这里的r_hat指的就是经过量化与反量化后的数值，
这其实就是在对称量化公式的基础上加了个scale，完成了一个量化与反量化的过程

因为我们需要反向传播计算梯度，所以就要对这个公式进行求导 (加些对公式的解说)

对于这一块的导数，LSQ还是采用直通估计，由此我们就得到了一个最终的导数公式；

这里又可以看出，LSQ虽然也采用了直通估计，但它在截取范围内还是存在梯度计算的

而且，为了使得Scale的学习更为稳定，LSQ还为其梯度加上了一个缩放系数，这个系数主要由tensor中的元素数量决定

另外，既然是可学习参数，那么就需要为其设置一个初始值，PACT中的alpha通常会被手动设置为常数值6，而LSQ原文中scale的初始值则由tensor的L1正则确定，不过在实践过程中，其实更多的是通过统计激活分布，用EMA-minmax, KLD，MSE等PTQ的方式来计算初始的scale值。
审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

函数

函数

+关注

关注
3

文章
4350

浏览量
63051
网络结构

网络结构

+关注

关注
0

文章
48

浏览量
11250
STE

STE

+关注

关注
0

文章
8

浏览量
9287

HFW14S-2STE1LF和SFV18R-2STE1HLF富加宜（FCI）/安费诺板端优势定货连接器

级高新元器件，优势供应行业：汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人：张先生联系手机：***24小时在线QQ:1719878442（欢迎联系询价）SFW8R-4STAE9LFSFW28R-2STAE1LFSFW12R-1STAE9LFSFW8S-2STE9LFSFW26R-6STE1LFSFW30R-5

发表于 10-15 17:30

板端连接器FCI(富加宜)品牌供应商优势型号SFV10R-1STE1HLF和SFW5R-1STE1LF

级高新元器件，优势供应行业：汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人：张先生联系手机：***24小时在线QQ:1719878442（欢迎联系询价）62684-501100AHLFHFW11R-2STZE1LFSFW8R-2STE9LFSFW5S-2STMAE1LFSFW12R-6STE9LFSFW8R-

发表于 10-15 17:33

优势定货连接器供应商品牌FCI富加宜型号SFW30R-1STE1LF和SFW15R-1STE1LF及其SFW系列

级高新元器件，优势供应行业：汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人：张先生联系手机：***24小时在线QQ:1719878442（欢迎联系询价）62684-362100ALFSFV35R-1STBE1HLFSFV9R-2STBE1HLF10061122-511420HLFSFW18R-7STE1LF1

发表于 10-15 17:36

FCI富加宜SFW10S-2STE1LF和SFW12R-2STE1LF优势板端连接器型号

级高新元器件，优势供应行业：汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人：张先生联系手机：***24小时在线QQ:1719878442（欢迎联系询价）59453-081110EDHLFSFW4R-3STAE1LFSFW13R-1STE1LFSFV20R-2STBE1HLF62684-321100ALFSFV

发表于 10-18 09:15

SFW8S-2STE1LF和SLW16R-1C7LF优势订货板端连接器交期短价格优

级高新元器件，优势供应行业：汽车线束、汽车电子、家电、工业机械、航空军工、民用等等联系人：张先生联系手机：***24小时在线QQ:1719878442（欢迎联系询价）SLW16S-1C7LFSLW4S-1C7LFSFW16R-1STE1LFSFW8S-2STME1LFSFW6R-2STE1LFSFW15S-2STE1LFS

发表于 10-18 09:17

Intel QAT加速卡逻辑实例有哪些

Intel QAT加速卡逻辑实例1. QAT相关的名词组织关系在本手册中描述的平台上，处理器可以连接到一个或多个英特尔®通信芯片组8925至8955系列（PCH）设备。从软件角度来看，每个PCH

发表于 07-16 08:16

Intel® QAT加速卡之Linux上编程详解

QATSoftware for Linux1. Introduction该程序员指南提供了有关软件体系结构和使用指南的信息。相关的英特尔®QAT软件库文档中记录了有关使用英特尔

发表于 07-22 08:37

STE相比于之前的AMTE/MTE主要特点有哪些

STE相比于之前的AMTE/MTE主要特点有哪些？vango验证和出货生产芯片的测试原理和基本方法是什么？

发表于 11-12 06:00

Atari ST/STE EPROM墨盒的资料分享

描述Atari ST/STE EPROM 墨盒该 EPROM 盒板有 4 个 EPROM 插槽，每个插槽可用于 27C256 EPROM，从而可以填充整个 128kB 盒空间。两个插槽用于 ROM4

发表于 07-04 07:37

英特尔QuestAsvices技术（英特尔®QAT）

® QuickAssist Technology (Intel® QAT) Engine with OpenSSL 1.1.0.

发表于 10-29 06:31 •2777次阅读

利用NVIDIA TensorRT实现推理的QAT伪量化

在这篇文章中，我们简要介绍了基本的量化概念和 TensorRT 的量化工具箱，然后回顾了 TensorRT 8 . 0 是如何处理 Q / DQ 网络的。我们对量化工具箱提供的 resnet50qat 示例进行了快速演练。

发表于 03-31 16:51 •4012次阅读

Atari ST/STE EPROM墨盒开源分享

电子发烧友网站提供《Atari ST/STE EPROM墨盒开源分享.zip》资料免费下载

发表于 07-06 09:20 •0次下载

1990年代计算机Atari STE的完全未经测试的翻拍

电子发烧友网站提供《1990年代计算机Atari STE的完全未经测试的翻拍.zip》资料免费下载

发表于 07-21 11:34 •0次下载

带有AV RCA和插孔的ATARI ST/STE RGB到VGA视频适配器

电子发烧友网站提供《带有AV RCA和插孔的ATARI ST/STE RGB到VGA视频适配器.zip》资料免费下载

发表于 08-05 10:16 •0次下载

JW5116兼容芯洲SCT2330SCT2433STE 方案

JW5116杰华特完全兼容芯洲DCDCSCT2330SCT2433STE方案

发表于 04-24 16:50 •4次下载

搜索历史

基于STE的QAT算法

评论

HFW14S-2STE1LF和SFV18R-2STE1HLF富加宜（FCI）/安费诺板端优势定货连接器

板端连接器FCI(富加宜)品牌供应商优势型号SFV10R-1STE1HLF和SFW5R-1STE1LF

优势定货连接器供应商品牌FCI富加宜型号SFW30R-1STE1LF和SFW15R-1STE1LF及其SFW系列

FCI富加宜SFW10S-2STE1LF和SFW12R-2STE1LF优势板端连接器型号

SFW8S-2STE1LF和SLW16R-1C7LF优势订货板端连接器交期短价格优

Intel QAT加速卡逻辑实例有哪些

Intel® QAT加速卡之Linux上编程详解

STE相比于之前的AMTE/MTE主要特点有哪些

Atari ST/STE EPROM墨盒的资料分享

英特尔QuestAsvices技术（英特尔®QAT）

利用NVIDIA TensorRT实现推理的QAT伪量化

Atari ST/STE EPROM墨盒开源分享

1990年代计算机Atari STE的完全未经测试的翻拍

带有AV RCA和插孔的ATARI ST/STE RGB到VGA视频适配器

JW5116兼容芯洲SCT2330SCT2433STE 方案