清华Ð提出首个二值化光谱重建算法-电子发烧友网

本文介绍我们在 NeurIPS 2023 上的新工作《Binarized Spectral Compressive Imaging》

论文：https://arxiv.org/abs/2305.10299 代码1：github.com/caiyuanhao1998/BiSCI 代码2：github.com/caiyuanhao1998/MST

图1 BiSRNet 与当前最先进的二值网络的性能对比

目前所有的代码，预训练模型和测试结果均已开源在我们开发的一个二值化光谱压缩重建工具包 BiSCI 内，该工具包支持八类最主要的二值网络，欢迎大家来使用。同时，我们还将 BiSRNet 嵌入到了我们之前开发的光谱重建工具箱 MST 当中。目前 MST 工具包已支持超过 12 类深度学习算法，并包含各种配套的可视化函数，欢迎大家来对比。

1. 光谱压缩重建任务介绍

相比于常规的三通道 RGB 图像，高光谱图像包含几十上百个波段，从而捕获了关于成像场景更丰富的信息。也正因为这一重要特性，高光谱图像被广泛地应用于医疗，地形勘探，农业等领域。如图2所示，在医院进行检查时，如果只看常规的RGB图像可能很难诊断病因，但是如果采用高光谱图像捕获并在特定波长下渲染的话，就可以看清楚各类血管，骨骼结构等，从而辅助医生诊断。同样的原理也可应用在遥感地形勘探和农业病虫害检测。

图2 高光谱图像的应用

然而高光谱图像并容易获取，传统的成像设备采用光谱仪对成像场景进行逐波段的扫描，费时费力，难以捕捉运动场景。近些年，科学家们专门设计了单曝光压缩成像（Snapshot Compressive Imaging，SCI）系统来解决这一问题。其光路结构如图3所示。该系统首先通过一个编码孔径掩膜对成像场景的各光谱通道进行调制，然后通过一个三棱镜进行色散后在相机上捕获到一个二维的快照估计图（compressive measurement）。通过这个光路系统，我们便可将三维的光谱立方块压缩成一个二维的图像。而光谱压缩重建的任务便是从这个二维的压缩估计图上恢复出三维的高光谱数据。

图3 单曝光压缩成像系统

当前的主流方法是采用的是全精度模型如 CNN 或者 Transformer 来学一个从压缩估计图到三维光谱立方块的映射。几个比较经典算法有我们之前的工作 MST，MST++，CST，DAUHST，HDNet 等（这些方法全部都开源在我们的工具箱 MST 当中）。这类方法虽然取得了很好的重建效果，但却难以部署到移动端设备（如智能手机、相机、无人机等）上，因为移动端设备的内存空间，计算资源和电力均有限，无法运转全精度模型。另一方面，全精度模型的一些计算单元如深度展开算子和多头自注意力机制等相对复杂，移动端设备无法支持。为了推动光谱重建算法的实际应用，本文做了如下贡献：

（1）提出了光谱压缩重建领域内首个基于二值神经网络（Binarized Neural Network，BNN）的算法 — 二值化光谱重分布网络（Binarized Spectral-Redistribution Network，BiSRNet）。

（2）设计了一个新的二值化卷积单元 — 二值化光谱重分布卷积（Binarized Spectral-Redistribution Convolution，BiSR-Conv）。该卷积单元可以调整光谱表征的强度和分布，同时在反向传播中更好地逼近二值化符号（Sign）函数，从而让求得的梯度更加准确。

（3）制作了四个二值化卷积模块来解决特征图形变过程中的维度不匹配问题，从而让全精度信息能流通整个模型的每一层卷积单元以弥补二值卷积造成的信息损失。

（4）我们的 BiSRNet 显著地超越了当前最先进的二值化算法，甚至取得了能与全精度CNN比肩的效果，然而我们的BiSRNet算法却只需要极低的存储空间（约 0.06 %）和计算代价（约 1 %）。

2. 本文方法

2.1 基础模型

一般来说，用于二值化的全精度模型应该是比较轻量的且它的计算单元可以再移动端设备上运行。然而，现存的CNN 或 Transformer 模型均不满足这一要求。为此，我们重新设计了一个简单，轻量，易于部署的基础模型（Base Model）。

受到之前工作 MST，MST++，CST，DAUHST 的启发，我们设计的基础模型也采用一个 U 形结构，如图4所示。

图4 基础模型的网络结构

在这个基础模型中，采用的所有计算单元都可以被移动端设备支持，同时也不涉及计算复杂度高的操作。

2.2 二值化光谱重分布卷积单元

图 5 符号函数与各类逼近函数的对比图

Clip(x) 与 Quad(x) 的具体表达式如下：

然而分段线性函数知识一个粗略的估计，它与符号函数之间依旧有着很大的误差。图 5 中的阴影部分面积就表示这个误差的大小，Clip(x) 的误差是1。此外，一旦激活或者权重的值落在了 [-1, 1] 之外，他们就不会再被更新。尽管分段二次函数是一个更精确的逼近（误差为2/3），上述的两个问题依旧存在。为此，我们设计了一个可缩放的双曲正切函数来在反向传播中拟合符号函数：

通过我们的设计，全精度信息流就不会被二值卷积给阻断，从而能够顺畅地流过我们设计的 BiSR-Conv 单元，如图 4 (c) 中的红色箭头所示。

图6 本文卷积二值卷积块与普通二值卷积块在处理特征图维度变化时的对比

全精度信息流在二值化算法中非常重要，因为它在一定程度上弥补了量化导致的信息损失。然而在特征图的上下采样过程中，由于维度发生了变化，难以直接引入残差链接以补充全精度信息，如图 6 中每个子图的左半部分所示。蓝色箭头表示二值信号，红色箭头表示全精度信息流。普通的二值卷积模块会在特征度维度改变的同时阻断全精度信息流的传递。然而我们的二值卷积模块通过采用分割合并的技巧，让全精度信息流不被阻断，从而在整个二值模型中流通。

3. 实验结果

3.1 量化指标

表1 BiSRNet 与 SOTA BNN，传统方法，全精度CNN方法的量化指标对比

3.2 视觉对比

图7 BiSRNet 与其他 BNN 方法在仿真数据及上的视觉对比

图8 BiSRNet 与其他 BNN 方法在真实数据集上的视觉对比

4. 总结

本文首次探索了压缩量化在光谱压缩重建领域的应用，提出了该领域首个二值化卷积神经网络 BiSRNet，在量化指标和视觉结果上都显著地超越了当前最先进的二值化模型。代码，预训练权重，重建结果均开源在：

github.com/caiyuanhao1998/BiSCI

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4607

浏览量
92839
光谱

光谱

+关注

关注
4

文章
818

浏览量
35152
深度学习

深度学习

+关注

关注
73

文章
5500

浏览量
121111
二值化

二值化

+关注

关注
0

文章
13

浏览量
4235

原文标题：NeurIPS 2023 | 清华Ð提出首个二值化光谱重建算法

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

基于图像分块的局部阈值二值化方法

针对目前局部阈值二值化结果存在目标虚假或断裂的缺陷，提出了一种基于图像分块的局部阈值二值

发表于 05-04 11:10

基于约束的地质网格曲面重建算法

提出一种基于地质约束的地质曲面重建算法，为在三维地质建模中构造线性不连续层位面片提供一种解决方案。应用“移动立方体”算法从点云重建出无约束的

发表于 04-03 09:04 •8次下载

基于大津法的图像分块二值化算法

本文对灰度图像二值化的方法进行研究，提出了一种新的以大津法为基础的图像分块二值

发表于 08-04 09:25 •48次下载

MC三维重建算法的二义性消除研究

面绘制法进行三维重建是三维重建技术的主要方法，Marching Cubes(移动立方体)算法是经典的面绘制法。本文在剖析了MC 算法的基础上，针对其存在的

发表于 01-22 12:02 •21次下载

一种基于散乱数据的自适应曲面重建算法

本文依据Shepard基本原理,提出了一种新的自适应曲面重建算法。该算法首先利用LMS方法优化改进型Shepard算法,求出由粗糙到细致的控

发表于 03-01 16:18 •8次下载

基于POCS算法的图像超分辨率重建

超分辨率技术是指通过融合多幅模糊、变形、频谱混叠的低分辨率图像来重建一幅高分辨率图像.本文提出一种基于POCS算法的视频图像超分辨率重建方法.POCS

发表于 11-08 17:03 •40次下载

ECT图像重建算法的FPGA实现

ECT图像重建算法的FPGA实现 ECT图像重建算法的FPGA实现

发表于 11-19 14:59 •2次下载

一种改进的字符图像二值化算法_袁璐

发表于 03-14 17:48 •9次下载

基于Fast Newman二值算法的加权脑网络模块化算法

针对二值人脑结构网络的模块化方法不足以反映复杂的人脑生理特征这一问题，提出一种基于Fast Newman二

发表于 12-08 17:38 •1次下载

基于各向异性TV最小化重建算法

（Total-Variation，TV）最小化模型使用基于交替方向法（alternating direction method，ADM）的稀疏优化算法能够在不完全角度的图像重建中获得较优的重建

发表于 12-12 19:08 •3次下载

基于分析稀疏表示的图像重建算法

TV-Wavelet-I_1（ TVWI_1）模型因包含全变分（Total-variation，TV）和小波正则化约束，具有较强的图像重建能力。而传统求解TVWI_I模型的算法往往忽略了综合／分析

发表于 03-07 16:40 •1次下载

关注算法安全新兴领域，清华团队RealAI推出业界首个AI模型“杀毒软件”

近日，清华大学AI研究院孵化企业RealAI(瑞莱智慧)正式推出首个针对AI在极端和对抗环境下的算法安全性检测与加固的工具平台RealSafe人工智能安全平台。该平台内置领先的AI对抗攻防算法

发表于 04-09 13:02 •1581次阅读

CVPR2023：IDEA与清华提出首个一阶段3D全身人体网格重建算法

三维全身人体网格重建(3D Whole-Body Mesh Recovery)是人类行为建模的一个重要环节，用于从单目图像中估计出人体姿态(Body Pose), 手势(Hand Gesture)和脸部表情(Facial Expressions)，该任务在许多下游现实场景中有着广泛的应用

发表于 04-07 09:56 •1133次阅读

清华研制出首个全模拟光电智能计算芯片ACCEL

清华研制出首个全模拟光电智能计算芯片ACCEL 清华大学研究团队研制出国际首个全模拟光电智能计算芯片简称ACCEL。高算力低功耗智能计算芯片典范，目前ACCEL 芯片利用现有成熟的工艺

发表于 11-05 18:10 •1316次阅读

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法

压缩重建工具包 BiSCI 内，该工具包支持八类最主要的二值网络，欢迎大家来使用。同时，我们还将 BiSRNet 嵌入到了我们之前开发的光谱重建

发表于 12-03 20:20 •653次阅读

搜索历史

清华Ð提出首个二值化光谱重建算法

评论

基于图像分块的局部阈值二值化方法

基于约束的地质网格曲面重建算法

基于大津法的图像分块二值化算法

MC三维重建算法的二义性消除研究

一种基于散乱数据的自适应曲面重建算法

基于POCS算法的图像超分辨率重建

ECT图像重建算法的FPGA实现

一种改进的字符图像二值化算法_袁璐

基于Fast Newman二值算法的加权脑网络模块化算法

基于各向异性TV最小化重建算法

基于分析稀疏表示的图像重建算法

关注算法安全新兴领域，清华团队RealAI推出业界首个AI模型“杀毒软件”

CVPR2023：IDEA与清华提出首个一阶段3D全身人体网格重建算法

清华研制出首个全模拟光电智能计算芯片ACCEL

NeurIPS 2023 | 清华ETH提出首个二值化光谱重建算法