0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单像素成像图像智能处理算法和应用场景

新机器视觉 来源:爱光学 作者:焦述铭 2022-10-26 15:57 次阅读

图像传感器是把摄像头接收到的光信号转化成电子信号的感光元件,可以记录光场强度的分布,对于拍照设备来说,它就如同人眼的视网膜。手机或者相机的传感器一般是一个包含了很多个小单元的阵列,每个小单元对应着照片中的一个像素。我们平时说的,相机2000万像素就是指图像传感器上有2000万个小单元(感光点)。

628a2c48-5447-11ed-a3b6-dac502259ad0.png

图像传感器单像素成像原理然而,近十多年来,科学家们却在探索一种新型的“单像素相机”[2],即图像传感器只包含一个像素,这种另类的光学成像方式就是“单像素成像”[1]。 那么单像素相机又是怎么工作的呢?单像素成像中,通过一个投影器件不断向目标物体照射不同的结构光图案,单像素探测器依次记录下每次照射时物体场景总体光强度,最后计算重建出具有空间分辨率的物体图像。数学上来说,单像素探测器记录的光强度是投影图案和物体图像之间的内积。单像素成像与以往常常提到的鬼成像和关联成像的概念比较接近。

62a60d00-5447-11ed-a3b6-dac502259ad0.png

典型的单像素成像系统单像素成像智能处理算法由于单像素相机与普通相机有着不同的成像机制和框架,在最近的研究中,笔者设计了四种为其“量身打造”的图像智能处理算法。 (1)运动物体单像素成像中模糊去除和质量提升 单像素成像中需要依次投影大量不同图案,记录下很长一串单像素值序列,才能重建出一张物体图像,这显然需要一定的成像时间。所以,拍摄快速运动的物体时,帧率往往比较低,记录前几个单像素值时还“朝发白帝”,记录后几个单像素值时就已经“暮到江陵”了。这导致最后记录下的单像素值数据里包含了不同位置物体的混合信息,重建的图像会包含比较多模糊和噪声,类似于普通相机拍摄一辆飞驰而过的汽车得到的“拖尾”照片一样。 为解决这一问题,可以考虑一个基本的物理定律——运动的相对性,物体在运动,投影图案是静止的,等效于物体是静止的,而投影图案在反方向运动。物体从左到右运动,相当于投影图案从右到左运动;物体顺时针转动,相当于投影图案逆时针转动。通过搜索估算物体的平移或者转动速度,对投影图案做相应的反向变换,然后计算时使用变换后的投影图案替代原本的投影图案,重建出的物体图像就会清晰很多,质量得到明显提升[3]。

62c1c7d4-5447-11ed-a3b6-dac502259ad0.png

实验中,拍摄一个快速转动圆盘上的数字,我们设计的算法可以去除重建图像中的模糊和噪声 [3]。 (2)基于单像素成像的全光学物体快速分类 图像常常需要进行自动分类识别,比如照片里的是一只猫,还是一只狗?一般无论普通相机还是单像素相机,都要先拍摄到物体(比如数字或交通标志)清晰的图片,才能使用机器学习方法进行图像分类任务。 不过,笔者提出的基于单像素成像的全光学物体快速分类方案中[4],不需要重建物体图像,物体只被很少数量的投影图案所照射,探测器只记录下“寥寥无几”的单像素值,该算法直接基于这些单像素值,在“不知道物体到底长得什么样”情况下,能够进行快速物体分类。比如我们要把物体分为10类,只需要从大量训练图片中优化设计出10个投影图案,一共投影10次,而进行完整的图像重建可能需要投影几百几千次。

62eee458-5447-11ed-a3b6-dac502259ad0.png

从10个类别的数字图像和交通标志图像中分别优化设计出的10个用于快速物体分类的投影图案(第四行)。 分类结果可以通过单像素值序列中最大光强度值直接显示出来,无需后续的数字处理,整个系统相当于一个可以进行线性分类任务的“光学计算机”。相比于2018年Science论文中多层级联相位板结构的全光学衍射神经网络(DNN)系统[5],我们的系统可以完成类似的全光学物体分类任务,同时具有非相干光照射下工作,低实验复杂性,高可编程性等优点,更容易实现。 (3)单像素成像中图像盲重建 单像素成像中一般既需要已知所有投影图案,又需要已知所有单像素值,才能进行物体图像的重建。这样看起来二者缺一就无法重建图像,其实未必。

63148ffa-5447-11ed-a3b6-dac502259ad0.png

假设投影图案虽然是未知的,但它们保持固定不变。如果已知一定数量不同的物体图像和它们对应单像素值序列作为训练样本,可以通过机器学习方式实现盲重建。笔者在研究[6]中并没有使用“时尚潮流之选”的深度学习方法,而使用了更简单的基于线性回归模型的方式恢复未知的投影图案,但获得的结果在一定条件下优于深度学习的结果。 事实上,很多相干和非相干的光学成像系统都是线性的,一些传统方法也可能对系统进行精确模拟,那么近年在各领域都普遍使用的深度学习方法是否一定优于传统方法?一些仿真和实验结果显示,对于单像素成像系统和其他一些线性光学系统,深度学习其实未必总能表现出优势,尤其在需要大量训练样本和泛化性这两个方面表现出一定不足[6]。 (4)单像素成像中的可视加密 作为90后经典童年回忆的《冒险小虎队》中,通过解密卡才能看到杂乱无章的条纹中隐藏的信息,这其实很类似于一种“可视加密”技术。

632ae052-5447-11ed-a3b6-dac502259ad0.png

可视加密(Visual Cryptography)把要隐藏的图像分解成几个随机图案,把它们打印在透明胶片上,每个图案称为一个可视密钥(Visual Key),无法从中看到隐藏的图像。可是当可视密钥重叠在一起时,隐藏图像就可以在视觉上显现出来。单像素成像中的探测器收集物体图像总体光强度的方式,相当于进行了像素值的虚拟叠加操作,与可视加密一定程度上“异曲同工”。 笔者提出通过物体图像和通过投影图案两种方式将可视加密在单像素成像中实现[7]。单像素的可视加密可以适用于打印在不透明介质上的可视密钥图案,并且容易在肉眼观察不到的非可见光波段以及视平线之外隐藏角落实现可视加密,物理层面上提升可视加密的安全性。 例如,(a)和(b)两个二维码可以作为一组可视密钥,用手机扫它们,可以读出同样的信息,不过读出的并不是要隐藏的信息,而是做伪装的“幌子”。通过单像素可视加密系统虚拟叠加到一起之后,依旧是一个可以用手机扫的二维码(c),不过真正隐藏的信息”OK”浮现了出来。

633f2d1e-5447-11ed-a3b6-dac502259ad0.png

此外单像素成像中,只对一组投影图案的随机置换也能实现图像加密[8]。单像素成像的应用单像素成像可以把传感器从一个单元阵列简化为单个像素,与此同时,则需要额外的投影器件,比如,数字微镜阵列DMD,并且要投影照射和记录很多次,而不是一次性成像。 然而,这不妨碍在很多情况下,单像素相机仍然比普通相机更具有优势,比如在可见光以外的一些波段,单元阵列传感器难以制造,或者成本非常高,而只包含一个像素的简单传感器就容易实现得多,单像素成像为这些波段的低成本相机提供了一个好的选择。 再比如普通相机拍摄照片时,物体需要放到镜头或者传感器的视平线范围内,而单像素探测器可以拍摄隐藏在拐角处的物体。当同时对多个光谱和多个偏振态的光场进行记录时,难以在同一个单元阵列传感器上对这么多的“频道”同时进行复用,单像素探测器则比较容易在“频道”间灵活来回切换。 目前,该技术已被研究者尝试应用于多个领域,如遥感成像、显微镜、光谱仪、无人驾驶激光雷达、加油站气体泄露监测、便携式扫描仪等,单像素成像的潜在应用场景一直在不断被发掘和扩展。

作者简介

焦述铭,深圳大学纳米光子学研究中心副研究员,香港城市大学博士毕业。主要从事单像素成像,全息成像及显示,图像处理等方面研究。以第一作者发表期刊论文20余篇,曾入选Hong Kong PhD Fellowship Scheme和广东省“珠江人才计划”博士后资助项目。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2551

    文章

    51163

    浏览量

    754123
  • 摄像头
    +关注

    关注

    60

    文章

    4846

    浏览量

    95796

原文标题:单像素成像图像智能处理算法

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    系统放大器的技术原理和应用场景

    放大和处理,以提供高清晰度和稳定的图像输出。 生物医学:在生物医学成像和信号采集过程中,系统放大器能够增强来自传感器的微弱信号,助力进一步的分析和处理。这对于医疗诊断、疾病监测等领域具
    发表于 11-18 14:46

    实时示波器的技术原理和应用场景

    波形图像。在信号处理方面,示波器首先将接收到的被测信号进行放大和滤波等处理,以确保信号的准确性和稳定性。然后,通过A/D转换技术,将模拟信号转换为数字信号,以便进行后续的数字处理和显示
    发表于 10-23 14:22

    FPGA在图像处理领域的优势有哪些?

    。这种并行处理能力使得FPGA在处理大规模图像数据时表现出色,能够实时完成复杂的图像处理算法。 二、高灵活性 FPGA具有很高的灵活性,可以
    发表于 10-09 14:36

    智能IC卡测试设备的技术原理和应用场景

    智能IC卡测试设备的技术原理和应用场景,可以从以下几个方面进行阐述:技术原理智能IC卡测试设备的技术原理主要围绕IC卡的通信和数据处理机制展开。IC卡(包括
    发表于 09-26 14:27

    浅谈国产异构双核RISC-V+FPGA处理器AG32VF407的优势和应用场景

    技术手段提高系统的安全性和可靠性,适用于对安全要求较高的应用场景。 应用场景 边缘计算 : 在物联网、智能城市等边缘计算场景中,异构双核RISC-V+FPGA
    发表于 08-31 08:32

    LED像素间距的定义和应用场景

    LED像素间距,也被称为点间距,是LED显示屏上一个关键的技术参数,它直接关联到显示屏的分辨率、清晰度以及观看体验。以下是对LED像素间距的详细解析,包括其定义、重要性、影响因素、应用场景以及选择原则等方面。
    的头像 发表于 08-10 09:59 1701次阅读

    RISC-V适合什么样的应用场景

    解决方案,适用于边缘计算、智能摄像头、智能音箱等场景。 灵活性:RISC-V的开放性使得其能够更容易地与各种AI框架和算法集成,满足不同的AI应用需求。 4. 自动驾驶和汽车电子 定制
    发表于 07-29 17:16

    FPGA在人工智能中的应用有哪些?

    和安全的云计算和网络服务。 三、具体应用场景 图像分类:在图像分类任务中,FPGA可以承担前置处理图像卷积、全连接等任务。通过FPGA的并
    发表于 07-29 17:05

    FPGA与MCU的应用场景

    大量计算任务,这在实时处理等应用中尤为重要。 高性能计算 FPGA在处理复杂算法和大规模数据时表现出色,特别是在人工智能(AI)和机器学习(ML)领域。它们可以加速神经网络的训练和推理
    发表于 07-29 15:45

    FPGA设计经验之图像处理

    NxN的算子中的N不能特别大。当然FPGA也可以接DDR把图像缓存到其中再读出来进行处理,但这种处理模式就和CPU差不多了,达不到最高的实时性。其实有些我们认为需要随机读取数据的图像
    发表于 06-12 16:26

    基于FPGA的实时边缘检测系统设计,Sobel图像边缘检测,FPGA图像处理

    搭建图像处理硬件平台成为图像处理的发展趋势。FPGA在运算性能方面的具有较大优势,使用FPGA并行加速图像
    发表于 05-24 07:45

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI 是一种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传输延迟、降低
    发表于 03-12 08:09

    一种基于扩散模型的傅里叶像素成像高分辨率迭代重建方法

    傅里叶像素成像(FSPI)是一种基于傅里叶分析理论的计算光学成像技术。
    的头像 发表于 01-24 09:43 1156次阅读
    一种基于扩散模型的傅里叶<b class='flag-5'>单</b><b class='flag-5'>像素</b><b class='flag-5'>成像</b>高分辨率迭代重建方法

    AG32VF-MIPI应用场景

    MIPI接口技术在图像和视频传输中的应用越来越广泛,应用场景也在不断拓展,而不仅限于移动设备。MIPI接口在物联网、智能家居、智能监控、智能
    发表于 01-22 08:56

    FPGA图像处理之CLAHE算法

    在FPGA图像处理--CLAHE算法(一)中介绍了为啥要用CLAHE算法来做图像增强。
    的头像 发表于 01-04 12:23 2568次阅读
    FPGA<b class='flag-5'>图像</b><b class='flag-5'>处理</b>之CLAHE<b class='flag-5'>算法</b>