0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于 OpenCV 的气体泵扫描仪数字识别系统

电子设计 来源:电子设计 作者:电子设计 2020-12-14 23:12 次阅读
来源:小白学视觉
作者:努比


综述

2012年iOS应用商店中发布了一个名为FuelMate的Gas跟踪应用。小伙伴们可以使用该应用程序跟踪汽油行驶里程,以及有一些有趣的功能,例如Apple Watch应用程序、vin.li集成以及基于趋势mpg的视觉效果。

燃料伴侣

对此我们有一个新想法,该如何添加一个功能帮助我们在泵中扫描燃油,并在应用程序中输入燃油信息?让我们深入研究如何实现这一目标。

技术

对于这个项目的我们首先应该编写一个简单的Python应用程序以拍摄汽油泵的图像,然后尝试从中读取数字。OpenCV是用于计算机视觉应用程序的流行的跨平台库。它包括各种图像处理实用程序以及某些机器学习功能。除此之外我们希望可以先使用Python对其进行原型设计,然后将处理代码转换为C ++以在iOS应用程序上运行。

目标

我们首先要考虑以下两个问题:

1.我们可以从图像中分离出数字吗?

2.我们可以确定图像代表哪个数字吗?

数字分割

如何确定图像中的数字有多种方法,但是我提出了使用简单的图像阈值法来尝试查找数字的方法。

图像阈值化的基本思想是将图像转换为灰度,然后说灰度值小于某个常数的任何像素,则该像素为一个值,否则为另一个。最后,您得到的二进制图像只有两种颜色,在大多数情况下只是黑白图像。

这个概念在OCR应用中非常有效,但是主要问题是决定对该阈值使用什么。我们可以选择一些常量,也可以使用OpenCV选择其他一些选项。我们可以使用自适应阈值而不是使用常数,这将使用图像的较小部分并确定要使用的不同阈值。这在具有不同照明情况的应用中特别有用,特别是在扫描气泵中。

将图像设置为阈值后,可以使用OpenCV的findContours方法查找图像中连接了白色像素部分的区域。绘制轮廓后,便可以裁剪出这些区域并确定它们是否可能是数字以及它是什么数字。

基本图像处理流程

这是我在测试图像处理中使用的原始图像。它有一些眩光点,但是图像相当干净。让我们逐步完成获取此源图像的过程,并尝试将其分解为单个数字。


原始图片

影像准备

在开始图像处理流程之前,我们决定先调整一些图像属性,然后再继续。这有点试验和错误,但注意到,当我们调整图像的曝光度时,可以获得更好的结果。下面是使用Python调整后的图像,相当于曝光(阿尔法)的图像cv::Mat::convertTo这是刚刚在图像垫乘法操作cv2.multiply(some/_img, np.array([some/_alpha]),


调整曝光

灰阶

将图像转换为灰度。

转换为灰度

模糊

模糊图像以减少噪点。我们尝试了许多不同的模糊选项,但仅用轻微的模糊就找到了最佳结果。

稍微模糊

阈值图像转换为黑白图像

在下图中,使用cv2.adaptiveThreshold带有cv2.ADAPTIVE/_THRES/_GAUSSIAN/_C选项的方法。此方法采用两个参数,块大小和要调整的常数。确定这两者需要一些试验和错误,更多有关优化部分的内容。

阈值为黑/白

填补空白

由于大多数燃油泵都使用某种7段LCD显示屏,因此数字中存在一些细微的间隙,无法使用轮廓绘制方法,因此我们需要使这些段看起来相连。在这种情况下,我们将转到erode图像来弥补这些差距。由于大家可能希望使用,所以这似乎向后看,dilate但是这些方法通常适用于图像的白色部分。在我们的案例中,我们正在“侵蚀”白色背景以使数字看起来更大。

反转图像

在尝试在图像中查找轮廓之前,我们需要反转颜色,因为该findContours方法将找到白色的连接部分,而当前的数字是黑色。


颜色反转

在图像上找到轮廓

下图显示了我们的原始图像,该图像在上图的每个轮廓上都有包围框。大家可以看到它找到了数字,但也找到了一堆不是数字的东西,因此我们需要将它们过滤掉。

轮廓过滤

1.现在我们有了许多轮廓,我们需要找出我们关心的轮廓。浏览了一堆气泵的显示和场景后,使用一套适用于轮廓的快速规则。

2.收集所有我们将分类为潜在小数的正方形轮廓。

3.扔掉任何不是正方形或高矩形的东西。

4.使轮廓与某些长宽比匹配。LCD显示屏中的十个数字中有九个数字的长宽比类似于下面的蓝色框高光之一。该规则的例外是数字“ 1”,其长宽比略有不同。通过使用一些样本轮廓,我将0–9!1方面确定为0.6,将1方面确定为0.3。它将使用这些比率和+/-缓冲区来确定轮廓是否是我们想要的东西,并收集这些轮廓。

5.对潜在数字应用一组附加规则,在这里我们将确定轮廓边界是否偏离所有其他潜在数字的平均高度或垂直位置。由于数字的大小应相同,并且在相同的Y上对齐,因此我们可以丢弃它认为是数字的任何轮廓,但不能像其他轮廓那样将其对齐和调整大小。

预测

有两个等高线轮廓,一个带潜在位数,一个带潜在小数位,我们可以使用这些轮廓边界裁剪图像,并将其输入经过训练的系统中以预测其值。有关此过程的更多信息,请参见“数字培训”部分。

查找小数

在图像中查找小数点是要解决的另一个问题。由于它很小,有时会连接到它旁边的手指,因此使用我们在手指上使用的方法来确定它似乎有问题。当我们过滤轮廓时,我们收集了可能是十进制的正方形轮廓。从上一步获得经过验证的数字轮廓之后,我们将找到数字的最左x位置和最右x位置,以确定我们期望的小数位数。然后,我们将遍历那些潜在的小数,确定它是否在该空间以及该空间的下半部分,并将其分类为小数。找到小数点后,我们可以将其插入到我们上面预测的数字字符串中。

数字培训

在机器学习的世界中,解决OCR问题是一个分类问题。我们建立了一组训练有素的数据,例如图像处理中的数字,将它们分类为某种东西,然后使用该数据来匹配任何新图像。一旦基本的图像隔离功能开始工作,我就创建了一个脚本,该脚本可以遍历图像文件夹,运行数字隔离代码,然后将裁剪的数字保存到新文件夹中供我查看。运行完之后,我会有一个未经训练的数字文件夹,然后可以用来训练系统。


由于OpenCV已经包含了k近邻(k-NN)实现,因此无需引入任何其他库。为了进行训练,我们浏览了数字作物的文件夹,然后将其放入标有0–9的新文件夹中,因此每个文件夹中都有一个数字的不同版本的集合。我们没有大量的这些图像,但是有足够的证据来证明这是可行的。由于这些数字是相当标准的,我认为我不需要大量训练有素的图像就可以相当准确。

k-NN工作原理的基础是,我们将以黑白方式加载每个图像,将该图像存储在每个像素处于打开或关闭状态的数组中,然后将这些打开/关闭像素与特定的数字相关联。然后,当我们要预测一个新图像时,它将找出哪个训练图像与这些像素最匹配,然后向我们返回最接近的值。

整理好数字后,将创建一个新的脚本,该脚本将遍历这些文件夹,获取每个图像并将该图像与数字关联。到目前为止,在大多数代码中,一般的图像处理概念在Python和C ++中都应用相同,但是在这里会有细微的差别。

在大多数此类应用程序的Python示例中,分类被写入两个文件,一个包含分类,另一个包含该分类的图像内容。通常使用NumPy和标准文本文件完成此操作。但是,由于我想在iOS应用程序上重用该系统,因此我需要想出一种可以拥有跨平台分类文件的方式。当时,我什么都找不到,因此最终编写了一个快速实用程序,该实用程序将从Python中获取分类数据并将其序列化为JSON文件,我可以在OpenCV的FileStorage系统的C ++端使用它。这不漂亮,但是我写了一个简单的MatPython中的序列化方法,它将为OpenCV创建合适的结构以在iOS端读取。现在,当我训练数字时,我将获得NumPy文件供我的Python测试使用,然后获取一个JSON文档,我可以将其拖到我的iOS应用程序中。您可以在此处看到该代码。

优化

一旦确定了数字隔离和预测的两个目标,就需要对算法进行优化,以预测泵的新图像上的数字。

在优化的初始阶段,创建了一个简单的Playground应用程序,其中使用了OpenCV提供的一些简单的UI组件。使用这些组件,可以创建一些简单的轨迹栏,以左右滑动并更改不同的值并重新处理图像。围绕该cv2.imshow方法创建了一个小包装程序,该方法可以平铺显示的窗口,因为我讨厌总是重新放置它们,

尝试不同的变量

我们可以加载不同的图像,并在图像处理中尝试变量的不同变化,并确定最佳的组合。

自动化

在每个图像上测试不同的变量是上手的好方法,但是我们想要一种更好的方法来验证是否更改了一个图像的变量是否会对其他任何图像产生影响。为此,我们想出了针对这些图像进行一些自动化测试的系统。

我拍摄了每个测试图像,并将它们放在文件夹中。然后,我用图像中期望的数字来命名每个文件,并用小数点“ A”表示。应用程序可以加载该目录中的每个图像并预测数字,然后将其与文件名中的数字进行比较以确定是否匹配。这使我们可以针对所有不同的图像快速尝试更改。

自动测试输出

更进一步,我创建了此脚本的不同版本,该脚本将尝试对这组图像进行模糊,阈值等变量的几乎每种组合,并找出最优化的变量集将具有最佳的性能。准确性。该脚本在计算机上花费了相当长的时间才能运行,大约需要7个小时,但是最后提出了一组不同的变量,这些变量在我们手动测试时找不到。

结论

这是否是任何人实际上都会使用的功能尚待确定,但这在实现某些机器学习概念和使用OpenCV方面是一个有趣的练习。到目前为止,在我们的测试中,应用程序最大的问题是泵显示屏上的眩光。根据泵上的照明和手机的角度,可能会导致某些扫描失效。

代码链接:https://github.com/kazmiekr/G...

声明:转载请说明出处
推荐专栏文章

审核编辑:符乾江

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46791

    浏览量

    237411
  • 数字识别
    +关注

    关注

    2

    文章

    19

    浏览量

    10135
收藏 人收藏

    评论

    相关推荐

    大幅扫描仪扫描地图怎么操作

    1. 准备扫描仪和地图 在开始扫描之前,确保您的大幅扫描仪已经安装并正确配置。您可能需要安装特定的驱动程序或软件,以便扫描仪能够与您的计算机通信。 检查
    的头像 发表于 10-14 15:47 388次阅读

    蔡司激光三维扫描仪有效扫描金属材料

    蔡司激光三维扫描仪因其高精度和多功能性,在工业检测、逆向工程、质量控制等领域得到了广泛应用。对于金属材料的扫描,用户常常关心的是ZEISS激光三维扫描仪是否能够有效地完成这项任务。本文蔡司代理-三本
    的头像 发表于 09-26 15:08 390次阅读
    蔡司激光三维<b class='flag-5'>扫描仪</b>有效<b class='flag-5'>扫描</b>金属材料

    何为电磁干扰(EMI)扫描仪,哪里需要它?

    什么是电磁干扰扫描仪?电磁干扰扫描仪(Electromagneticinterferencescanner)又称EMI扫描仪,是属于电磁兼容(EMC)测所试设备,具备干扰频谱分析、定频干扰成像功能
    的头像 发表于 08-30 13:02 325次阅读
    何为电磁干扰(EMI)<b class='flag-5'>扫描仪</b>,哪里需要它?

    如何选择电磁干扰(EMI)扫描仪,看看这几点

    在上期讲完了电磁干扰(EMI)扫描仪的定义和应用以后,我们应该如何去选择一款合适的电磁干扰(EMI)扫描仪?在当今复杂的电子设备环境中,选择合适的电磁干扰(EMI)扫描仪对于确保产品质量、符合标准
    的头像 发表于 08-30 13:02 406次阅读
    如何选择电磁干扰(EMI)<b class='flag-5'>扫描仪</b>,看看这几点

    lidar激光雷达扫描仪有什么用

    于各个领域。 LiDAR激光雷达扫描仪的基本原理 LiDAR激光雷达扫描仪通过发射激光脉冲并接收反射回来的激光信号,来测量物体与扫描仪之间的距离。激光雷达扫描仪通常包括激光发射器、接收
    的头像 发表于 08-29 16:58 598次阅读

    基于OpenCV的人脸识别系统设计

    基于OpenCV的人脸识别系统是一个复杂但功能强大的系统,广泛应用于安全监控、人机交互、智能家居等多个领域。下面将详细介绍基于OpenCV的人脸识别
    的头像 发表于 07-11 15:37 1.2w次阅读

    工业级gom三维扫描仪的工作原理

    工业级gom三维扫描仪(如ATOS系列)的检测原理主要基于结构光扫描技术(StructuredLightScanning)和光学三角测量原理。以下是其基本的检测原理:1.结构光投射:扫描仪首先通过
    的头像 发表于 05-14 16:45 799次阅读
    工业级gom三维<b class='flag-5'>扫描仪</b>的工作原理

    手持式激光三维扫描仪原理和应用

    手持式激光三维扫描仪是集光学、机电和计算机技术于一体的高新无损检测技术,能够对实物的空间外形、结构乃至色彩进行扫描,将立体信息转换为计算机能直接处理的数字信号,获得物体表面的准确空间坐标,为实物
    的头像 发表于 03-27 16:44 1642次阅读
    手持式激光三维<b class='flag-5'>扫描仪</b>原理和应用

    泰来三维|如何轻松玩转三维扫描仪中手持快速扫描模式

    如何轻松玩转三维扫描仪中手持快速扫描模式,EinScan Pro 2X 2020系列EinScan Pro 2X plus三维扫描仪包含普通模式和精细模式
    的头像 发表于 01-11 15:44 436次阅读
    泰来三维|如何轻松玩转三维<b class='flag-5'>扫描仪</b>中手持快速<b class='flag-5'>扫描</b>模式

    泰来三维| FARO Orbis是如何与 Focus Premium 激光扫描仪一起协同工作

    Faro Orbis扫描仪能够同时提供移动扫描和固定式扫描。Orbis 扫描仪允许操作人员在行走和静止扫描之间进行无缝切换,同时连续获取36
    的头像 发表于 12-19 15:41 424次阅读

    蔡司激光手持三维扫描仪蓝光3D扫描仪问题探讨

    扫描仪厂家三本精密仪器,一起来探讨蔡司激光手持三维扫描仪蓝光3D扫描仪问题1:光学扫描受外部光源的影响有多大?解答:对外部光源需要稳定不在太阳光下即可,所以基本上所有车间都是满足需求
    的头像 发表于 12-14 15:44 997次阅读
    蔡司激光手持三维<b class='flag-5'>扫描仪</b>蓝光3D<b class='flag-5'>扫描仪</b>问题探讨

    蓝光三维扫描仪和激光扫描仪问题解答

    关于蓝光三维扫描仪和激光扫描仪问题解答,扫描仪厂家三本精密仪器讲解如下:问题1:蓝光和激光的扫描,效果哪个更好,两者有什么优缺点?解答:蓝光设备属于固定拍照式,精度较高,针对中小零件,
    的头像 发表于 12-14 15:08 933次阅读
    蓝光三维<b class='flag-5'>扫描仪</b>和激光<b class='flag-5'>扫描仪</b>问题解答

    多功能安全扫描仪工具介绍

    Trivy(发音)是一款全面且多功能的安全扫描仪。Trivy 拥有用于查找安全问题的扫描仪,以及可以找到这些问题的目标。 目标(Trivy 可以扫描的内容):
    的头像 发表于 12-13 10:20 725次阅读
    多功能安全<b class='flag-5'>扫描仪</b>工具介绍

    无缝切换,集移动和固定于一体的混合扫描仪-FARO Orbis 移动扫描仪

    rbis 有力地体现创新和扩大服务市场,兼有 FARO 技术和 GeoSlam 和 HoloBuilder所带来的功能。具有移动扫描仪不具备的功能和基于三脚架的激光扫描仪的精度,为 3D 现实捕获
    的头像 发表于 12-06 10:47 548次阅读
    无缝切换,集移动和固定于一体的混合<b class='flag-5'>扫描仪</b>-FARO Orbis 移动<b class='flag-5'>扫描仪</b>