0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用TensorFlow 2识别验证码过程中踩过的坑

Tensorflowers 来源:TensorFlow 作者:TensorFlow 2020-10-22 16:47 次阅读

在学习了 CNN 之后,我一直想去做一个验证码识别。网上找了很多资料,杂七杂八的一大堆,但是好多是 tf1 写的。我对 tf1 不太熟悉,于是自己开始了基于 TensorFlow 2 的摸索实践。

摸索的过程异常艰难,一开始我直接用 captcha 生成了 10080 张验证码去识别,发现 loss 一直停留在 2.3 左右,accuracy 一直是 0.1 左右,训练了 100 回合,也没什么提升,电脑都快要跑废了,咋办呀?于是网上各种问大佬,找到机会就提问,其中一位大佬的回答让我受到了启发,他说:你可以先识别 1 位,然后 2 位,3 位,最后 4 位,一步一步来……。

本文主要描述我在验证码识别过程中的一些摸索,整理出来以供大家参考:

第一回:搭建网络结构

首先我们需要搭建网络结构,如下:

model=tf.keras.models.Sequential([ tf.keras.Input(shape=(H, W, C)), layers.Conv2D(32, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Flatten(), layers.Dense(1024, activation='relu'), layers.Dense(D * N_LABELS, activation='softmax'), layers.Reshape((D, N_LABELS)), ]) model.compile(optimizer='adam', loss='categorical_crossentropy', metrics= ['accuracy']) callbacks=[ tf.keras.callbacks.TensorBoard(log_dir='logs'), tf.keras.callbacks.ModelCheckpoint(filepath=check_point_path, save_weights_only=True, save_best_only=True) ] history = model.fit(train_gen, steps_per_epoch=len(train_idx)//batch_size, epochs=100, callbacks=callbacks, validation_data=valid_gen, validation_steps=len(valid_idx)//valid_batch_size)

summary:

我的训练数据量:train count: 7408, valid count: 3176, test count: 4536

样本图:

训练结果:

Train for 231 steps, validate for 99 steps Epoch 1/100 1/231 […] - ETA: 4:18 - loss: 2.2984 - accuracy: 0.1328 231/231 [==============================] - 143s 618ms/step - loss: 2.3032 - accuracy: 0.0971 - val_loss: 2.3029 - val_accuracy: 0.0987 Epoch 2/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1014 231/231 [==============================] - 121s 525ms/step - loss: 2.3026 - accuracy: 0.1013 - val_loss: 2.3031 - val_accuracy: 0.0986 Epoch 3/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1029 231/231 [==============================] - 138s 597ms/step - loss: 2.3026 - accuracy: 0.1026 - val_loss: 2.3032 - val_accuracy: 0.0986 Epoch 4/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1031 231/231 [==============================] - 124s 537ms/step - loss: 2.3025 - accuracy: 0.1031 - val_loss: 2.3032 - val_accuracy: 0.0987 Epoch 5/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1040 231/231 [==============================] - 123s 532ms/step - loss: 2.3025 - accuracy: 0.1039 - val_loss: 2.3032 - val_accuracy: 0.0989 Epoch 6/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1039 231/231 [==============================] - 118s 509ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3033 - val_accuracy: 0.0988 … Epoch 20/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1038 231/231 [==============================] - 120s 521ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3034 - val_accuracy: 0.0988 Epoch 21/100 190/231 [=======================>…] - ETA: 20s - loss: 2.3025 - accuracy: 0.1032

loss 一直没有变化,accuracy 也很低,不知道出现了什么原因,困扰一两个星期,都想要放弃了,太难了。但是我不死心,非要把它搞出来,4 位识别不出来,能不能先识别一位呢?好,那就开始搞,一位比较简单,跟 Mnist 数据集很相似,在这我就不赘述了。

第二回:2 位彩色验证码训练

接着来识别 2 位的验证码。train count: 441, valid count: 189, test count: 270

样本图:

下面是我用 2 位验证码进行训练的结果:

30 张图片进行测试,结果:

哎呦,有感觉了,有了起色了,但是出现了过拟合的现象,解决过拟合的方法主要有:

Get more training data

Reduce the capacity of the network

Add weight regularization

Add dropout

Data-augmentation

Batch normalization

第三回:增加彩色验证码数据集

于是我就增加了数据集。train count: 4410, valid count: 1890, test count: 2700

然后又出现了 loss 一直在 2.3,accuracy 在 0.09 左右,这是什么鬼呢?但是我还是不死心呀,继续想办法呀,既然彩色的有难度,我先识别黑白的样本行不行呢,先试试吧。

第四回:2 位黑白验证码训练

网络结构依然采用上面的,input_shape(100,120,3)。

这是我用 2 位的黑白图片的验证码进行了训练,效果很好,收敛也很快。

训练第 50 回合时:

Epoch 50/50 26/27 [============>…] - ETA: 0s - loss: 0.0150 - accuracy: 0.9940 27/27 [==============] - 8s 289ms/step - loss: 0.0212 - accuracy: 0.9936 - val_loss: 0.2348 - val_accuracy: 0.9446

随机选取了 30 张图片进行了测试,2 张识别错了:

样本图:

看着这结果,我露出了洁白的大牙,信心大增呀,继续搞,直接上 4 位验证码。

第五回:4 位黑白验证码训练

依然采用上面的网络结构,这次使用的是 4 位黑白图片的验证码。train count: 2469, valid count: 1059, test count: 1512

训练第 20 回合:

Epoch 20/20 76/77 [====>.] - ETA: 0s - loss: 0.0409 - accuracy: 0.9860 77/77 [======] - 33s 429ms/step - loss: 0.0408 - accuracy: 0.9861 - val_loss: 0.3283 - val_accuracy: 0.9221

随机选取 30 张图片进行测试,8 张错误:

4 位验证码的样本图:

从结果来看,有点过拟合,没关系,继续加大数据集。

第六回:增加黑白验证码数据集

依旧采用上面的网络结构,这次我增加了数据集 4939 张,依旧使用的是 4 位黑白的验证码,训练结果还是挺好的:train count: 4939, valid count: 2117, test count: 3024

第 20 回合:

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0327 - accuracy: 0.9898 154/154 [====] - 75s 488ms/step - loss: 0.0329 - accuracy: 0.9898 - val_loss: 0.1057 - val_accuracy: 0.9740

可以看出 训练集的准确率 跟验证集上很接近,随机选取 30 张图片进行测试,6 张错误图如下:

好了,搞了这么多,由此我觉得是噪点影响了深度学习的识别,maxpool 的时候连带着噪点也采样了,我们需要将噪点处理掉,再喂入神经网络

第七回:预处理

在上面的推理中,我感觉是噪点影响了神经网络的识别,于是乎我在送入网络之前进行了去噪,二值化操作,训练如下:train count: 4939, valid count: 2117, test count: 3024

从图中可以看出,模型收敛了,但有点过拟合,第 20 回合训练结果如下:

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0407 - accuracy: 0.9861 154/154 [===] - 69s 450ms/step - loss: 0.0408 - accuracy: 0.9860 - val_loss: 0.3227 - val_accuracy: 0.9244

随机选取了 30 张图片进行了测试,8 张错误:

做到这里, 我对之前的推测有了猜疑:是噪点影响的吗?我觉得不完全是。核心原因是我在尝试的过程中对验证码进行了处理,从 RGB 的验证码变成了单通道的黑白验证码,使得图片的信息减少了,神经网络的计算量也大大减少了,网络模型很快得到了收敛,loss 显著减少,accuracy 在不断提高。

整个过程是使用 CPU 进行训练的,电脑配置是 Intel_Corei7-6700HQ_CPU@_2.60GHz,8G 内存。如果大家的电脑配置高,用 GPU 进行训练,我觉得即使不做预处理,效果也能出来。


责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cnn
    cnn
    +关注

    关注

    3

    文章

    353

    浏览量

    22245
  • tensorflow
    +关注

    关注

    13

    文章

    329

    浏览量

    60540
  • 验证码
    +关注

    关注

    2

    文章

    20

    浏览量

    4722

原文标题:经验总结:使用 TensorFlow 2 识别验证码过程中踩过的坑

文章出处:【微信号:tensorflowers,微信公众号:Tensorflowers】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ADC高速采样电路设计详解之STM32

    一、过程 最近用STM32F334做数字电源,用到了高速ADC采集电压电流。设计的参考电压VREF为3.3V,输入信号经运放跟随后直接接入单片机的采样通道。一开始测试一切正常,但随着输入信号
    的头像 发表于 12-02 09:27 901次阅读
    ADC高速采样电路设计详解之STM32<b class='flag-5'>踩</b><b class='flag-5'>坑</b>

    工业视觉在条码/二维识别领域的应用

    。以下是工业视觉在条码/二维识别领域的具体应用实例:质量追溯和召回过程简化:条形码常用于产品外包装应用跟踪,使召回的产品能够尽快被识别,简化召回的
    的头像 发表于 11-18 16:28 272次阅读
    工业视觉在条码/二维<b class='flag-5'>码</b><b class='flag-5'>识别</b>领域的应用

    在学习go语言的过程

    作为一个5年的phper,这两年公司和个人都在顺应技术趋势,新项目慢慢从php转向了go语言,从2021年到现在,笔者手上也先后开发了两个go项目。在学习go语言的过程中也学习并总结了一些相关的东西,这篇文章就分享下自己的一
    的头像 发表于 11-11 09:22 172次阅读

    物联网产品在生产测试过程中快速读取贴片SIM卡号的方案

    一、物联网行业存在的问题 蜂窝通信模组相关的开发项目过程中,经常使用到2mm*2mm, 5mm*6mm物联网贴片卡,由于贴片卡无法向普通插拔卡那样, 将卡号打印在卡板上
    的头像 发表于 09-23 16:14 321次阅读
    物联网产品在生产测试<b class='flag-5'>过程中</b>快速读取贴片SIM卡号的方案

    康谋分享 | 在基于场景的AD/ADAS验证过程中识别挑战性场景!

    基于场景的验证是AD/ADAS系统开发过程中的重要步骤,然而面对海量驾驶记录数据时,如何实现自动且高效地识别、分类和提取驾驶记录的挑战性场景?本文康谋为您介绍IVEX软件
    的头像 发表于 08-28 10:16 1098次阅读
    康谋分享 | 在基于场景的AD/ADAS<b class='flag-5'>验证</b><b class='flag-5'>过程中</b>,<b class='flag-5'>识别</b>挑战性场景!

    请问AFE032使用过程中冲和振铃问题怎么解决?

    在使用AFE032发送信号的过程中,发现在配置TX_PGA以及PA的寄存器时,均会产生一个冲。我们使用并没有使用AFE032的内部DAC,但是断开DAC以及AFE032的后级电路,开关TX_PGA以及PA均会产生过冲,请问是器件本身的问题还是寄存器配置的问题呢? AF
    发表于 08-08 06:08

    如何在Tensorflow实现反卷积

    TensorFlow实现反卷积(也称为转置卷积或分数步长卷积)是一个涉及多个概念和步骤的过程。反卷积在深度学习领域,特别是在图像分割、图像超分辨率、以及生成模型(如生成对抗网络GANs)等任务
    的头像 发表于 07-14 10:46 656次阅读

    电容充放电过程中电压的变化规律

    电容充放电过程中电压的变化规律是一个非常重要的电子学课题,涉及到电容器的基本工作原理和特性。在这篇文章,我们将详细探讨电容充放电过程中电压的变化规律,包括电容的基本特性、充电过程、放
    的头像 发表于 07-11 09:43 5996次阅读

    M16连接器12芯采购如何避免

      德索工程师说道在M16连接器12芯的采购过程中,为了避免,确保采购的顺利进行以及产品的高质量,我们可以从以下几个方面进行考虑和规划:
    的头像 发表于 06-07 17:46 814次阅读
    M16连接器12芯采购如何避免<b class='flag-5'>踩</b><b class='flag-5'>坑</b>

    家庭路由器如何选?实用技巧让你不再

    家庭路由器选购需考虑需求、预算、性能指标、硬件配置、软件功能、认证与测试及售后服务。明确需求,选择适合的型号和品牌,确保网络稳定、高速。遵循这些技巧,避免,享受网络便利。
    的头像 发表于 04-29 11:38 683次阅读

    痛苦“电池电压侦测电路”,含泪总结设计要点

    和大家分享这个电路的设计要点,以及当时的设计失误,帮助大家积累经验,以后不要这种。 设计要点一:设定分压电阻的大小 这种便携式掌上阅读器,当然是内置锂电池的:
    的头像 发表于 04-07 14:31 3580次阅读
    痛苦<b class='flag-5'>踩</b><b class='flag-5'>坑</b>“电池电压侦测电路”,含泪总结设计要点

    IGBT模块封装过程中的技术详解

    IGBT 模块封装采用了胶体隔离技术,防止运行过程中发生爆炸;第二是电极结构采用了弹簧结构,可以缓解安装过程中对基板上形成开裂,造成基板的裂纹;第三是对底板进行加工设计,使底板与散热器紧密接触,提高了模块的热循环能力。
    发表于 04-02 11:12 1177次阅读
    IGBT模块封装<b class='flag-5'>过程中</b>的技术详解

    工业制造行业的DPM识读要如何选择固定读器?

    在工业制造行业,DPM是一种常见的标识方式,它是将信息直接标记在产品表面上,以便在生产过程中进行追踪和识别。不言而喻,在如今的产品质量追溯管理应用上,需要对多种复杂条码进行
    的头像 发表于 03-06 13:52 665次阅读
    工业制造行业<b class='flag-5'>中</b>的DPM<b class='flag-5'>码</b>识读要如何选择固定读<b class='flag-5'>码</b>器?

    高低温试验箱选购指南—防秘籍

    选购高低温试验箱需要综合考虑多方面因素。通过明确需求、选择知名品牌、对比性能指标、权衡价格与性价比、保障售后服务以及参考用户评价与案例等步骤,可以帮助您避免风险,选购到一款性价比高、适合自己需求的高低温试验箱。
    的头像 发表于 02-24 09:22 606次阅读
    高低温试验箱选购指南—防<b class='flag-5'>踩</b><b class='flag-5'>坑</b>秘籍

    基于TensorFlow和Keras的图像识别

    TensorFlow和Keras最常见的用途之一是图像识别/分类。通过本文,您将了解如何使用Keras达到这一目的。定义如果您不了解图像识别的基本概念,将很难完全理解本文的内容。因此在正文开始之前
    的头像 发表于 01-13 08:27 844次阅读
    基于<b class='flag-5'>TensorFlow</b>和Keras的图像<b class='flag-5'>识别</b>