使用TensorFlow 2识别验证码过程中踩过的坑-电子发烧友网

在学习了 CNN 之后，我一直想去做一个验证码识别。网上找了很多资料，杂七杂八的一大堆，但是好多是 tf1 写的。我对 tf1 不太熟悉，于是自己开始了基于 TensorFlow 2 的摸索实践。

摸索的过程异常艰难，一开始我直接用 captcha 生成了 10080 张验证码去识别，发现 loss 一直停留在 2.3 左右，accuracy 一直是 0.1 左右，训练了 100 回合，也没什么提升，电脑都快要跑废了，咋办呀？于是网上各种问大佬，找到机会就提问，其中一位大佬的回答让我受到了启发，他说：你可以先识别 1 位，然后 2 位，3 位，最后 4 位，一步一步来……。

本文主要描述我在验证码识别过程中的一些摸索，整理出来以供大家参考：

第一回：搭建网络结构

首先我们需要搭建网络结构，如下：

model=tf.keras.models.Sequential([ tf.keras.Input(shape=(H, W, C)), layers.Conv2D(32, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Conv2D(64, 3, activation='relu'), layers.MaxPooling2D((2, 2)), layers.Flatten(), layers.Dense(1024, activation='relu'), layers.Dense(D * N_LABELS, activation='softmax'), layers.Reshape((D, N_LABELS)), ]) model.compile(optimizer='adam', loss='categorical_crossentropy', metrics= ['accuracy']) callbacks=[ tf.keras.callbacks.TensorBoard(log_dir='logs'), tf.keras.callbacks.ModelCheckpoint(filepath=check_point_path, save_weights_only=True, save_best_only=True) ] history = model.fit(train_gen, steps_per_epoch=len(train_idx)//batch_size, epochs=100, callbacks=callbacks, validation_data=valid_gen, validation_steps=len(valid_idx)//valid_batch_size)

summary:

我的训练数据量：train count: 7408, valid count: 3176, test count: 4536

样本图：

训练结果：

Train for 231 steps, validate for 99 steps Epoch 1/100 1/231 […] - ETA: 4:18 - loss: 2.2984 - accuracy: 0.1328 231/231 [==============================] - 143s 618ms/step - loss: 2.3032 - accuracy: 0.0971 - val_loss: 2.3029 - val_accuracy: 0.0987 Epoch 2/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1014 231/231 [==============================] - 121s 525ms/step - loss: 2.3026 - accuracy: 0.1013 - val_loss: 2.3031 - val_accuracy: 0.0986 Epoch 3/100 230/231 [============================>.] - ETA: 0s - loss: 2.3026 - accuracy: 0.1029 231/231 [==============================] - 138s 597ms/step - loss: 2.3026 - accuracy: 0.1026 - val_loss: 2.3032 - val_accuracy: 0.0986 Epoch 4/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1031 231/231 [==============================] - 124s 537ms/step - loss: 2.3025 - accuracy: 0.1031 - val_loss: 2.3032 - val_accuracy: 0.0987 Epoch 5/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1040 231/231 [==============================] - 123s 532ms/step - loss: 2.3025 - accuracy: 0.1039 - val_loss: 2.3032 - val_accuracy: 0.0989 Epoch 6/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1039 231/231 [==============================] - 118s 509ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3033 - val_accuracy: 0.0988 … Epoch 20/100 230/231 [============================>.] - ETA: 0s - loss: 2.3025 - accuracy: 0.1038 231/231 [==============================] - 120s 521ms/step - loss: 2.3025 - accuracy: 0.1038 - val_loss: 2.3034 - val_accuracy: 0.0988 Epoch 21/100 190/231 [=======================>…] - ETA: 20s - loss: 2.3025 - accuracy: 0.1032

loss 一直没有变化，accuracy 也很低，不知道出现了什么原因，困扰一两个星期，都想要放弃了，太难了。但是我不死心，非要把它搞出来，4 位识别不出来，能不能先识别一位呢？好，那就开始搞，一位比较简单，跟 Mnist 数据集很相似，在这我就不赘述了。

第二回：2 位彩色验证码训练

接着来识别 2 位的验证码。train count: 441, valid count: 189, test count: 270

样本图：

下面是我用 2 位验证码进行训练的结果：

30 张图片进行测试，结果：

哎呦，有感觉了，有了起色了，但是出现了过拟合的现象，解决过拟合的方法主要有：

Get more training data

Reduce the capacity of the network

Add weight regularization

Add dropout

Data-augmentation

Batch normalization

第三回：增加彩色验证码数据集

于是我就增加了数据集。train count: 4410, valid count: 1890, test count: 2700

然后又出现了 loss 一直在 2.3，accuracy 在 0.09 左右，这是什么鬼呢？但是我还是不死心呀，继续想办法呀，既然彩色的有难度，我先识别黑白的样本行不行呢，先试试吧。

第四回：2 位黑白验证码训练

网络结构依然采用上面的，input_shape(100,120,3)。

这是我用 2 位的黑白图片的验证码进行了训练，效果很好，收敛也很快。

训练第 50 回合时：

Epoch 50/50 26/27 [============>…] - ETA: 0s - loss: 0.0150 - accuracy: 0.9940 27/27 [==============] - 8s 289ms/step - loss: 0.0212 - accuracy: 0.9936 - val_loss: 0.2348 - val_accuracy: 0.9446

随机选取了 30 张图片进行了测试，2 张识别错了：

样本图：

看着这结果，我露出了洁白的大牙，信心大增呀，继续搞，直接上 4 位验证码。

第五回：4 位黑白验证码训练

依然采用上面的网络结构，这次使用的是 4 位黑白图片的验证码。train count: 2469, valid count: 1059, test count: 1512

训练第 20 回合：

Epoch 20/20 76/77 [====>.] - ETA: 0s - loss: 0.0409 - accuracy: 0.9860 77/77 [======] - 33s 429ms/step - loss: 0.0408 - accuracy: 0.9861 - val_loss: 0.3283 - val_accuracy: 0.9221

随机选取 30 张图片进行测试，8 张错误：

4 位验证码的样本图：

从结果来看，有点过拟合，没关系，继续加大数据集。

第六回：增加黑白验证码数据集

依旧采用上面的网络结构，这次我增加了数据集 4939 张，依旧使用的是 4 位黑白的验证码，训练结果还是挺好的：train count: 4939, valid count: 2117, test count: 3024

第 20 回合：

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0327 - accuracy: 0.9898 154/154 [====] - 75s 488ms/step - loss: 0.0329 - accuracy: 0.9898 - val_loss: 0.1057 - val_accuracy: 0.9740

可以看出训练集的准确率跟验证集上很接近，随机选取 30 张图片进行测试，6 张错误图如下：

好了，搞了这么多，由此我觉得是噪点影响了深度学习的识别，maxpool 的时候连带着噪点也采样了，我们需要将噪点处理掉，再喂入神经网络。

第七回：预处理

在上面的推理中，我感觉是噪点影响了神经网络的识别，于是乎我在送入网络之前进行了去噪，二值化操作，训练如下：train count: 4939, valid count: 2117, test count: 3024

从图中可以看出，模型收敛了，但有点过拟合，第 20 回合训练结果如下：

Epoch 20/20 153/154 [==>.] - ETA: 0s - loss: 0.0407 - accuracy: 0.9861 154/154 [===] - 69s 450ms/step - loss: 0.0408 - accuracy: 0.9860 - val_loss: 0.3227 - val_accuracy: 0.9244

随机选取了 30 张图片进行了测试，8 张错误：

做到这里，我对之前的推测有了猜疑：是噪点影响的吗？我觉得不完全是。核心原因是我在尝试的过程中对验证码进行了处理，从 RGB 的验证码变成了单通道的黑白验证码，使得图片的信息减少了，神经网络的计算量也大大减少了，网络模型很快得到了收敛，loss 显著减少，accuracy 在不断提高。

整个过程是使用 CPU 进行训练的，电脑配置是 Intel_Corei7-6700HQ_CPU@_2.60GHz，8G 内存。如果大家的电脑配置高，用 GPU 进行训练，我觉得即使不做预处理，效果也能出来。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

cnn

cnn

+关注

关注
3

文章
353

浏览量
22245
tensorflow

tensorflow

+关注

关注
13

文章
329

浏览量
60540
验证码

验证码

+关注

关注
2

文章
20

浏览量
4722

原文标题：经验总结：使用 TensorFlow 2 识别验证码过程中踩过的坑

文章出处：【微信号：tensorflowers，微信公众号：Tensorflowers】欢迎添加关注！文章转载请注明出处。

ADC高速采样电路设计详解之STM32踩坑

一、踩坑过程最近用STM32F334做数字电源，用到了高速ADC采集电压电流。设计的参考电压VREF为3.3V，输入信号经运放跟随后直接接入单片机的采样通道。一开始测试一切正常，但随着输入信号

发表于 12-02 09:27 •901次阅读

ADC高速采样电路设计详解之STM32<b class='flag-5'>踩</b><b class='flag-5'>坑</b>

工业视觉在条码/二维码识别领域的应用

。以下是工业视觉在条码/二维码识别领域的具体应用实例：质量追溯和召回过程简化：条形码常用于产品外包装应用跟踪，使召回的产品能够尽快被识别，简化召回的

发表于 11-18 16:28 •272次阅读

在学习go语言的过程踩过的坑

作为一个5年的phper，这两年公司和个人都在顺应技术趋势，新项目慢慢从php转向了go语言，从2021年到现在，笔者手上也先后开发了两个go项目。在学习go语言的过程中也学习并总结了一些相关的东西，这篇文章就分享下自己踩过的一

发表于 11-11 09:22 •172次阅读

物联网产品在生产测试过程中快速读取贴片SIM卡号的方案

一、物联网行业中存在的问题蜂窝通信模组相关的开发项目过程中，经常使用到2mm*2mm， 5mm*6mm物联网贴片卡，由于贴片卡无法向普通插拔卡那样，将卡号打印在卡板上

发表于 09-23 16:14 •321次阅读

康谋分享 | 在基于场景的AD/ADAS验证过程中，识别挑战性场景！

基于场景的验证是AD/ADAS系统开发过程中的重要步骤，然而面对海量驾驶记录数据时，如何实现自动且高效地识别、分类和提取驾驶记录中的挑战性场景？本文康谋为您介绍IVEX软件

发表于 08-28 10:16 •1098次阅读

请问AFE032使用过程中的过冲和振铃问题怎么解决？

在使用AFE032发送信号的过程中，发现在配置TX_PGA以及PA的寄存器时，均会产生一个过冲。我们使用并没有使用AFE032的内部DAC，但是断开DAC以及AFE032的后级电路，开关TX_PGA以及PA均会产生过冲，请问是器件本身的问题还是寄存器配置的问题呢？ AF

发表于 08-08 06:08

如何在Tensorflow中实现反卷积

在TensorFlow中实现反卷积（也称为转置卷积或分数步长卷积）是一个涉及多个概念和步骤的过程。反卷积在深度学习领域，特别是在图像分割、图像超分辨率、以及生成模型（如生成对抗网络GANs）等任务

发表于 07-14 10:46 •656次阅读

电容充放电过程中电压的变化规律

电容充放电过程中电压的变化规律是一个非常重要的电子学课题，涉及到电容器的基本工作原理和特性。在这篇文章中，我们将详细探讨电容充放电过程中电压的变化规律，包括电容的基本特性、充电过程、放

发表于 07-11 09:43 •5996次阅读

M16连接器12芯采购如何避免踩坑

　　德索工程师说道在M16连接器12芯的采购过程中，为了避免踩坑，确保采购的顺利进行以及产品的高质量，我们可以从以下几个方面进行考虑和规划：

发表于 06-07 17:46 •814次阅读

家庭路由器如何选？实用技巧让你不再踩坑！

家庭路由器选购需考虑需求、预算、性能指标、硬件配置、软件功能、认证与测试及售后服务。明确需求，选择适合的型号和品牌，确保网络稳定、高速。遵循这些技巧，避免踩坑，享受网络便利。

发表于 04-29 11:38 •683次阅读

痛苦踩坑“电池电压侦测电路”，含泪总结设计要点

和大家分享这个电路的设计要点，以及当时的设计失误，帮助大家积累经验，以后不要踩这种坑。设计要点一：设定分压电阻的大小这种便携式掌上阅读器，当然是内置锂电池的：

发表于 04-07 14:31 •3580次阅读

IGBT模块封装过程中的技术详解

IGBT 模块封装采用了胶体隔离技术，防止运行过程中发生爆炸;第二是电极结构采用了弹簧结构，可以缓解安装过程中对基板上形成开裂，造成基板的裂纹;第三是对底板进行加工设计，使底板与散热器紧密接触，提高了模块的热循环能力。

发表于 04-02 11:12 •1177次阅读

工业制造行业中的DPM码识读要如何选择固定读码器？

在工业制造行业中，DPM码是一种常见的标识方式，它是将信息直接标记在产品表面上，以便在生产过程中进行追踪和识别。不言而喻，在如今的产品质量追溯管理应用上，需要对多种复杂条码进行

发表于 03-06 13:52 •665次阅读

高低温试验箱选购指南—防踩坑秘籍

选购高低温试验箱需要综合考虑多方面因素。通过明确需求、选择知名品牌、对比性能指标、权衡价格与性价比、保障售后服务以及参考用户评价与案例等步骤，可以帮助您避免踩坑风险，选购到一款性价比高、适合自己需求的高低温试验箱。

发表于 02-24 09:22 •606次阅读

基于TensorFlow和Keras的图像识别

TensorFlow和Keras最常见的用途之一是图像识别/分类。通过本文，您将了解如何使用Keras达到这一目的。定义如果您不了解图像识别的基本概念，将很难完全理解本文的内容。因此在正文开始之前

发表于 01-13 08:27 •844次阅读