什么是OCR

OCR的英文全称：

OCR是英文Optical Charac ter Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息，利用各种模式识别算法分析文字形态特征，判断出汉字的标准编码，并按通用格式存储在文本文件中，所以，OCR是一种非常快捷、省力的文字输入方式，也是在文字量比较大的今天，很受人们欢迎的一种输入方式。

OCR的发展简况

OCR的概念是在1929年由德国科学家Tausheck最先提出来的，后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy，1966年他们发表了第一篇关于汉字识别的文章，采用了模板匹配法识别了1000个印刷体汉字。

20世纪70年代初，日本的学者开始研究汉字识别，并做了大量的工作。我国研究汉字识别的起步比较晚，20世纪70年代末才开始进行OCR的研究工作。早期的OCR软件，由于识别率及产品化等多方面的因素，未能达到实际要求。同时，由于硬件设备成本高，运行速度慢，也没有达到实用的程度。只有个别部门，如信息部门、新闻出版单位等使用OCR软件。1986年以后我国的OCR研究有了很大进展，在汉字建模和识别方法上都有所创新，在系统研制和开发应用中都取得了丰硕的成果，不少单位相继推出了中文OCR产品。进入20世纪90年代以后，随着平台式扫描仪的广泛应用，以及我国信息自动化和办公自动化的普及，大大推动了OCR技术的进一步发展，使OCR的识别正确率、识别速度满足了广大用户的要求。

目前，比较流行的OCR软件很多，英文OCR主要有OmniPage，中文OCR主要有清华紫光OCR、清华文通OCR、汉王OCR、中晶尚书OCR、丹青OCR、蒙恬OCR等。尽管汉字字量大、字形复杂，但OCR技术已经走向成熟。许多OCR软件不仅能识别黑白印刷体汉字，还能识别灰度和彩色印刷体汉字，识别速度很快，识别正确率达到了99％以上；可识别宋体、黑体、楷体等多种字体的简、繁体；可对多种字体、不同字号的混排进行识别；有些OCR软件还能识别图像、表格。与此同时，对于手写体汉字识别的研究也取得了很大进展，正确识别率已达到了70％以上。

OCR软件的应用

在扫描仪市场上，许多类型的办公和家用扫描仪均配有OCR软件，如紫光的扫描仪配备了紫光O

CR，中晶的扫描仪配备了尚书OCR，Mustek的扫描仪配备了丹青OCR等。扫描仪与OCR软件共同承担着从文稿的输入到文字识别的全过程。

文稿扫描在办公领域中经常用到，即将报纸、杂志等媒体上刊载的有关文稿通过扫描仪进行扫描，随后进行OCR识别，或存储成图像文件，留待以后进行OCR识别，将图像文件转换成文本文件或Word文件进行存储。

此外，数字化信息的存储、传输、不仅成本低、效率高，而且能够适应排版，网络传输等不断发展的需要。目前我国有很多历史遗留下来的大量图书、报刊、杂志等纸质珍品，急需将其转换成电子信息。如电子图书馆的建立，就需要将图书逐页扫描，加上OCR软件的识别，更替代了人工键入文字的工作，大大缩短了录入时间，减轻了劳动强度，节省了人力且降低了费用，提高了录入正确率、工作效率和现代办公自动化程度。

目前OCR软件与扫描仪的搭配已应用到信息化时代的多个领域，如数字化图书馆，各种报表的识别，以及银行、税务系统票据的识别等。随着网络化、信息化的发展与普及，其应用范围将越来越广泛。

OCR系统的组成

汉字识别软件OCR的功能是将各种录入汉字、印刷体或手写体中每个汉字的图形或图像通过计算机辨认出来，并标出汉字类别代码。因此，汉字识别归根结底是一个图像识别问题。由于汉字信息量很大，具有不同的字形、字体，而且结构复杂，因此汉字识别的过程极其复杂。

由于扫描仪的普及与广泛应用，OCR软件只需提供与扫描仪的接口，利用扫描仪驱动软件即可。因此，OCR软件主要是由图像处理模块、版面划分模块、文字识别模块和文字编辑模块等4部分组成。

1、图像处理模块

图像处理模块主要具有文稿扫描、图像缩放、图像旋转等功能。通过扫描仪输入后，文稿形成图像文件，图像处理模块可对图像进行放大，去除污点和划痕，如果图像放置不正，可以手工或自动旋转图像，目的是为文字识别创造更好的条件，使识别率更高。

2、版面划分模块

版面划分模块主要包括版面划分、更改划分，即对版面的理解、字切分、归一化等，可选择自动或手动两种版面划分方式。目的是告诉OCR软件将同一版面的文章、表格等分开，以便于分别处理，并按照怎样的顺序进行识别。

3、文字识别模块

文字识别模块是OCR软件的核心部分，文字识别模块主要对输入的汉字进行"阅读"，但不能一目多行，必须逐行切割，对于汉字通常也是一个字一个字地辨认，即单字识别，再进行归一化。文字识别模块通过对不同样本汉字的特征进行提取，完成识别，自动查找可疑字，具有前后联想等功能。

4、文字编辑模块

文字编辑模块主要对OCR识别后的文字进行修改、编辑，如系统识别认为有误，则文字会以醒目的红色或蓝色显示，并提供相似的文字供选择，选择编辑器供输出等。

OCR软件的使用方法

OCR软件的种类虽然很多，但其使用方法大同小异。首先要对文稿进行扫描，然后进行OCR识别。OCR软件的使用方法如下：

1、文稿扫描

为了利用OCR软件进行文字识别，可直接在OCR软件中扫描文稿。运行OCR软件后，会出现OCR软件界面。

将要扫描的文稿放在扫描仪的玻璃面上，使要扫描的一面朝向扫描仪的玻璃面并让文稿的上端朝下，与标尺边缘对齐，再将扫描仪盖上，即可准备扫描。点击视窗中的"扫描"键，即可进入扫描驱动软件进行扫描，有关扫描方法这里不再赘述。但应注意的是：分辨力可设置在200～400dpi，对于文本文档，调整亮度适中很关键。扫描后的文档图像出现在OCR软件视窗中。

2、OCR识别

为了便于操作，可从菜单中选择选项，各种图标出现在视窗的左边。

为了更好使用，首先从上到下介绍画面左边的图标：

"放大"工具：用于放大图像；"缩小"工具：用于缩小图像；"设定识别区域"工具：用于设定识别区域；"设定识别顺序"工具：用于设定识别顺序；"删除识别区域"工具：用于删除识别区域；"擦除图像杂点"工具：用于擦除图像中的杂点；"擦拭图像块"工具：用于擦除图像中的某一区域；"旋转图像"工具：用于将图像旋转90°、180°或270°；"倾斜校正"工具：用于手动图像倾斜校正。

OCR识别的一般步骤：

(1)文稿扫描后，刚开始出现在视窗中的要识别的文字画面很小，首先选择"放大"工具，对画面进行适当放大，以使画面看得更清楚。必要时还可以选择"缩小"工具，将画面适当缩小。

(2)如果画面需要旋转90°，180°或270°，可使用"旋转图像"工具旋转图像。如果文字画面倾斜，可选择"倾斜校正"工具，将画面调正。

(3)识别时选择"设定识别区域"工具，在文字画面上框出要识别的区域，这时也可根据画面情况框出多个区域。如果所框区域有误，则可使用"删除识别区域"工具，删除所选识别区域。

(4)为了提高识别率，如果所选识别区有杂点或有不能识别的图像，则可选择"擦除图像杂点"工具，将杂点一点一点地擦除。如果需要成片地擦除，则可选择"擦拭图像块"工具。

(5)点击"识别"图标，则OCR显示正在进行文字切分，然后转入"正在识别"画面，将识别的文字逐步显示出来，"文稿校对"窗口。

许多OCR软件都具有文字修改功能，被识别出可能有错误的文字，用比较鲜明的颜色显示出来，并且可以进行修改。

(6)将识别后的文件存储成文本(TXT)文件或Word的RTF文件。

阅读全文

OCR(16048) OCR(16048)

flutter_ocr Flutter开发的OCR软件

./oschina_soft/flutter_ocr.zip

2022-06-24 14:43:41

OCR实战教程

OCR 是光学字符识别（英语：Optical Character Recognition，OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。

2023-02-24 10:36:16

436

树洞OCR文字识别跨平台的OCR小工具

./oschina_soft/tools-ocr.zip

2022-05-30 09:42:22

OpenHarmony集成OCR三方库实现文字提取

1. 简介Tesseract(Apache 2.0 License)是一个可以进行图像OCR识别的C++库，可以跨平台运行。本样例基于Tesseract库进行适配，使其可以运行在OpenAtom

2022-11-15 12:09:50

OCR识别技术

在爬虫对验证码进行破解时，经常需要对图片中的文字内容进行识别，这时就需要用到OCR技术了，那么 OCR识别技术是如何实现对文字内容“即拍即得”的呢？

2021-03-12 09:07:15

3841

输液袋喷码OCR字符检测# 机器视觉# OCR识别# 自动化检测# 喷码字符检测

OCR

fuweizn发布于 2023-04-17 15:53:01

基于FPGA的OCR文字识别技术的深度解析

OCR在通用文字识别等场景下有广泛应用，基于FPGA异构加速的OCR识别相比CPU/GPU实现具有延时小、成本低的优势。我们设计了多FPGA芯片协同的异构加速架构，能快速适配业务OCR模型变化，检测

2018-01-26 12:19:00

3457

使用数字识别和AI实现OCR的资料合集

本文档的主要内容详细介绍的是使用数字识别和AI实现OCR的资料合集。

2020-07-17 08:00:00

OCR光学图文识别

使用OCR功能，您可以简单地将扫描的PDF和基于图像的PDF转换为具有可编辑、可选择和可搜索内容的各种格式，例如MicrosoftOffice格式、PPT、页面或纯文本文档（TXT文件）。

2022-08-19 15:23:37

494

开源OCR 过程介绍

不久前，百度技术团队在不久前，百度技术团队在 GitHub 上正式开源了一款 OCR 神器，在发布后不久便多次冲上 GitHub Trending 榜单，引起了技术圈内开发者的热议，今天就跟大家好

2020-10-30 10:54:39

2904

darknet-ocr中文自然场景文字检测及识别

./oschina_soft/darknet-ocr.zip

2022-06-17 15:07:29

大模型时代的OCR，“CPU” 的味道更重了

金磊杨净发自凹非寺量子位 | 公众号 QbitAI 经典技术 OCR （光学字符识别），在大模型时代下要“变味”了。怎么说？我们都知道OCR这个技术在日常生活中已经普及开了，像各类

2023-07-08 14:25:02

140

移动端证件OCR识别/安卓IOS平台

一、证件识别/证件OCR介绍移动端证件识别是开发的基于移动平台的证件识别/证件OCR应用程序，支持Android、iOS等多种主流移动操作系统。该产品采用手机、平板电脑摄像头拍摄证件图像，然后通过

2018-06-15 15:42:05

159

基于传统算法的OCR技术

对于文字识别，实际中一般首先需要通过文字检测定位文字在图像中的区域，然后提取区域的序列特征，在此基础上进行专门的字符识别。但是随着CV发展，也出现很多端到端的End2End OCR。

2022-06-20 14:31:40

1544

基于模板匹配的OCR盲人导读仪器（STM32+OV5640）

基于模板匹配的OCR盲人导读仪器（STM32F407+OV5640）

2017-12-11 16:39:53

OCR算法能较好识别水平排布的常规文本

OCR技术发展到今天，对于常规文本的识别已经达到了较高的准确率。

2022-08-08 16:04:51

946

OCR文字识别视觉检测系统应用程序免费下载

本文档的主要内容详细介绍的是OCR文字识别视觉检测系统应用程序免费下载。

2020-05-28 17:31:00

TH-OCR文字识别系统介绍

TH-OCR文字识别系统的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息，OCR文字识别系统实际上是让计算机认字，实现文字自动输入。

2011-12-27 16:04:16

1952

关于开放平台OCR上线印刷文字识别的介绍

我们为什么用OCR？因为可以快速将文字转为可在设备上编辑的数字文本。因此能够得到用户青睐的OCR小编认为应能够准确生成文本，所见即所得，同时对不同字体，不同环境，不同颜色形状的文本准确识别。

2019-09-27 09:51:31

2242

机器视觉运动控制一体机应用例程|OCR字符识别应用

应用背景 OCR字符识别的应用场景非常广泛，例如在生产型企业领域中，OCR具有多样性的应用，比如读取仪表仪器上的文本，进行实时监控、读取产品上的生产日期、批号，以此来获得产品的信息和可追溯产品当天

2022-02-24 17:27:33

1063

基于人工智能技术的OCR应用

光学字符识别（Optical Character Recognition，OCR）是将图像中的文字信息转化为可供计算机处理的字符信息的技术，发挥着计算机“眼睛”的功能，是机器与现实世界进行视觉交互的重要技术基础。

2021-04-09 10:54:11

6759

关于OCR 你想了解的可能都在这儿了

导读 OCR中的研究，工具和挑战，都在这儿了。介绍我喜欢OCR(光学字符识别)。对我来说，它代表了数据科学，尤其是计算机视觉的真正挑战。这是一个现实世界的问题，它有很多方法，包括计算机视觉

2021-04-26 13:43:53

5970

PDF执行OCR使用指南（仅适用于万兴PDF专业版）

然后单击“更改选择”按钮，从OCR语言列表中选择匹配PDF内容的正确语言（万兴PDF支持超过20种OCR语言）。您也可以点击“自定义页面”来选择单个页面或几个页面执行OCR。

2023-06-06 15:54:57

717

TensorRT和Triton助力微信OCR降低耗时和成本

通过使用NVIDIA的TensorRT对微信识物和OCR的模型进行加速，在降低单次推理时延50%以上的同时，节约了多达64%的显存。

2022-04-13 14:44:26

1272

基于FPGA异构加速的OCR识别技术解析

目前OCR技术在证件识别、快递单扫描、信息安全审核等领域有着广泛的应用。架构平台部FPGA团队研发的OCR硬件加速解决方案，提供低成本、实时性AI计算加速，将持续助力公司内各业务发展。在云端

2017-12-14 05:32:44

2518

机器视觉中OCR印字检测的类型有哪些

越来越多企业需要进行残次品的检测以来保证产品的质量的。无论的工业产品还是纺织产品在生产中都难免会有瑕疵的出现，用人工检测会有许多的不足。所以我们就越来越多的选择机器视觉来代替人工。OCR也是视觉检测的一种，今天我们就来谈谈OCR检测吧。

2021-10-09 17:19:50

472

Tesseract-OCR中如何实现结构化的文档分析

主要是介绍用它做项目时候需要注意的问题与一些比较重要的函数使用。主要介绍一下Tesseract-OCR中如何实现结构化的文档分析以及相关区域的定位识别。

2023-01-12 14:05:08

777

触控面板为什么要用OCA&OCR贴合呢？

在贴合材料部分，目前业界采用的胶材可分为两大主流，一是固态的OCA光学胶，另一种则是液态的OCR光学胶贴合

2023-01-08 16:39:44

2726

如何让文本识别更加智能，数据堂获取这些OCR转写数据

近年来，学生党们拥有了一款新的学习神器拍照搜题。当遇到不会做的题目时，只需要对着题目拍照，手机中就会出现这道题目的详细解答思路和答案。拍照搜题背后的黑科技就是光学字符识别技术，即OCR。OCR是指

2020-09-17 11:34:07

1838

免费版文字识别系统 TH-OCR SDK11.0

电子发烧友网站提供《免费版文字识别系统 TH-OCR SDK11.0.exe》资料免费下载

2014-07-23 14:10:09

API-Shop-OCR-营业执照识别API接口Python调用示例代码说明

本文档的主要内容详细介绍的是API-Shop-OCR-营业执照识别API接口Python调用示例代码说明

2019-01-10 11:48:44

通过图像处理改善OCR识别结果的实例

本文主要介绍一个通过图像处理改善OCR识别结果的实例，并给出详细步骤和源码。 **背景介绍** 在很多情况下，文字识别会遇到困难。比如非单一的背景、杂讯干扰、文字部分缺失等。

2023-02-08 16:54:36

383

如何使用Python开发截图识别OCR的小工具

　你一定用过那种“OCR神器”，可以把图片中的文字提取出来，极大的提高工作效率。今天，我们就来做一款实时截图识别的小工具。顾名思义，运行程序时，可以实时的把你截出来的图片中的文字识别出来。

2020-01-04 11:27:00

3031

论文小助手【Lal_OCR工具】

gitee仓库地址： https://gitee.com/lalhan/LAL_OCR 一、产品需求（1）解决痛点 PDF文献翻译带换行，无法直接翻译（2）竞品体积大需安装随时不可用

2023-06-14 10:41:35

138

赋能AI测试 Testin云测与英特尔合作将OCR模型推理效率提升6倍

OCR 深度学习方案使用的都是 GPU，通过其强大的并行计算能力来提升文本推理能力。

2019-11-22 09:43:00

655

OCR光学字符识别技术原理讲解

　OCR （光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将

2019-03-02 13:49:56

19357

服务器端驾驶证/行驶证OCR拍照识别API

驾驶证/行驶证OCR拍照识别API即服务器版驾驶证/行驶证OCR拍照识别软件，该软件可部署在客户私有服务器中（私有本地服务器或云服务器均可），APP和业务系统可通过web service接口调用该

2018-06-22 17:08:06

244

在线研讨会 | 就在明天！NVIDIA TAO Toolkit 5.0 助力 OCR 视觉 AI 模型快速训练与优化

光学字符识别（OCR）技术是一种将纸质文档、PDF 文件或图像中的文本转换成机器可识别的格式的技术。它在许多领域都有广泛的应用，例如文档扫描、自动化数据输入、图书馆数字化等。然而，尽管 OCR

2023-08-21 21:05:05

143

企业智能化应用场景，华为云文字识别 OCR 值得一试

。想象一下，如果我们能够快速地提取出图片中的文本信息，并将其转化为结构化的数据，那么我们就能够实现很多智能化的应用场景，提升我们的业务效率和用户体验。这就是我为什么推荐华为云文字识别 OCR 的原因。 OCR 是什么？

2023-07-04 14:43:07

149

关于机器视觉OCR字符检测的应用

OCR字符采集检测具有非常广阔的市场需求。如今，机器视觉检测技术被广泛应用于工厂品检，在尺寸测量、外观缺陷检测、字符识别、定位等方面，极大地提高了生产自动化程度。接下来，昊天宸小编为大家介绍一下机器视觉检测技

2022-01-05 18:10:26

508

机器视觉检测—OCR字符检测的应用

工作人员的劳动强度，而且检测质量也难以得到保障。其次，则是效率低下，浪费时间成本。利用机器视觉技术进行OCR字符采集检测，能快速将该印品的标准图像（模板）相匹配比较，如果发现差异并超出设定的公差范围，即判定为

2021-11-18 15:54:38

492

包装袋喷码字符OCR视觉检测，助力食品行业高质量检测

包装袋喷码字符OCR视觉检测，实现对食品外包装日期喷码的漏码、错码、歪码、打码位置偏移等准确识别。

2023-03-27 14:54:26

575

OpenHarmony集成OCR三方库实现文字提取

观点 1. 简介 Tesseract(Apache 2.0 License)是一个可以进行图像OCR识别的C++库，可以跨平台运行。本样例基于Tesseract库进行适配，使其可以运行

2022-11-14 21:25:21

681

酸奶瓶盖喷码OCR字符检测，高效助力乳制品行业本降本增效

酸奶生产线应用OCR字符检测系统，企业可以高效地完成对产品的包装喷码检测，还可以正确读取产品的包装信息，从而对产品质量严格把关。

2022-12-20 10:48:55

带有OCR的监视摄像机对于车牌识别系统至关重要

我们甚至看到过带有OCR的监视摄像机，用于监视进出客户场所的有轨电车和拖车。这对客户来说是很有价值的，因为货运公司会在汽车卸货时在其财产上向客户收费。如果客户可以减少卸货时间，那么他们可以减少运营成本。

2020-09-02 16:55:33

2650

带带弟弟OCR通用验证码识别SDK免费开源版

在使用爬虫登录网站的时候，经常输入用户名和密码后会遇到验证码，简单一点的有字母验证码，复杂一点的有滑块验证码，点选文章和点选图片验证码。这些都是爬虫中的老大难问题，今天介绍一款通用验证码识别 SDK 对他们彻底说拜拜，它的名字是 ddddocr 带带弟弟 OCR 通用验证码识别 SDK 免费开源版。

2022-03-30 17:26:01

3910

已全部加载完成

搜索历史

什么是OCR

评论