0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何让文本识别更加智能,数据堂获取这些OCR转写数据

火花 来源:大众新闻 作者:火花 2020-09-17 11:34 次阅读

近年来,学生党们拥有了一款新的学习神器——拍照搜题。当遇到不会做的题目时,只需要对着题目拍照,手机中就会出现这道题目的详细解答思路和答案。“拍照搜题”背后的黑科技就是光学字符识别技术,即OCR。OCR是指电子设备,例如扫描仪或相机检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别的方法将形状翻译成计算机文字的过程。

OCR的应用领域十分广泛。最早为我们熟知的“哪里不会点哪里”的点读机就应用了OCR。点读机的点读笔中装有一个扫描文字的摄像头,当点读笔接触到书本后,便可将文字内容识别和提取。作为常用的一款办公软件,扫描全能王可以实现“图片转文字”的功能。软件可以识别各种文件类型中的文字信息,这是非常典型的OCR技术的应用。

目前,文本识别分为以下几类:

· 通用文字识别:一般是指如PDF等不规则文档类的识别。

·卡证识别:包括身份证、银行卡、营业执照、名片、护照、港澳通行证、户口本、驾驶证、行驶证等等。

· 票据识别:包括增值税发票、定额发票、火车票、出租车票、行程单、保单、银行单据等等。

· 其他:如车牌、车辆合格证、印章检测等等。

随着分类的不断拓展,OCR技术的应用场景也越来越广泛,以下是几个应用较为成熟的领域:

· 远程身份认证:结合OCR和人脸识别技术,实现用户证件信息的自动录入,并完成用户身份验证。应用于金融保险、社保、O2O等行业,有效控制业务风险。

· 内容审核与监管:自动识别图片、视频中的文字内容,及时发现涉黄、涉暴、政治敏感、恶意广告等不合规内容,规避业务风险,大幅节约人工审核成本。

· 纸质文档票据电子化:通过OCR实现纸质文档资料、票据、表格的自动识别和录入,减少人工录入成本,提高输入效率。

针对上述的场景,基于深度学习的技术而言,训练数据的数量很大程度上影响了技术效果。数据堂作为深耕于AI数据领域近10年的人工智能数据服务提供商,一直致力于为全球人工智能企业提供专业的数据服务。依托自身的数据优势以及丰富的数据处理经验,数据堂推出了系列OCR标注及转写数据,为相关技术应更广泛的落地提供助力。

数据涵盖8种语言、多种场景、不同拍摄角度、不同拍摄距离、不同光照条件。在标注方面,标注行级文本的四边形框,行级文本转写。四边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于95%,文本转写精度不低于95%,该数据可用于多国语言OCR任务。

数据涵盖12种语言(6种亚洲语、6种欧洲语),包括商店牌匾、站牌、海报、车票、路标、漫画、井盖画、提示语、警示语、包装说明、菜单、建筑物标志等多种自然场景。在标注方面,标注行级文本的四边形框,行级文本转写,四边形框顶点偏差不超过五个像素为正确检测,检测框精度不低于97%,文本转写精度不低于97%。

数据包括自然场景图片2,056张,互联网图像1,103张,文本图像347张。在标注方面,行级内容用行级四边形框标注、行级内容转写;竖列内容用竖列四边形框标注、竖列内容转写。数据可用于多场景下的印地语识别、印地语拍照翻译等任务。

数据包括自然场景图片258张,互联网图像2,553张,文本图像2,184张。在标注方面,行级内容用行级四边形框标注、行级内容转写;竖列内容用竖列四边形框标注、竖列内容转写。数据可用于多种场景下的越南语识别、越南语拍照翻译等任务。

相比物体检测识别,OCR由于包含倾斜文本框、低分辨率文字和文本版面多样化的情况,因此OCR数据标注具有特殊性,标注成本更高。数据堂的数加加Pro标注平台支持私有化部署,能够帮助企业快速、安全的对人工智能数据进行标注,为企业提供更专业、更安全的数据基础设施。

fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能识别
    +关注

    关注

    0

    文章

    198

    浏览量

    18111
  • OCR
    OCR
    +关注

    关注

    0

    文章

    144

    浏览量

    16323
收藏 人收藏

    评论

    相关推荐

    讯维智能语音转写系统:开启智能会议记录新篇章!

    随着人工智能技术的飞速发展,智能语音转写系统逐渐走进我们的日常生活和工作之中,成为提升工作效率、优化信息处理的重要工具。讯维智能语音转写系统
    的头像 发表于 11-15 15:41 89次阅读
    讯维<b class='flag-5'>智能</b>语音<b class='flag-5'>转写</b>系统:开启<b class='flag-5'>智能</b>会议记录新篇章!

    讯维智能语音转写系统核心优势大解析!

    凭借其高精度识别、实时转写智能纠错以及多语种支持等核心优势,正在深刻改变着会议记录、教育培训、采访报道和法律取证等多个领域的工作方式,成为提升工作效率和优化信息处理的重要工具。下面我们来整理下讯维
    的头像 发表于 11-15 15:24 145次阅读
    讯维<b class='flag-5'>智能</b>语音<b class='flag-5'>转写</b>系统核心优势大解析!

    明治案例 | 【OCR识别+条码读取】一步到位,印刷品质的智能守护者

    在某大型印刷企业的生产线上,印刷机需要完成大量的条码印刷任务。为了确保条码的准确性和可读性,需要在设备上安装传感器进行条码印刷的读码和OCR识别检测。1、传感器需要准确识别条码中的信息,并将其与预设
    的头像 发表于 10-22 08:02 139次阅读
    明治案例 | 【<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>+条码读取】一步到位,印刷品质的<b class='flag-5'>智能</b>守护者

    数据线芯片-数据线智能控制芯片EN16F

    低功耗功能。 数据线智能控制芯片的基础功能包括数据传输管理、电源管理、设备识别和用户接口控制。随着技术的不断进步,这些芯片已经实现了从基础
    发表于 09-27 11:04

    光学字符识别是什么的一种技术

    光学字符识别(Optical Character Recognition,简称OCR)是一种将文本资料转换为计算机可编辑和可搜索的数据格式的技术。这项技术广泛应用于文档扫描、
    的头像 发表于 09-10 15:48 396次阅读

    光学识别技术的工作原理是什么?

    光学识别技术(Optical Character Recognition,简称OCR)是一种将图像中的文字信息转换成可编辑和可搜索的文本数据的技术。它广泛应用于文档扫描、数据录入、自动
    的头像 发表于 09-10 15:46 527次阅读

    光学识别字符是自动识别技术吗

    辑和可搜索的数据OCR技术广泛应用于数据录入、文档管理、自动化处理等领域。 1. OCR技术的历史 OCR技术的发展可以追溯到20世纪50
    的头像 发表于 09-10 15:43 372次阅读

    明治案例 | PE编织袋【大视野】【OCR识别

    OCR识别技术OCR识别技术在工业生产中扮演着至关重要的角色。它利用先进的图像处理技术,自动、高效地识别并转换图像中的文字信息为可编辑的
    的头像 发表于 08-13 08:25 396次阅读
    明治案例 | PE编织袋【大视野】【<b class='flag-5'>OCR</b><b class='flag-5'>识别</b>】

    讯维智能语音转写系统确保企业数据的安全性

    随着人工智能技术的飞速发展,智能语音转写系统逐渐走进我们的日常生活和工作之中,成为提升工作效率、优化信息处理的重要工具。讯维智能语音转写系统
    的头像 发表于 08-02 15:53 570次阅读

    智能手机充电头OCR精准识别

    文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号。光学字符识别(OCR)相信大家都不陌生。而工业场景的图像文字识别更加复杂
    的头像 发表于 06-11 08:24 396次阅读
    <b class='flag-5'>智能</b>手机充电头<b class='flag-5'>OCR</b>精准<b class='flag-5'>识别</b>

    车内语音识别数据智能驾驶中的价值与应用

    化和个性化提供了有力支持。本文将详细介绍车内语音识别数据智能驾驶中的价值、应用以及面临的挑战和未来的发展趋势。 二、车内语音识别数据的价值 提高驾驶安全性:通过语音控制车辆功能,驾驶员可以
    的头像 发表于 02-19 11:47 520次阅读

    车内语音识别数据智能驾驶中的应用与挑战

    一、引言 随着智能驾驶技术的不断发展,车内语音识别数据智能驾驶中的应用越来越广泛。车内语音识别技术为驾驶员提供了更加便捷和安全的驾驶体验,
    的头像 发表于 01-26 18:14 1065次阅读

    语音数据集在智能语音搜索中的应用与挑战

    一、引言 随着互联网的普及和移动设备的兴起,智能语音搜索已经成为人们获取信息的重要方式之一。智能语音搜索通过语音交互的方式,为用户提供更加便捷、高效的信息查询服务。语音
    的头像 发表于 01-18 15:09 515次阅读

    感知智能:连接虚拟与现实的桥梁

    电子发烧友网报道(文/李弯弯)感知智能是指通过各种传感器获取信息的能力,它涵盖了视觉、听觉、触觉等感知能力,能够计算机模仿人类的感知过程,实现更加精确和高效的
    的头像 发表于 01-04 00:09 1949次阅读

    vlookup过来的数据怎么变成文本

    VLOOKUP是一个非常有用的Excel函数,用于查找并提取特定值或数据。在VLOOKUP函数中,通常返回的数据类型是数值或日期,但有时我们可能希望将这些数据转换为
    的头像 发表于 12-01 10:18 2.9w次阅读