通过利用机器学习模型破译古籍-电子发烧友网

为了揭示过去的秘密，世界各地的历史学者花费毕生精力翻译古代手稿。圣母大学的一个研究小组希望帮助这项任务，用一种新开发的机器学习模型来翻译和记录几百年前的手写文档。

利用圣加尔修道院图书馆的数字化手稿和一个考虑到人类感知的机器学习模型 study 在深度学习转录能力方面有显著提高。

“我们正在处理历史文件，这些文件的书写风格早已过时，可以追溯到几个世纪以前，并且使用拉丁语等语言，而拉丁语已经很少使用了。你可以得到这些材料的美丽照片，但我们已经着手做的是以一种模仿专家读者眼睛对页面感知的方式自动转录，并提供快速、可搜索的文本阅读，”圣母大学副教授、资深作者沃尔特·舍勒在新闻稿中说。

圣加尔修道院图书馆建于 719 年，是世界上最古老、最丰富的图书馆藏品之一。该图书馆藏有大约 160000 卷书和 2000 份手稿，可追溯到八世纪。在羊皮纸上用现在很少使用的语言手工书写，这些材料中的许多尚未被阅读——这是一笔潜在的历史档案财富，等待发掘。

机器学习方法能够自动转录这些类型的历史文件已经在工作中，但挑战仍然存在。

到目前为止，大型数据集对于提高这些语言模型的性能是必不可少的。由于可供查阅的书籍数量巨大，这项工作需要时间，并且需要相对较少的专家学者进行注释。缺少知识，如从未编纂过的中世纪拉丁语词典，构成了更大的障碍。

该团队将传统的机器学习方法与研究物理世界和人类行为之间关系的视觉心理物理学相结合，以创建更多信息丰富的注释。在这种情况下，他们在处理古代文本时将人类视觉测量纳入神经网络的训练过程。

“这是机器学习中通常不使用的策略。我们通过这些心理物理测量来标记数据，这些测量直接来自于通过行为测量对感知进行的心理学研究。然后，我们通知网络在感知这些角色方面的常见困难，并可以根据这些测量结果进行纠正，” Scheirer 说。

为了训练、验证和测试这些模型，研究人员使用了一套来自圣加尔的可追溯到九世纪的数字化手写拉丁手稿。他们要求专家阅读并将文本行中的手动抄本输入定制的软件中。测量每次抄写的时间，可以洞察单词、字符或段落的难度。根据作者的说法，这些数据有助于减少算法中的错误，并提供更真实的读数。

所有的实验都是使用 cuDNN-accelerated PyTorch 深度学习框架和 GPU 。“如果没有 NVIDIA 硬件和软件，我们肯定不可能完成我们所做的事情。

该研究引入了一种新的深度学习损失公式，该公式结合了人类视觉测量，可应用于手写文档转录的不同处理管道。信贷： Scheirer 等人/ IEEE

团队仍在努力改进某些方面。损坏和不完整的文档以及插图和缩写对模型提出了特殊的挑战。

“由于互联网规模的数据和 GPU 硬件，人工智能达到了拐点，这将使文化遗产和人文学科与其他领域一样受益。我们只是初步了解我们可以对这个项目做些什么。

关于作者

Michelle Horton 是 NVIDIA 的高级开发人员通信经理，拥有通信经理和科学作家的背景。她在 NVIDIA 为开发者博客撰文，重点介绍了开发者使用 NVIDIA 技术的多种方式。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

gpu

gpu

+关注

关注
28

文章
4739

浏览量
128940
互联网

互联网

+关注

关注
54

文章
11154

浏览量
103299
机器学习

机器学习

+关注

关注
66

文章
8418

浏览量
132624

《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

医疗领域，手术辅助机器人需要毫米级的精确控制，书中有介绍基于视觉伺服的实时控制算法，以及如何利用大模型优化手术路径规划。工业场景中，协作机器人面临的主要挑战是快速适应新工艺流程。具身智

发表于 12-24 15:03

什么是机器学习？通过机器学习方法能解决哪些问题？

来源：Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的

发表于 11-16 01:07 •401次阅读

什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>？<b class='flag-5'>通过</b><b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题？

AI大模型与深度学习的关系

AI大模型与深度学习之间存在着密不可分的关系，它们互为促进，相辅相成。以下是对两者关系的介绍：一、深度学习是AI大模型的基础技术支撑：深度学习

发表于 10-23 15:25 •727次阅读

AI大模型与传统机器学习的区别

AI大模型与传统机器学习在多个方面存在显著的区别。以下是对这些区别的介绍：一、模型规模与复杂度 AI大模型：通常包含数十亿甚至数万亿的参

发表于 10-23 15:01 •622次阅读

构建语音控制机器人 - 线性模型和机器学习

轮子并识别音频信号，但它仍然无法通过语音命令控制或按预定义路径行驶。线性控制模型首先要解决的问题是实现直线驱动。为此，我们使用线性模型来控制提供给车轮的电压。使用线性模型适合对汽车

发表于 10-02 16:31 •213次阅读

【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

本人有些机器学习的基础，理解起来一点也不轻松，加油。作者首先说明了时间序列的信息提取是时间序列分析的一个重要环节，目标是从给定的时间序列数据中提取出有用的信息和特征，以支持后续的分析和预测任务，可以利用

发表于 08-14 18:00

【《大语言模型应用指南》阅读体验】+ 基础知识学习

今天来学习大语言模型在自然语言理解方面的原理以及问答回复实现。主要是基于深度学习和自然语言处理技术。大语言模型涉及以下几个过程：数据收集：大语言

发表于 08-02 11:03

【《大语言模型应用指南》阅读体验】+ 基础篇

这个程序不需要程序员编写，而是由计算机自动生成。因此，人工编程方法依赖程序员思考的规则，而自动编程是计算机算法通过分析数据自行创建规则。作者通过类比学生准备高考的过程来说明机器学习的

发表于 07-25 14:33

Al大模型机器人

丰富的知识储备。它们可以涵盖各种领域的知识，并能够回答相关问题。灵活性与通用性: AI大模型机器人具有很强的灵活性和通用性，能够处理各种类型的任务和问题。持续学习和改进: 这些模型可以

发表于 07-05 08:52

人工神经网络与传统机器学习模型的区别

人工神经网络（ANN）与传统机器学习模型之间的不同，包括其原理、数据处理能力、学习方法、适用场景及未来发展趋势等方面，以期为读者提供一个全面的视角。

发表于 07-04 14:08 •1281次阅读

大语言模型：原理与工程实践+初识2

前言深度学习是机器学习的分支，而大语言模型是深度学习的分支。机器

发表于 05-13 00:09

【大语言模型：原理与工程实践】揭开大语言模型的面纱

大语言模型（LLM）是人工智能领域的尖端技术，凭借庞大的参数量和卓越的语言理解能力赢得了广泛关注。它基于深度学习，利用神经网络框架来理解和生成自然语言文本。这些模型

发表于 05-04 23:55

深入探讨机器学习的可视化技术

机器学习可视化（简称ML可视化）一般是指通过图形或交互方式表示机器学习模型、数据及其关系的过程。

发表于 04-25 11:17 •418次阅读

通过新的ONNX导出器简化模型导出流程

大家好。我叫Manav Dalal，今天我将讲解如何通过新的ONNX导出器简化模型导出流程。如果你还没有听说过ONNX，它是一种用于表示机器学习模型

发表于 01-10 09:45 •954次阅读

如何使用TensorFlow构建机器学习模型

在这篇文章中，我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。

发表于 01-08 09:25 •985次阅读