0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT推新型机器算法,可破译消失已久的古语言

如意 来源:开源中国 作者:白开水不加糖 2020-10-28 14:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人员最近开发出了一种新的计算机算法,可以帮助语言学家自动破译历史上消失已久失的古语言。

官方指出,该系统能够自动破译已消失的语言,且无需对这一语言与其他语言的关系有深入的了解。他们还表明,该系统自身就可以确定语言之间的关系,并可以用它来证实最近的一项表明 Iberian 语言实际上与 Basque 语言无关的学术研究。

CSAIL 方面称,最近的研究表明,大多数曾经存在过的语言已经不再被使用。其中有数十种已灭绝语言也已被认为是“未破译”的语言。这就意味着,大众对它们的语法(grammar)、词汇(vocabulary)或句法(syntax)都了解不足,也无法理解其文本的意思。

而研究这些“未破译”的语言,除了是出于学术上的好奇心。还在于,不理解语言我们就会错过与讲这些语言的人有关的一整套知识体系。然而不幸的是,大多数灭绝语言的相关记录都非常的少,导致科学家无法使用谷歌翻译之类的机器翻译工具或 AI 算法来对其进行解密。

因此,此次 CSAIL 团队推出这一新算法的最终目的就是,旨在只用几千个单词,就可以破译语言学家几十年来难以理解的失传语言。

本次研究由 MIT 教授 Regina Barzilay 牵头,依赖于基于历史语言学(historical linguistics)见解的几项原则。例如,语言通常仅以某些可预测的方式发展。具体表现为:一种给定的语言很少会直接添加或删除整个音节,但是很可能会发生某些近似发音的替换。像母语中带有“p”发音的单词就可能会在其后代演变中变为“b”,但是由于明显的发音差异,变为“k”的可能性则较小。

通过整合这些原则和其他语言学约束,Barzilay 和 MIT 博士生 Jiaming Luo 开发了一种解密算法,该算法可以处理可能的转换的巨大空间以及输入中引导信号的稀缺性。该算法学习将语言声音嵌入多维空间,在该多维空间中,相应矢量之间的距离反映了不同发音的差异。这种设计使他们能够捕获语言变化的相关模式,并将其表达为计算约束(computational constraints)。生成的模型可以将古代语言中的单词进行细分,并将其映射到相关语言中的对应单词。

该项目建立在 Barzilay 和 Luo 去年写的一篇论文的基础上, 这篇论文解密了已灭绝的 Ugaritic 和 Linear B 语言,后者以前需要数十年的时间才能被人类解码。但是,两个项目之间的主要区别在于,该团队此前就已经知道这些语言分别与希伯来语和希腊语的早期形式有关。

新算法可以推断语言之间的关系,这是语言解密中的最大挑战之一。该算法可以评估两种语言之间的相似度,当对已知语言进行测试时,它甚至可以准确地识别出该语言属于哪个语系(language families)。不仅如此,算法生成的模型可以将古语言中的单词进行细分,并将其一一映射到“相关”语言中的对应单词上去。

在未来的工作中,该团队希望扩展到将文本与已知语言的相关单词相关联的范围之外,这种方法被称为“基于同源的破译方法”。其表示,“例如,我们可以识别文本中涉及到的所有人或地点的信息,然后可以根据已知的历史证据对其进行进一步的调查。这些实体识别(entity recognition)方法如今已广泛用于各种文本处理应用程序中,并且具有很高的准确性。但是关键的研究问题在于,在没有任何古代语言训练数据的情况下,这项任务是否可行? ”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98531
  • MIT
    MIT
    +关注

    关注

    3

    文章

    254

    浏览量

    25030
  • 机器翻译
    +关注

    关注

    0

    文章

    141

    浏览量

    15553
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    算法工程师需要具备哪些技能?

    、链式法则等。应用场景:梯度下降优化算法、反向传播计算等。 优化理论核心内容:凸优化、非凸优化、拉格朗日乘数法等。应用场景:模型参数调优、资源分配问题等。 编程语言Python:主流选择,用于数据处理、模型
    发表于 02-27 10:53

    C语言的PID算法

    C语言PID算法#include \"stdio.h\" #include //定义PID结构体 struct _pid{ float SetSpeed; float
    发表于 01-16 08:13

    C语言增量式PID的通用算法

    C语言增量式PID通用算法控制算法中PID使用的非常广泛,但是在网上找代码的时候发现好多代码都不够通用,需要自己改好多东西,而且当一个项目需要使用多个PID控制器时也颇为麻烦,这里设计一个通用的增量
    发表于 01-14 08:28

    用于单片机几种C语言算法

    : 数字滤波无需其他的硬件成本,只有一个计算过程,可靠性高,不存在阻抗匹配问题。尤其是数字滤波可以对频率很低的信号进行滤波,这是模拟滤波器做不到的。 数字滤波使用软件算法实现,多输入通道共用一个滤波程序
    发表于 11-27 06:00

    C语言的常见算法

    # C语言常见算法 C语言中常用的算法可以分为以下几大类: ## 1. 排序算法 ### 冒泡排序 (Bubble Sort) ```
    发表于 11-24 08:29

    C语言和单片机C语言有什么差异

    汇编语言机器才能读懂,所以每个平台的编译器编译成对应平台汇编的程序,每个平台的汇编不一样,当然编译器也不一样。 DOS上的TC2 TC3 WINDOWS上的VC 8051的C51都有自已的编译器。具体
    发表于 11-14 07:55

    复杂的软件算法硬件IP核的实现

    具体方法与步骤 通过 C 语言实现软件算法,并验证了算法的有效性以后,就可以进行算法的 HDL 转化工作了。通过使用 Altium Designer 的 CHC 编译器(C to H
    发表于 10-30 07:02

    巡检机器人落地攻略:RK3576驱动12路低延迟视觉

    场景化 · 可执行 · 指标清晰 · 调优复用01|从“人巡”到“机巡”:电力站一周上线纪实周一,项目组进场。需求很直接:变电站夜间值守薄弱、盲区多、报警后回看取证慢;希望一台巡检机器人替代夜巡
    发表于 10-24 16:53

    AES和SM4算法重构分析

    一、AES和SM4算法特点分析 基于前面几篇分享,我们对AES和SM4的算法流程有了较为清晰的认识,接下来对AES和SM4算法的共同点进行分析,得出二者的重构设计思路。 首先,这里
    发表于 10-23 07:26

    花椒直播首次开源流器组件 为鸿蒙开发者提供高性能流解决方案

    器。该工具基于花椒直播自主通用多媒体框架HJMedia打造而来,采用创新的通用多媒体框架设计,以高度模块化、扩展的插件化架构,极大提升了音视频功能开发效率与整体的资源利用率,为开发者提供高性能、低耦合的流解决方案。 在直播、短视频等高频多媒体场景
    的头像 发表于 09-04 09:52 818次阅读
    花椒直播首次开源<b class='flag-5'>推</b>流器组件 为鸿蒙开发者提供高性能<b class='flag-5'>推</b>流解决方案

    现在rtsp流还是只能向局域网流吗?

    现在rtsp流还是只能向局域网流吗
    发表于 08-08 06:07

    【嘉楠堪智K230开发板试用体验】K230机器视觉相关功能体验

    K230开发板摄像头及AI功能测评 摄像头作为机器视觉应用的基础,能够给机器学习模型提供输入,提供输入的质量直接影响机器学习模型的效果。 K230的sensor模块负责图像的采集和数据处理,官方平台
    发表于 07-08 17:25

    智能复合机器人:纠偏算法如何重塑工业精度与效率?

    在智能制造领域,复合机器人正成为柔性生产与高精度作业的核心载体。面对“复合机器人有纠偏算法吗?”这一行业高频问题,富唯智能以多模态纠偏技术体系给出了答案——通过自研的AI驱动纠偏算法
    的头像 发表于 05-29 17:01 1464次阅读
    智能复合<b class='flag-5'>机器</b>人:纠偏<b class='flag-5'>算法</b>如何重塑工业精度与效率?

    详细介绍机场智能指路机器人的工作原理

    免与行人发生碰撞,为旅客提供安全、舒适的引导服务。 智能交互系统 语音识别与理解 :智能指路机器人利用先进的语音识别技术,将旅客输入的语音信号转化为文字信息。然后,通过自然语言处理算法对文字进行分析
    发表于 05-10 18:26

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    的本质是解决“鸡与蛋”问题:机器人需要地图来定位,又需要准确定位来构建地图。书中从前端(传感器数据处理)和后端(位姿优化)两个层面解析了SLAM的算法逻辑。 激光雷达和视觉SLAM各有优劣,例如激光
    发表于 05-03 19:41