0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“现代版罗塞塔石碑”,MIT&谷歌大脑用AI破解失传的古代文字

jmiy_worldofai 来源:YXQ 2019-07-10 17:25 次阅读

漫漫尘埃下,掩藏了许多曾经辉煌灿烂古代文明,但我们现在却无法清晰地知道,这些地方究竟发生了什么。

搞懂这些历史的最佳方式,就是找到他们的文字记载。However,记载文字的石碑可以被考古学家们挖出来,但这些古文字究竟啥意思,现代的人们看不懂,需要语言学家们耗尽青春来推测。

现在,MIT CSAIL和谷歌大脑的研究者出手了,他们用机器学习破译了乌加里特文和线性文字B。

△ 乌加里特王宫

乌加里特文,Ugaritic,是一种楔形文字,属于闪米特语族。从字面上来看,就知道它是一个叫做乌加里特(Ugarit)的文明使用的语言,这个文明位于当今地中海沿岸的叙利亚,在公元前6000年前后就初现踪迹,在公元前1190年前后灭亡。

△ 乌加里特文

线性文字B,Linear B,由一种人类还没有破译出来的线性文字A演化而来,主要存活于公元前1500年到公元前1200年的克里特岛和希腊南部,是希腊语的一种古代书写形式。

△ 线性文字B

研究者们利用同一语族内不同语言之间的联系,用机器学习的方法来破译这两种失传的语言,这是破译古代语言的新方法,也将对罗曼语族的语言学研究有巨大的影响和提升。

这个方法让许多人惊叹:

简直是现代版的罗塞塔石碑!

PS,罗塞塔石碑是一块用3种语言写了同一个内容的石碑,帮助语言学家们读懂古文字。

希望能先把动物和植物的语言破译了,可以发现打开新世界的大门。

人类语言总相通

这项研究的核心方法,是借助人类语言的相似性。

比如,知乎用户@拉队短 在介绍欧洲语言相似性的时候,举了这么个栗子:

句子“那是六月末潮湿阴沉的一个夏日。”

英语:It was a humid, grey summer day at the end of June.

丹麦语:Det var en fugtig, grå sommerdag i slutningen af juni.

瑞典语:Det var en fuktig, grå sommardag i slutet av juni.

挪威语:Det var en fuktig, grå sommerdag i slutten av juni.

冰岛语:Það var rakur, grár sumardagur í lok júní.

看,长得差不多嘛,毕竟同属印欧语系日耳曼语族,单词的分布位置、句子的结构都很相似,如果你能看懂一种语言,就能大致猜测和它“血缘”关系近的另一种语言。

模型训练

为了破解这两种文字,研究者们提出了一个基于字符的seq2seq模型。

模型主要包含通用字符嵌入、剩余连接、单调排列正则化几个部分。

其中,线性文字B的字母和希腊文需要进行对应。

之后,借助神经解密算法,在具有不同语言特征的多种语言中提供强大的性能。

你懂的语言,和你不懂的语言

在算法模型的基础之下,需要的语料库除了待破解的乌加里特文和线性文字B,还需要一些现在的人类能看懂的语言。

研究团队选择了罗曼语族的数据库,包含意大利语、西班牙语和葡萄牙语三种语言的同源语音转录,需要对它们进行同源检测

因此,数据集就用到上面这些,Symbols指的是语言中的字符,Token则是语言学中类似于单词的存在。

准确率

运行成果还不错,乌加里特文在无噪声条件下优于现有方法3.1%,在有噪声条件下优于现在的贝叶斯方法5.5%。

而线性文字B,在无噪声条件下准确率高达84.7%,在更具挑战性的LinearB名称数据集中达到67.3%的准确度。

在罗曼语族同源识别任务中,西班牙语准确度提升3.4%,葡萄牙语提升1.6%。

线性文字B的祖先,线性文字A还没有被人类破译,它被誉为考古界圣杯。

未来,在这项研究起作用的情况下,或许可以像借助罗曼语族三种语言的数据库一样,直接用机器借助其他已知的人类语言,实现暴力破解。

想破脑壳的语言学家们,可以把工作重心放到别的事情上了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6172

    浏览量

    105627
  • MIT
    MIT
    +关注

    关注

    3

    文章

    253

    浏览量

    23417

原文标题:MIT&谷歌大脑用AI破解失传的古代文字,被称“现代版罗塞塔石碑”丨ACL 2019

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    《算力芯片 高性能 CPUGPUNPU 微架构分析》第3篇阅读心得:GPU革命:从图形引擎到AI加速器的蜕变

    对卷积核优化的思考。 GPU的存储体系采用了独特的倒金字结构,在我看来这是其计算性能的关键。大容量寄存器设计破解了传统冯诺依曼架构的内存瓶颈,合并访存机制巧妙解决了内存带宽限制。NVIDIA GPU
    发表于 11-24 17:12

    机场运营商Fraport与德与施瓦茨签订合作协议

    德与施瓦茨(以下简称“R&S”)与Fraport合作,对法兰克福机场的旅客安检站进行现代化改造,安装 100 台新安检扫描仪。
    的头像 发表于 11-22 16:17 259次阅读

    科技先进制程AI赋能中心&校企联合实验室落户苏州

    近年来,随着全球半导体产业的高速发展和中国自主研发技术的不断突破,国产先进制程技术的自主化进程成为了推动产业变革的重要课题。喆科技先进制程AI赋能中心的启动,以及与南京大学的深度合作,正是对这一
    的头像 发表于 10-21 14:17 293次阅读
    喆<b class='flag-5'>塔</b>科技先进制程<b class='flag-5'>AI</b>赋能中心&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;校企联合实验室落户苏州

    智芯签约仪式暨喆科技半导体AI创新总部启动仪式圆满举办

    科技将继续秉持“学习、创新、当责、共赢”的企业文化,加强人才培养与引进,建立一支专业高效的团队,为客户提供最优质的服务和支持。同时,喆科技期待与更多合作伙伴携手,共同探索半导体和工业AI领域的无限可能,为推动“世界光谷”半
    的头像 发表于 09-02 11:04 270次阅读
    喆<b class='flag-5'>塔</b>智芯签约仪式暨喆<b class='flag-5'>塔</b>科技半导体<b class='flag-5'>AI</b>创新总部启动仪式圆满举办

    pcb板树脂孔和油墨孔的区别?

    PCB板树脂孔和油墨孔的区别主要体现在以下几个方面: 1. 饱满度与质量 树脂孔:树脂孔工艺通过使用环氧树脂填平过孔,并在表面进行磨平和镀铜处理,以确保孔内填充饱满。这种工艺解
    的头像 发表于 08-30 17:13 1664次阅读

    Character.AI创始人加入谷歌,被买断的股票估值25亿美元

    根据彭博社于8月3日的最新报道显示,Character.AI人工智能独角兽公司的创始人和核心研发人员诺姆·沙泽尔先生(Noam Shazeer)、丹尼尔·德·弗雷斯先生(Daniel De Freitas)及所在科研团队的部分成员,已于近日正式加入
    的头像 发表于 08-03 16:55 2435次阅读

    德与施瓦茨加入AI-RAN联盟,共同推进无线通信创新发展

    在无线通信技术飞速发展的今天,德与施瓦茨(以下简称“R&amp;S”)再次凭借其卓越的技术实力,成为最新成立的AI-RAN联盟的新成员。作为无线测试领域的全球领导者,R&amp;S以
    的头像 发表于 06-27 17:22 511次阅读

    智谱AI推出“AI”,全模型矩阵降价

    在智谱AI Open Day活动上,科技巨头智谱AI宣布了重要进展。备受瞩目的罗永浩AI智能体——“AI”正式入驻智谱清言App智能体中
    的头像 发表于 06-06 09:38 554次阅读

    谷歌发布多模态AI新品,加剧AI巨头竞争

    在全球AI竞技场上,谷歌与OpenAI一直稳居领先地位。近日,谷歌在I/O开发者大会上掀起了一股新的技术浪潮,发布了多款全新升级的多模态AI产品。
    的头像 发表于 05-16 09:28 459次阅读

    印度电子开始出口封装芯片

    印度电子近日宣布,其已在班加尔试验线上成功封装芯片并开始出口,这一重要进展标志着在半导体行业的雄心壮志迈出了坚实步伐。公司计划在未
    的头像 发表于 05-13 10:31 633次阅读

    谷歌整合安卓系统与Pixel硬件团队,奥斯特引领新&amp;quot;Platfo&amp;quot;

    Osterloh曾主管谷歌硬件部门,涵盖Pixel、Fitbit以及Nest等各种产品的研发和战略规划。他对The Verge表示:“唯有结合硬件、软件和AI团队,方能为用户提供突破性AI体验。
    的头像 发表于 04-19 10:16 487次阅读

    谷歌模型合成工具怎么

    谷歌模型合成工具主要是指Dreamfusion,这是Google的大型AI图像模型Imagen与NeRF的3D功能相结合的一种技术。Dreamfusion是Dream Fields的演变,Dream Fields是谷歌于2021
    的头像 发表于 02-29 17:33 825次阅读

    谷歌AI大模型Gemma全球开放使用

    谷歌公司近日宣布,其全新的AI大模型Gemma现已在全球范围内开放使用。这一重要举措不仅彰显了谷歌AI领域的领先地位,还为其在全球范围内的竞争力增添了新
    的头像 发表于 02-28 18:12 1172次阅读

    【国产FPGA+OMAPL138开发板体验】(原创)5.FPGA的AI加速源代码

    信号,就像AI的心跳一样 input wire clk, // 复位信号,就像AI的“重启”按钮 input wire reset, // 矩阵A,就像AI的“大脑”的一部分
    发表于 02-12 16:18

    集团宣布在印度古吉拉特邦投资建设半导体晶圆厂

    集团(Tata Group)主席纳兰詹·钱德拉卡兰在周三的一个投资峰会上表示,针对Tata集团在古吉拉特邦建立新的半导体晶圆制造厂的计划即将对外公布。
    的头像 发表于 01-13 11:30 509次阅读
    <b class='flag-5'>塔</b><b class='flag-5'>塔</b>集团宣布在印度古吉拉特邦投资建设半导体晶圆厂