0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器翻译的真实水平如何,梦想与现实的距离到底有多远?

mK5P_AItists 来源:lp 2019-03-22 14:08 次阅读

摘要:近年来,机器翻译等语言智能技术迅猛发展,语言智能技术落地、机器翻译替代人工、外语教育存废、外语教学改革等,成为社会热议话题。外语教育如何将语言智能的挑战作为转型的契机更好发展?怎样理性认识语言智能技术的发展未来?聚焦"语言智能与外语教育协同发展",自动化所宗成庆研究员这样说......

如何突破语言障碍,让机器完成不同语言之间的自动翻译,最终实现任意时间、任意地点、任意语言之间的无障碍自由通信,是人类长期以来的梦想。

近年来,随着计算机性能的提高,云计算、大数据和机器学习等相关技术迅速发展,人工智能再度崛起,机器翻译重新成为人们关注的焦点。一时间,机器翻译系统如雨后春笋般涌现,各种报道随之呈井喷式爆发,"机器翻译将取代人类"的说法也时有耳闻。然而,机器翻译的真实水平如何,梦想与现实的距离到底有多远?

从低迷到兴盛

机器翻译概念于1947年被提出,随后成为人工智能研究的核心问题。在70多年的发展历程中,机器翻译研究经历了几个不同的历史阶段:

从概念提出到1954年美国乔治敦大学(GeorgetownUniversity)在IBM公司的帮助下实现第一个机器翻译演示系统,可以认为是机器翻译的初创时期。

1966年,美国国家科学院语言自动处理咨询委员会(AutomaticLanguageProcessingAdvisoryCommittee,ALPAC)发布题为《语言与机器》的报告,宣称"目前给机器翻译研究以大力支持没有太多的理由","机器翻译遇到了难以克服的语义障碍",从而导致机器翻译研究在世界范围内走向低迷。

20世纪70年代中后期至80年代前期,部分机器翻译系统在特定领域得到初步应用(如加拿大蒙特利尔大学研制的天气预报翻译系统TAUM-METEO)。欧洲共同体实施的欧洲翻译体系(EuropeanTranslationSystem,EUROTRA)计划和日本对第五代计算机的研究都对机器翻译研究给予了支持,机器翻译研究开始复苏。

20世纪80年代末期,IBM公司实现了基于噪声信道模型的统计机器翻译系统,并在美国国防部高级研究计划署(ARPA)组织的评测中取得了较好成绩,推动了机器翻译技术的快速发展。尤其进入2000年之后,GIZA++、Pharaoh、Moses等一批开源工具相继发布,2006年谷歌翻译正式上线运行,2011年百度翻译上线,各大公司陆续推出了自己的翻译系统,整个机器翻译领域呈现出蓬勃发展、遍地开花的大好局面。

2013年基于神经网络模型的机器翻译(简称"神经机器翻译")方法被提出,机器译文的质量得到大幅提升,并且很多开源工具被相继公布,机器翻译技术研究和系统推广应用均出现前所未有的盛况。统计机器翻译和神经机器翻译的基本原理都是基于已有的大规模句子级双语对照语料进行模型训练,建立最优的翻译模型,最终实现从一种语言到另一种语言的翻译。通常情况下,用于训练模型的语料规模越大,模型性能表现就越好。

被夸大的技术

机器翻译技术的进步和系统性能的提升在为人们日常生活和工作带来更多便利的同时,也为该技术的产业化发展带来了更多商机。这种空前局面不仅让人们看到了梦想成真的希望,也点燃了部分人心中按捺不住的欲望。从传统媒体到新媒体,对机器翻译技术夸大宣传的声音不绝于耳,但一个不可否认的事实却是,目前的机器翻译技术尚不成熟,无论是文本翻译,还是口语翻译,机器翻译的质量远没有达到令人满意的水平。

当前所有的商用文本机器翻译系统普遍存在的问题:

一是错翻、漏翻和重复翻译比比皆是,尤其对成语、缩略语、专业术语和人名、地名、组织机构名称等的翻译更是招数无几。

二是难以实现篇章范围内的指代消解,常常张冠李戴,例如,前面说的是美国与伊朗之间的事情,后面翻译"美伊两国"时却译成了美国与伊拉克。

三是缺乏足够的在线优化能力,无法从译员修改译文的过程中自动学习和更新翻译知识,即使译员对系统给出的某个错误译文反复修改,系统依然照错不误。

四是对口语而言,说话人的语气、重音、语调,甚至肢体语言无法得到充分利用,尤其当说话人的口音较重、用词过于生僻、话语主题超出先验知识范围时,译文的质量无法保障。

高端翻译不可取代

我们并不否认机器翻译技术的进步,正如前文所述,机器译文的质量已有显著改善。在日常口语对话中,对于资源较为充分的语言(如英汉、日汉等),在说话场景不是非常复杂、口音基本标准、语速基本正常、使用词汇和句型不是非常生僻的情况下,口语翻译的性能基本可满足正常交流的需要。专业领域的文本机器翻译在训练语料较为充分时,译文准确率可达到80%以上。而对于资源匮乏的语言之间的翻译(如波斯语或达利语等与汉语之间的翻译),译文质量还十分有限。

毋庸置疑,机器翻译可能替代那些任务重复性较大、翻译难度较低的低端翻译人员,如天气预报查询、旅馆预订服务、交通信息咨询等翻译,但不可能取代高端翻译(如重要文献、伟人著作、文学名著等翻译)人员,更不可能消除翻译职业。"信、达、雅"是翻译的终极目标,我们可以预期,未来的机器翻译系统能够辅助高端翻译人员提高翻译效率,但要实现无须人工干预的高质量全自动翻译恐怕还是一个愿望。

不得不说的是,任何负责任的科学家和企业界都有责任和义务把技术或产品的真实水平和性能告知公众,而不是一味地宣扬,甚至为了利益而故弄玄虚。实事求是是一种态度,也是一种品格。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动化
    +关注

    关注

    29

    文章

    5562

    浏览量

    79239
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132562
  • 机器翻译
    +关注

    关注

    0

    文章

    139

    浏览量

    14880

原文标题:机器翻译技术现状评述与展望 | 行业观察

文章出处:【微信号:AItists,微信公众号:人工智能学家】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    TFP401APZP到底有没有HSYNC输出?

    请教下TI的大牛,TFP401APZP这颗IC到底有没有HSYNC输出?实测发现HSYNC无输出,是要做什么设置么?!
    发表于 12-20 07:28

    RTOS与Linux到底有什么区别

    很多做嵌入式开发的小伙伴都存在这样的疑惑:RTOS与Linux到底有什么区别?
    的头像 发表于 10-29 09:53 421次阅读

    CMOS运放的输入阻抗到底有多高呢?

    都说CMOS运放输入阻抗高,到底有多高呢?可有一个量化指标?
    发表于 09-06 06:59

    求助,这个电路U1A运放同相端的R1电阻到底有什么作用啊?

    想问下这个电路U1A运放同相端的R1电阻到底有什么作用啊?很郁闷。
    发表于 08-27 07:09

    无人机智能巡检系统到底有哪些作用

    无人机智能巡检系统到底有哪些作用? 随着科技的不断发展,无人机已经在光伏、风电、农业、水利、城市管理、地质等领域广泛应用,无人机智能巡检系统的应用,为巡检工作带来了革命行的变革,那么无人机智能巡检
    的头像 发表于 08-19 16:49 329次阅读
    无人机智能巡检系统<b class='flag-5'>到底有</b>哪些作用

    ESP32的BLE最大通信距离多远

    ESP32-S3官方模块的蓝牙在PCB板载天线,外置天线的不同情况下,125K,500K,1M,2M的不同速率下,通信距离最大可达多远? ESP32的BLE最大通信距离
    发表于 07-01 07:22

    EWSTM8-2201 or 3101安装说明上有的说选“是”,有的说选“否”,二者到底有什么区别?对工程什么影响?

    the installation. ......... 安装说明上有的说选“是”,有的说选“否”,二者到底有什么区别?对工程什么影响?
    发表于 04-28 08:08

    网桥传输距离多远

    网桥(Bridge)是一种早期的两端口二层网络设备,用来连接不同网段。网桥的两个端口分别有一条独立的交换信道,不是共享一条背板总线,可隔离冲突域。 网桥传输距离多远? 网桥的传输距离因传输环境和设备
    的头像 发表于 04-02 15:57 1985次阅读

    ST60 GHz RF收发器能传输多远距离

    看了ST60 GHz RF收发器之后,同时集成发送和接收路径,想知道ST60能传输多远距离?哪位大神知道!
    发表于 04-02 06:59

    网线到底有多少种连接器

    我们在谈论网线的时候,聊得最多的,一定是它的连接器,它在连接过程中扮演着极为重要的角色。网线到底有多少种连接器?本期我们将从工业级使用出发,来看看这根似乎普通的网线,在连接器上有多么努力。
    的头像 发表于 01-26 10:06 607次阅读

    NUC123的USB外设到底有没有DMA功能?

    下载最新的TRM 1.07: 在最先前的描述以及USB的寄存器章节都有DMA相关的内容。但是DMA那一章节里的框图没有USB外设。同时关于USB外设DMA的用法也没具体说明。所以USB外设到底有没DMA功能,若是该怎么用?
    发表于 01-16 08:26

    全固态电池到底有哪些闪光点?

    全固态电池到底有哪些闪光点? 全固态电池是一种新型的电池技术,相比传统液态电池,具有许多闪光点。下面我将详细介绍这些闪光点。 首先,全固态电池具有更高的安全性。传统液态电池中使用的有机电解液容易引发
    的头像 发表于 01-09 17:09 748次阅读

    AD7280AWBSTZ和AD7280ABSTZ之间到底有什么区别?

    替代吗?在网上找到的两个芯片的相关数据都是一样的,AD7280AWBSTZ和AD7280ABSTZ之间到底有什么区别?
    发表于 01-08 06:36

    COB与SMD到底有什么不同?

    COB与SMD到底有什么不同?  COB和SMD是两种常见的电子元器件封装技术。它们在电子行业中被广泛应用,尤其在LED照明领域。虽然它们都用于将芯片连接到电路板上,但它们在封装技术和应用方面有一些
    的头像 发表于 12-29 10:34 1726次阅读

    母线槽与电缆到底有何区别?

    母线槽与电缆到底有何区别? 母线槽与电缆是电力传输中常见的两种设备,它们有着各自的特点和应用领域。下面将分别从使用范围、结构设计、传输能力、安装维护等方面详细介绍母线槽与电缆的区别。 一、使用范围
    的头像 发表于 12-26 14:02 1659次阅读