0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国内用户量最大的互联网教育企业拿起AI武器!

DPVg_AI_era 来源:YXQ 2019-07-30 17:36 次阅读

数据的作用在人工智能发展道路上愈发被重视。7月27日,在广州举行的GMIC大会上,网易有道技术总监林会杰表示目前AI+教育还在初级阶段,对于这一行业而言,得数据者得先机。这家拥有国内最大用户量(全平台8亿用户)的互联网教育公司也首次对外集体亮相AI能力,神经网络翻译、图像识别、语音交互技术和自适应学习四项AI能力联合为教育加码。

几乎所有企业都想搭上AI这趟车。

这的确是大势所趋,但比起匆忙加入浪潮,先看看手里有着怎样的牌,才能在这战场上打得更漂亮。

传统企业转型AI,占据垂直化场景优势;有数据的公司拿起AI武器,“杀伤力”惊人;拥有大量用户基础、以用户为导向的企业,更易开发出To C端产品

最重要的是有技术加持,这就是时候向AI发力了。

7月27日,在广州GMIC(全球移动互联网大会)上,网易有道技术总监林会杰在题为《AI+教育的进化之路》演讲中表示:

目前AI+教育还在非常初级的阶段,得数据者得先机,如何更好地采集数据、处理数据、从数据中学习更好地规律,是当前整个AI+教育行业的重点。

网易有道技术总监林会杰

这也是网易有道首次对外集体亮相AI能力,翻译、图像识别、语音和自适应教育四项AI能力联合为教育加码:

神经网络翻译(NMT):在学习和新闻测试集中,有道NMT的中英互译准确度均优于同行,最好成绩领先7个百分点。

图像识别(OCR):拥有国内可识别语言最多的OCR识别引擎,且能应对多种高难度场景,平均准确率可达95%;

语音识别与合成:有道语音识别技术在一些场景上识别准确率超过98%,支持中、英、日、韩多个语言;有道语音合成引擎音色逼近真人,支持中、英、日、韩、葡等多个语言;

自适应学习:配合自研的智能学习硬件,实现实时采集书写数据,并且提供如学情分析、知识图谱评估、智能推题等一系列自适应学习辅助。

一直深耕技术的网易有道在AI方面的成绩单逐渐浮出水面,数据和技术加速转换成势能。

积累全平台8亿用户发力“AI+教育”,得数据者得先机

在人工智能产业落地的浪潮中,“AI+教育”更是处于风口。中国K12教育市场规模前景明朗,市场空间大。

成熟的AI+教育产品难以落地,根本原因是缺乏足量学习场景下的一手真实数据。

处处都是机遇,也处处都是挑战。如同艾瑞咨询在报告中指出,“AI+教育”领域边际明显,初期投入巨大,但越往后数据的反哺能力越强。

例如,在AI自适应学习产品中,由数据来训练算法,输出更接近真实情况的学习模型,学习系统进而得到增强,从而吸引更多学生使用,更多数据也会随之产生,形成良性循环。

来源:艾瑞咨询研究院

数据对于AI的作用早已不容小觑。

此前,对于深度学习发展已到瓶颈的问题,业内也有人提出数据处理是一剂良药。

在深度学习上,投入算法不一定能见到成效,但投入数据一定能见效,数据会推动人工智能的发展,会将人工智能带入一个新台阶。

发展AI技术前就已积累大量数据,这对一个企业来讲无疑是一大优势。网易有道技术总监林会杰在GMIC大会上表示,对于AI+教育行业而言,得数据者得先机。

AI模型的进化需要大量数据进行算法训练,然而线下传统教育仍是现在的主流,用户尚未习惯纯线上交互,大量学习数据都留存在线下难以采集。

以产品作为数据接口,是企业做AI的先天优势。网易有道本身的背景是一家100%用户导向的教育科技公司,全平台用户量8亿+,能够获取更多样化的第一手数据。

同时,针对AI+教育的进程是否太慢这一问题,林会杰提出一个比喻,AI渗透教育行业的过程好比“为行驶中车辆换轮胎”,存在数年的教育行业有一套成熟的运行逻辑,如同一辆行驶中的车辆,现在行业想要换上AI这一新轮胎“提速”,需要在不影响现有运行情况下,让技术逐渐渗透,最终完成AI+教育的迭代。

先机已得,技术自然要跟上步伐。

NMT准确度可信赖:中英互译BLEU值盲测中,最好成绩领先7个百分点

先来看看有道“起家”的翻译技术。

移动互联网热潮来袭,有道团队“切掉”了连接计算机的那条线,上线有道词典移动版,迎来了巨大的用户红利,如今在全平台拥有8亿用户。

人工智能热潮又一次来袭,翻译这一王牌领域成为有道要绝对坚守的阵地。早在2016年,网易有道首席科学家段亦涛就已经带领团队攻坚神经网络翻译技术(NMT)。

如今,有道神经网络翻译已经支持12种语言的中文互译,10种语言的英文互译。

在准确度方面,神经网络的翻译水平已经达到国际领先水平。在2017年周枫接受新智元采访时,在国际通用的BLEU评测中,网易有道针对翻译引擎不同的使用场景(学习、新闻、口语、用户日志)采集不同的评测数据,分别作出评测。

当时的有道翻译准确度在学习、新闻、口语和用户日志中就已高于其他国家引擎。

BLEU(双语评估研究-Bilingual Evaluation Understudy)是一种用于评估自然语言之间机器翻译的文本质量的算法,它是与人类质量判断高度相关的指标之一,也是最普遍使用的自动指标。

BLEU值越高,代表翻译准确度越高。

到2019年,在学习与新闻领域,无论是英译中还是中译英,有道的盲测集BLEU值也有了较大提升。据有道最新盲测数据显示,在学习和新闻测试集中,有道NMT的中英互译准确度均优于同行,最好成绩领先7个百分点。

2019年3月29日评测结果

之所以能有这样的技术优势,领域自适应模型是网易有道的法宝之一。

用户的需求是是多元的,有些用户对金融信息有需求,有些要查计算机术语,若想要用一个模型来覆盖所有用户需求,必然会影响翻译的准确度。

机器翻译中的领域自适应模型是指,若想要让翻译质量更好,需要给它更多垂直领域的数据,更多的平行语料。有道对于一些特定领域有单独的模型,系统会判定语料适应的领域,分配不同的模型进行翻译。

除基础翻译技术过硬外,有道翻译用户不断增长的另一因素是注重产品交互的创新与改变,例如在2018年和2019年增添AR实景翻译、语音同传、文档翻译和网页翻译等多个场景化很强的功能。

拥有国内可识别语言最多的OCR识别引擎,赋能AIoT学习硬件

如今,这些新功能背后的技术已经成为帮助有道拓展AI业务边界的两把利刃。

OCR是网易有道王牌技术之一,尽管2014年就已上线基于传统规则方法的OCR技术,但2017年,有了基于神经网络技术的加持,OCR引擎的质量明显迈向了新台阶。

OCR技术最直观的功能表现就是拍照翻译。截止2019年5月15日,有道OCR识别技术已经支持26种主流语言文字的支持,是目前国内识别语言最多的OCR识别引擎。

同时,网易有道的OCR技术是国际市场首家支持以下功能:

多语种全自动判别与混合识别

支持360度任意角度图像的文字识别

支持文字语义方向为横排、竖排或者混合排列的文字识别

同时,针对“AI+教育”这一场景,有道OCR团队进行了专项优化,研发出了一系列在国内市场上处于垄断性的优势技术,例如:

实现了公式识别,支持公式转为LaTeX功能,准确率达到93%。输入图示例:

除此之外,有道的OCR技术也能应对拼音识别、超模糊手写体识别、多角度多语种混合排版识别等高难度场景,平均准确率可达95%。

超模糊手写体识别案例

同时,针对K12用户(尤其是少儿用户)高难度手写场景进行优化,识别准确率高达85%以上,是业内唯一支持高难度教育场景的手写OCR服务。

K12手写体识别案例

这些均可离线的AI技术将这些能力部署在多种移动端上,满足各种AIoT硬件的需求。目前有道的各个AI技术均支持离线,OCR识别的模型离线后加起来只要50M。

有道OCR以主流智能教育硬件为基础,构建了完整的教育场景OCR技术链路。

同样还能实现离线的另一王牌AI技术还有智能语音。

2017年,智能语音技术被有道正式提上日程,投入研发,在语音识别(ASR)、语音合成(TTS)、语音评测、语种识别、声学前端增强等五大方面均有涉及:

2017年6月份启动ASR技术相关的研发,目前,支持中、英、日、韩、俄、西班牙等语言的识别,在一些场景上识别准确率超过98%。

于2017年开始语音评测技术的研发,目前在评分准确度方面和专家人工打分的相关性达到0.8。

从2017年开始自主研发语音合成系统,采用端到端的技术框架构建,达到和真人相当的语音自然度、高并发、低延时,目前已经支持中、英、日、韩、葡等多个语种。

扩展其它相关语音技术的研发,例如声纹识别、说话人日志、语音前端增强等。

在国际竞赛方面,有道语音团队参加了DIHARD Challenge2019竞赛,取得两阶段均第三名的成绩。

依托TEACH产品矩阵和业务场景的海量资源优势,有道语音技术团队在场景化声学建模、分领域语言建模、数据辅助标注等专项技术方面形成了和语音应用系统相互配合、密不可分的技术矩阵,达到较好的协同效应。

相关核心技术的整体框架结构如下图所示:

值得一提的是,有道的语音技术不仅提供云端高精度的解决方案,还提供完善的离线部署和低资源嵌入式集成方案,可以在保证精度的同时减少对网络的依赖,极大扩展了应用场景。

纸笔交互:熟悉的自适应学习,新鲜的硬件加持

除此之外,网易有道为旗下产品“有道精品课”自研了一款有道智能笔。

简单来讲,这支笔除了正常书写功能外,内置了一个摄像头和一颗处理芯片,你在进行习题练习时,内置的摄像头会自动记录书写内容并同步上传到精品课APP中。

这其中OCR识别引擎就发挥了重要作用,同时运用点阵码追踪技术,完整地还原了线下作业体验并实现了实时上传。

完成记录并上传只是完成了一部分任务,有道还开发了一套AI智能学习系统:通过分析智能笔上传的做题数据,进而提供如学情分析、知识图谱评估、智能推题等一系列自适应学习辅助。

这套系统由有道自主开发的题库和大数据推荐算法组成,目前有道自有题库容量已有5000万

以初中数学为例,题库共收录了教学大纲中的数百个知识点、每个知识点对应上百道习题。题目和知识点均由老师人工标注难度及重要程度,为算法推荐提供依据。

事实上,有为K12用户专门打造的、有硬件加持的自适应学习系统在业内非常罕见,并且这还原了学生熟悉的纸笔交互系统,这也是网易有道“AI+教育”业务的重要技术壁垒。

发力AI的基因与筹码兼备,网易有道商业化道路将迎质变

有道智能笔这类独特硬件的出现也能看出有道对在线教育资源掌控的决心与判断。

根据有道在AI技术上的布局,可以看出2017年是这家公司全力拥抱AI的一年。

同时,稳握8亿用户、100%用户导向的原则,网易有道发力AI的基因与筹码都已具备。

单拿“AI+教育”领域来说,网易有道所走得路线也相对“稳妥”,属于均衡发展的选手,注重实用性与应用落地。

与转型拥抱AI的新东方、好未来等传统教育企业相比,它没有拥有绝对场景优势,但积累的用户基础极大,进而拥有数据优势,并且有多年的自研技术积累。

但与AI企业相比,网易有道没有经历通过纯靠技术“厮杀”的阶段。

作为网易旗下第三个独立融资的事业部门,AI浪潮兴起的时候,网易有道早已不是初创企业,它对于如何将新技术落地商业化更有经验。

“AI+教育”行业尚处于发展早期的升温阶段,概念模糊,泡沫难免。保持清醒,注重实用性的确能保护企业避免触礁。

发力AI基因与筹码已兼备,至于何时走向资本市场、商业化道路迎来质变也是可遇见的未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30146

    浏览量

    268415
  • 网易
    +关注

    关注

    0

    文章

    125

    浏览量

    14386

原文标题:8亿用户AI有道,超强神经网络翻译技术大解密!

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    企业AI算力租赁是什么

    企业AI算力租赁是指企业通过互联网向专业的算力提供商租用所需的计算资源,以满足其AI应用的需求。以下是对
    的头像 发表于 11-14 09:30 174次阅读

    百度智能云荣获A级工业互联网“双跨”平台企业

    近日,工信部正式公示了“2024年跨行业跨领域工业互联网平台动态评价结果”,该评价旨在表彰在工业互联网领域具有卓越表现的企业。经过严格评审,共有49家优秀工业互联网
    的头像 发表于 11-11 13:53 190次阅读

    esp8266已连接到Wifi但无法连接到互联网,为什么?

    首先,我想说对不起,如果我的帖子在错误的线程中。在那之后,我想问一个问题,我的 esp12E 已连接到 Wifi,但它无法连接到互联网,即使 wifi 连接到互联网和其他设备,它仍然完美地使用互联网
    发表于 07-09 07:11

    工业互联网平台中什么是关键

    工业互联网平台是工业领域数字化转型的重要支撑,其关键要素包括以下几个方面: 网络基础设施 网络基础设施是工业互联网平台的基础,包括有线网络、无线网络、物联网等。工业互联网平台需要实现设
    的头像 发表于 07-02 09:37 669次阅读

    工业互联网和ERP的关系

    工业互联网和ERP有密切的关系。工业互联网是指将各种工业设备、传感器等设备连接到互联网上,通过数据分析和应用,提高生产效率和生产效益的一种新型工业模式。ERP(企业资源计划)是一种
    的头像 发表于 05-08 14:06 427次阅读

    我与中国互联网30年

    中山大学电子系读研究生的时候,中国教育科研网CERNET开通了,这是中国最早的数据通信网络之一。我也有幸成为了中国最早的互联网用户之一。   中国教育和科研计算机网(China Edu
    的头像 发表于 04-24 08:42 513次阅读
    我与中国<b class='flag-5'>互联网</b>30年

    什么是卫星互联网?卫星互联网的组成

    卫星互联网是指基于卫星通信技术接入互联网,其业务可覆盖全球。通过一定数量卫星的规模组网,构建具备实时信息传输能力的星座系统,卫星互联网可向终端用户提供以宽带
    发表于 04-17 10:01 970次阅读
    什么是卫星<b class='flag-5'>互联网</b>?卫星<b class='flag-5'>互联网</b>的组成

    工业互联网解决方案与应用场景

    工业互联网作为制造业数字化转型的关键,正在各行各业的各种场景中生根发芽。它通过将设备、生产线、工厂、供应商、产品和客户紧密连接,实现智能化、自动化和高效化,为企业带来了巨大的经济效益和社会效益。然而
    的头像 发表于 01-26 11:00 605次阅读

    工业互联网实训是什么?工业互联网实训包括哪些?

    工业互联网技术提升企业的生产效率、降低成本、提高竞争力。 实训内容通常包括: 1. 工业互联网概述:介绍工业互联网的概念、发展历程、技术基础和应用场景。 2. 工业
    的头像 发表于 01-17 17:00 1001次阅读

    工业互联网发展进路:反思与建议

    工业互联网发展源自工业面临转型升级的挑战。第一,数字化技术的迅速发展冲击了所有工业行业的发展方向与路径。一方面,消费互联网领域的颠覆性变革让企业和政府看到了“互联网+行业”的潜力,使得
    的头像 发表于 01-04 16:34 1338次阅读
    工业<b class='flag-5'>互联网</b>发展进路:反思与建议

    跨周期,创未来!华秋喜获中国产业互联网十周年-杰出企业

    ,未来也将推动中国经济的快速发展。 12月27日,由中国信息协会指导,B2B内参、产业互联网大视野、产业互联网创新研究院联合主办的2023年中国产业互联网企业家年会暨产业
    发表于 01-04 11:57

    AI+工业互联网应用的局限性分析

    尽管AI+工业互联网模式的应用对打破工业生产的效率瓶颈、进一步激活生产数据要素的潜能、促进工业智能化转型具有重要意义,但由于工业具有细分领域众多、流程环节复杂、容错性低、可靠性和安全性要求高等特点,因此目前AI+工业
    的头像 发表于 12-26 15:43 910次阅读

    AI+工业互联网应用的局限性分析

    尽管AI+工业互联网模式的应用对打破工业生产的效率瓶颈、进一步激活生产数据要素的潜能、促进工业智能化转型具有重要意义,但由于工业具有细分领域众多、流程环节复杂、容错性低、可靠性和安全性要求高等特点,因此目前AI+工业
    发表于 12-20 10:53 406次阅读

    华秋荣获亿邦动力2023产业互联网千峰奖,引领电子产业数字化变革

    喜讯! 继华秋荣获2023中国产业数字化百强榜企业 2023深圳行业领袖企业100强后 华秋再次荣获亿邦动力2023产业互****联网“千峰奖·数字供应链 12月1日晚,在2023亿邦产业
    发表于 12-15 09:57

    华秋荣获亿邦动力2023产业互联网千峰奖

    喜讯! 继华秋荣获2023中国产业数字化百强榜企业 2023深圳行业领袖企业100强后 华秋再次荣获亿邦动力2023产业互****联网“千峰奖·数字供应链 12月1日晚,在2023亿邦产业
    发表于 12-15 09:53