多邻国成立于2012年,是一个跨平台的语言学习应用程序,全球用户高达3亿。为了打造真实的人与人的学习场景,多邻国一直在投资人工智能和机器学习,以便通过自动化使课程更具吸引力为每个人量身定制。
“我们人工智能战略的核心部分是尽可能地接近一种人与人之间的体验。”多邻国人工智能和研究主管Burr Settles在上月伦敦AI峰会的一次采访中说。
多邻国是一个跨平台的应用程序,用户可以免费学习语言,也可以每月支付7美元购买一项高级服务,可以删除广告、提供离线访问等。通过游戏化的模式和时间较短的课程,任何人都可以学习阅读、聆听和说几十种语言。
人们学习一门新语言的理由各不相同,但无论动机是什么,学习一门语言都需要花费很多的时间和精力,如果学习者不全天候地沉浸在语言中,那就更是如此。人们不会为了学习一门语言换一个国家居住,而多邻国这样的公司,正是利用智能手机的兴起和无处不在的网络为用户带来学习经验,无论他们身在何处。
多邻国已经支持世界上许多最常见的语言,包括汉语和印地语等。本周早些时候,它还推出了推出了对阿拉伯语的支持。多邻国目前在全球拥有约3亿用户,已筹集到1亿美元的资金,估值约为7亿美元,其中包括Alphabet的Capitalg和Kleiner Perkins等知名赞助商。
据市场研究公司称,2018年全球在线语言学习市场的规模定为90亿美元,到2026年可能达到200亿美元以上。在此背景下,多邻国一直在投资人工智能和机器学习,以便通过自动化使课程更具吸引力为每个人量身定制,就像是人类老师教学的方式。
数据
在卡内基梅隆大学担任博士后研究科学家后,Settles于2013年加入多邻国,担任软件工程师,负责从前端到后端的所有事务。他说,他之所以选择多邻国而不是大公司,是因为他看到了这个公司的潜力。
“我的兴趣集中在语言、人工智能技术和认知科学的交叉点上,”Settles指出,在这三者的交叉点上,并没有多少工作可以做。
Settles加入多邻国不久之后,他和团队开始研究如何转换多邻国学习模型的构建模块,这些模型基于70年代的闪存卡调度算法。根据Settles的说法,利用人工智能进行任何实际教育的研究目前相关研究很少。
多邻国所拥有的是丰富的学习数据,可用于从头开发新的模型和算法。
“我接受这份工作的部分原因是数据量、数据类型和数据的唯一性,”Settles说。“我们一直在使用启发式方法,我们收集有关学生正确的练习、错误的地方以及他们上次在应用程序中看到这些练习的时间的数据。既然我们在跟踪这些统计数据,我们就想‘为什么不创建预测模型来代替呢?”
半衰期
多邻国一直在开发自己的统计和机器学习模型,同时还结合了一些久经考验的学习技术,如间隔重复,以优化和个性化课程。间隔重复的理论是,间隔地重复简短的课程比在短时间内死记硬背相同的信息要好。还有所谓的“滞后效应”,如果逐渐增加练习课程之间的差距,则用户可以进一步提高。
但是,人类个体的差异性很大,机器学习模型往往是二元的,而不是考虑到个体的细微差别。这就是多邻国的统计模型——“半衰期回归” ,它分析了数百万语言学习者的错误模式,以预测个体长期记忆中每个单词的“半衰期”。
“当我们投入生产时,我们看到用户参与率提高了12%,”Settles说。
在物理学中,半衰期概念经常被用来描述一个量下降到初始值一半所需的时间。在语言学习中,可以用它来描述大脑中的词汇或语法知识。例如,如果半衰期是一天,而一天都没有练习一门新语言,将会有50%的机会忘记这堂课。
但这并不是一个精确的科学,半衰期回归就是进入一个人的大脑,弄清楚他们知道或不知道什么,然后相应地针对课程材料。
对于不同学习背景的人,“衰退”模式截然不同。已经有背景的人会犯更少的错误,他们犯的错误类型可能会有所不同,这意味着他们不必经常练习这些知识。
用来定位内容的方法是很重要,但内容本身也同样重要。在内容方面多邻国也在转向人工智能,以帮助其团队建立正确的课程。
“英语中有数百万个单词,也许有1万个高频词,用什么顺序教?怎么把它们串在一起?”Settles 说,“因此,我们建立了系统,来帮助内容创作者定制初级、中级和高级材料。”
另一个挑战是,尽管多邻国的用户中只有40%的人正在学习英语,但该公司用于培训其AI系统的大部分教学数据都是针对英语开发的。因此,多邻国不得不采用其系统并将其投射到其他语言上,在AI世界中称为转移学习。
尽管人才库正在缓慢增长,但有充分的证据表明人AI技能短缺,许多大型科技公司一直在努力收购有前途的人工智能初创公司。人才紧缺是多邻国在过去几年中遇到的挑战,特别是考虑到它专注于特定的技能组合。除语言和语言学外,它正在进行的人工智能研究跨越了一系列学科,并与心理学和学习科学交叉。
“我们希望在语言、人工智能和认知科学的交叉点上有更多的人。”Settles说。“我们的标准也很高。在申请我们AI工作的人中,只有不到0.5%能够完成这项任务。”
Settle补充说,该公司在过去18个月左右的时间里,发现合格人员的兴趣小幅增长,其中包括来自其他科技公司和学术界的申请人。
人对人
远程教授语言面临的最大挑战之一是,很难创建一种吸引人且充满沉浸感的体验,以保持学习者的回归。为了提高参与度,多邻国在2016年推出了机器人程序,通过其应用程序内的自动文本对话来帮助教授语言。
各种机器人角色被设计为对一系列可能的答案做出不同的反应,如果用户卡住,用户可以点击“帮我回复”按钮。理论上,机器人程序应该越用越聪明。
但现在,多邻国的机器人似乎服务似乎暂停了,但是自动化代理取代了人类导师的这种学习,可以将虚拟教学提升到下一个层次。会话AI助手的最新发展,如亚马逊的Alexa和谷歌智能助手,可能为语言学习者打开一个全新的机会世界。
将虚拟现实(VR)的可能性投入到混合中,用户可以通过耳机进入虚拟教室环境,很容易想象学习新语言会变得多么有吸引力。
当被问及多邻国是否有可能扩展到如此沉浸式的领域时,除了承认“这是可能的”。多邻国似乎很清楚这些新兴技术带来的固有好处,并且更大沉浸的潜力可能是巨大的。
虽然多邻国没有透露有关智能语音助手集成或沉浸式视觉世界的任何计划,但它已承诺在将人的元素放入自动化学习的过程中,进一步个性化其内容和交付。
“如果你思考一个好老师的教学方式,他们有三种属性,”Settles说。“一是他们非常了解内容,二是他们有办法进入你的脑海,弄清楚你知道什么不知道什么。三是他们非常有吸引力,能够找到在你所处的水平上让你学习的方法。”
他说: “半衰期回归是进入用户脑海中的一个例子,找出用户的心理模型,并将这些材料定位到用户。”
“那里有很多未知领域,”Settles补充道。“我认为,我认为,人工智能有很多机会创造新的、吸引人的学习体验。”
-
AI
+关注
关注
87文章
30239浏览量
268477 -
智能教育
+关注
关注
0文章
198浏览量
15879
原文标题:背了单词再也不怕忘,多邻国的AI要逆天!
文章出处:【微信号:Aiobservation,微信公众号:人工智能观察】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论