0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NLP最难“考卷”成绩出炉:追一科技超越Facebook跃居第二

科讯视点 2020-01-16 10:22 次阅读

近日,自然语言处理领域权威数据集SuperGLUE最新榜单排名更新。Google预训练模型T5保持第一,中国AI创业公司追一科技AI Lab团队超越Facebook AI,跃居榜单第二。值得注意的是,相比谷歌T5等超大规模研究型模型,追一此次登榜的RoBERTa-mtl-adv模型在商业化能力也非常强劲,相关技术已经落地到追一科技的AI数字员工产品线上,持续赋能银行、保险、证券、零售、地产、能源,教育,互联网等多个行业。

图片1.jpg

追一科技跃居SuperGLUE测试榜第二

SuperGLUE(Super General Language Understanding Evaluation)是当下NLP领域难度最大,权威性最高,含金量最足的测评标准之一,由纽约大学、华盛顿大学以及谷歌旗下的DeepMind联合Facebook作为主要发起人推出,最大程度涵盖了现实生活中可能遇到的不同类型的NLP任务,旨在更真实地反映当前最前沿的NLP技术可以达到的认知智能水平。

追一科技在为企业提供智能交互服务的过程中,技术和应用互相驱动,将实际商业化应用中总结出的多任务学习、对抗训练、知识蒸馏等技术手段和经验融入到参赛模型中,并在SuperGLUE测评数据集上拿到第二的成绩。

除去作为参照的人类水平,目前排名榜单第一的是Google的T5模型。从学术研究看,T5模型达到了目前“实验室智能”的最好水平,但如果考虑商用,T5需要耗费大量的算力,且模型自身体积过于庞大,目前还不能落地到实际业务场景中,缺少实际的商业应用价值。

而追一科技通过多任务学习、对抗训练以及知识蒸馏的方式,使得RoBERTa-mtl-adv模型大小合理,效果仅次于Google的T5。同时,相关技术也落地到了追一科技AI数字员工的产品线上。就SuperGLUE排名而言,可以说追一科技的RoBERTa-mtl-adv模型在目前全球具有实际落地能力的NLP模型中效果最好,排名最高。

“学霸”模型的商业化能力

SuperGLUE测试项目并非是“花拳绣腿”,而是实实在在考验模型通用能力的“铁人三项”;参加SuperGLUE也并非只是为了刷新评分,更重要的是检验当前技术能否很好地落地到实际应用场景中去。

SuperGLUE覆盖了问答、推断、语义理解、常识判断等自然语言理解维度,是人机智能交互过程中的核心环节,在具体的业务场景中都有很重要的应用价值。追一科技此次参赛模型的相关NLP技术已经被成熟运用于到自主研发的全套AI数字员工产品线上,广泛服务于银行、保险、泛互联网、地产、政企等多个行业的标杆客户。例如,在追一科技的智能在线机器人Bot中就融入了多轮问答技术、语义检索、机器阅读理解技术等NLP技术,能准确识别用户意图,满足用户需求。

口说无凭,接下来就结合SuperGLUE中的任务与Bot的具体案例,一探虚实。

单/多轮问答技术是指机器人和用户之间一问一答,实现多轮对话的过程。例如下面这个智能在线机器人Bot服务餐饮行业的场景:

智能在线机器人Bot不仅可以从对话中准确识别出地点,人数等信息,还能进一步追问用户未给出的“用餐时间”的信息,满足客户的需求。而传统的客服机器人并不会对未给出的潜在信息做出反应。

机器阅读理解技术在于机器人去“用力”理解文档中内容的意思,从而根据用户需求输出相应的结果。例如在金融保险领域会涉及到大量保险业务文档的修订、新增等情况。在面对客户时,即使是富有经验的客户经理,往往也很难迅速结合所有新增的文档内容进行有效回答。这时,定制了阅读理解技术的智能在线机器人Bot就又可以发挥作用了——可以实时帮助业务人员,针对相关问题从新文档中提取出答案,解决问题,降低出错的概率。

自然语言推断任务中“文本蕴含”是常出现的形式,在实际用语中非常的普遍,参考下面这个银行领域的例子:

因为白金信用卡属于信用卡,因此“我的白金信用卡需要挂失”蕴含在“我的信用卡需要挂失”中,因此,智能在线机器人Bot 在回答用户时只需准确指引用户如何挂失信用卡即可。

指代消解在人的交流过程中非常常见,在表达中适当地使用指代会让表达更加简练却不影响本意的阐述。如下面这个出行领域的例子:

智能在线机器人Bot理解了客户问句里的“上次”其实指代的是“上次中途取消订单”,所以立马给出了正确回复。

然而,最难为机器人的是常识推断,对语言的理解离不开对常识的掌握。举这么一个例子:

图片5.jpg

机器人需要具备“影子是由太阳升起照射留下的”这样的常识性推断,才能正确的选择答案。对于人来说,这些常识很简单,但是对于机器来说,大量的这种常识知识都潜藏在我们意识的深处,AI系统的研究者几乎不可能把所有这样的常识都总结出来,并灌入到系统中,所以机器人在该数据集的表现往往不尽如人意。

落地到现实场景中,比如我们可以对智能在线机器人Bot说“我银行卡弄丢了”,Bot就会询问你是否需要挂失。因为它具备了“弄丢银行卡需要挂失”这样的业务常识。

可以看到,真实的交互场景中模型需要对语言的不同维度都具有理解能力才能完全正常流畅的对话。而上述的几个例子中的问题形式都很好地包含在了SuperGLUE的不同数据集中,因此,此次追一科技在SuperGLUE测评指标上获得的成绩,不仅是对其RoBERTa-mtl-adv模型在理解自然语言技术上的一个肯定,还验证了“技术驱动应用,应用导向技术”策略的可行性,更加坚定了追一科技继续深耕技术,持续用AI赋能百业的信念。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28418

    浏览量

    207103
  • 智能机器人
    +关注

    关注

    17

    文章

    868

    浏览量

    82302
收藏 人收藏

    评论

    相关推荐

    六分荣获高工金球奖“年度标杆产品奖”

    日前,2024(第八届)高工智能汽车年会暨年度金球奖评选颁奖典礼在上海举行。六分智驾软硬服体定位终端,凭借优异性能以及量产领先优势,获得年度标杆产品奖。六分
    的头像 发表于 12-16 11:40 243次阅读

    领潮前行,硕一科精彩亮相香港2024环球资源消费电子展

    近日,环球资源消费电子展(Global Sources)在香港亚洲国际博览馆圆满闭幕。此次展会SOEYI硕一科携旗下多个产品矩阵惊艳亮相,凭借超20年深厚技术积累和全链条产品解决方案,成为备受瞩目的焦点之
    的头像 发表于 10-24 17:58 217次阅读

    加正式发布第二代东方屏,获全球首个DisplayMate A++认证

    近日,加携手京东方正式发布第二代东方屏,并宣布将在年度旗舰产品加 13 中首发搭载。去年,加联合京东方打造出世界上最好的屏幕——东方屏,这是
    的头像 发表于 10-21 17:32 280次阅读

    英伟达市值跃升至全球第二,股价大涨得益于AI强劲表现

    10月8日,英伟达股价在周交易中攀升超过2%,使其市值跃升至3.13万亿美元,成功超越了微软的3.04万亿美元,跃居全球市值第二大公司之位。然而,苹果依然稳坐市值第
    的头像 发表于 10-08 15:31 652次阅读

    英伟达市值跃升全球第二

    近日,全球科技领域的竞争格局再度发生变动。据最新数据显示,英伟达公司的市值在周成功超越微软,跃居全球第二大公司,仅次于苹果公司。
    的头像 发表于 10-08 14:38 297次阅读

    小米智能手机8月销量超苹果,跃居全球第二仅次于三星

    据国际媒体报道,苹果公司在过去数年间稳居全球智能手机市场第二把交椅,其销量仅次于行业巨头三星电子。值得注意的是,在每年秋季新款iPhone发布后的首个完整财务季度,即第四季度,苹果曾超越三星电子,登顶销量榜首。
    的头像 发表于 09-20 16:30 918次阅读

    大普技术出席第二届INNOTECH创嘉年华

    大普技术出席由香港科技大学(广州)(简称“港科大(广州)”)举办的第二届INNOTECH创嘉年华,与逾120个科技创新项目和企业共赴科技探索之旅,分享创新成果,推动产学研体化进程,加速科技成果向新质生产力转化。
    的头像 发表于 09-20 11:03 368次阅读

    小米8月手机销量跃居全球第二超越苹果

    据知名市场调查机构Counterpoint Research最新发布的报告,小米公司在2024年8月实现了令人瞩目的市场突破,其智能手机销量成功超越苹果,紧随三星之后,跃居全球第二大智能手机品牌。这
    的头像 发表于 09-19 16:02 436次阅读

    印度跃居全球第二大5G手机市场

    据知名市场研究机构Counterpoint的最新报告,2024年上半年全球5G手机市场持续繁荣,出货量实现了20%的显著增长。值得注意的是,印度市场在这轮增长中脱颖而出,首次超越美国,成为全球第二大5G手机消费市场,仅次于长期
    的头像 发表于 09-12 16:55 532次阅读

    手机光大突破!天玑9400 GPU光性能提升20%

    近日,科技圈传来新消息,联发旗下最新旗舰芯片天玑9400在图形技术上取得重大突破。据悉,该芯片光性能较前代产品提升近20%,并首发项移动端新光技术,该技术堪比PC顶级光
    的头像 发表于 08-27 13:33 375次阅读
    手机光<b class='flag-5'>追</b>大突破!天玑9400 GPU光<b class='flag-5'>追</b>性能提升20%

    联发2024年季度财报亮点及5G市场领先地位

    近日,联发公布了其2024年6月及第二季度的财务报告,展现了强劲的财务表现和市场竞争力。据财报显示,联发第二季度实现了合并营收1272.7亿元新台币(约合284亿元人民币),尽管
    的头像 发表于 07-11 14:56 878次阅读

    nlp神经语言和NLP自然语言的区别和联系

    神经语言(Neuro-Linguistic Programming,NLP) 神经语言是种心理学方法,它研究人类思维、语言和行为之间的关系。NLP的核心理念是,我们可以通过改变我们的思维方式和语言
    的头像 发表于 07-09 10:35 779次阅读

    高考志愿服务,张AI搜索的现实考卷

    AI搜索为高考助攻,该如何答好“志愿填报服务”这张考卷
    的头像 发表于 06-20 09:20 2017次阅读
    高考志愿服务,<b class='flag-5'>一</b>张AI搜索的现实<b class='flag-5'>考卷</b>

    英伟达市值突破3万亿美元,超越苹果成为全球第二

    北京时间今日凌晨,人工智能芯片领域的领军企业英伟达再次刷新了市场纪录。公司股价大涨5.16%,成功突破历史高位,市值首次迈过3万亿美元大关,超越了苹果,仅次于微软,成为全球市值第二高的公司。
    的头像 发表于 06-06 18:25 1057次阅读

    LG新能源超越比亚迪成全球第二大电动汽车电池生产商

    据SNE研究公司报告,LG新能源在今年头两个月内累计卖出电动汽车电池12.7吉瓦时,逐渐追赶上中国市场领导者宁德时代,这也使其在全球市场中的占有率升至13.7%,超越比亚迪成为行业第二
    的头像 发表于 04-08 14:26 542次阅读
    LG新能源<b class='flag-5'>超越</b>比亚迪成全球<b class='flag-5'>第二</b>大电动汽车电池生产商