0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于NLP基准数据集的快速概览,以及最新技术的进展

DPVg_AI_era 来源:lq 2019-02-16 11:01 次阅读

本文是一个自然语言处理资源索引,涵盖了目前NLP领域常用任务的最佳实验 结果和数据集资源,可以作为进一步从事NLP研究的基础。读者也可以自行在Github页面上添加新的结果,本文中大部分为英文NLP资源,还有少数汉语、印地语和越南语资源。

本文实际上是一个索引,旨在记录自然语言处理(NLP)领域的新进展,并概述最常见的NLP任务及其相应数据集的新技术。

这篇索引旨在涵盖主要的传统和核心NLP任务,如语义依赖性解析和词性标注等,以及最近不断取得新突破的任务,比如阅读理解和自然语言推理。本文主要目标是为感兴趣的读者提供关于NLP基准数据集的快速概览,以及最新技术的进展,这些数据集和新进展可以作为进一步NLP研究的基础。

因此,本文有意将这些NLP领域的新研究进展做一个简单汇总,便于研究人员集中查阅参考。

读者也可以通过浏览器访问nlpprogress.com或nlpsota.com来阅读本文。

简易使用指南

实验结果

本文首选在已发表的论文中的实验结果,但对少数影响力很大的预印本论文也可能入选。

数据集

本文中收录的数据集,除了利用该数据集的论文之外,还应经过至少一篇已发表的其他论文的评估。

代码

我们建议添加指向实现的链接(如果可用)。如果代码不存在,您可以向表中添加代码列(见下文)。在Code列,建议使用官方实现。如果有非官方实现,请使用链接(见下文)。如果没有可用的实现,可以将单元格留空。

向本索引中添加新结果

如果要添加新结果,只需单击文件右上角的小编辑按钮以执行相应任务(如下图所示)。

读者可以在Markdown中编辑文件。只需以相同的格式将一行添加到相应的表中即可。确保表格中数据排序正确(将最佳结果位于顶部)。完成更改后,单击页面顶部的“预览更改”选项卡,确保表格看起来还不错。如果一切看起来都OK,请转到页面底部确认更改。

此处需要为建议更改添加名称,可以选择添加说明文字,可以选择“创建新分支并启动拉取请求”,然后单击“提交更改”。

具体索引内容和研究领域如下,绝大部分为英语,有少量资源为汉语、印地语和越南语。

英语

自动语音识别

CCG超级标准

常识

选区解析

共同决议

依赖解析

对话

域适应

实体链接

语法纠错

信息提取

语言建模

词汇规范化

机器翻译

多任务学习

多模态

命名实体识别

自然语言推理

词性标注

问答

关系预测

关系提取

语义文本相似度

语义解析

语义角色标记

情绪分析

浅语法

简单化

状态检测

概要

分类学习

时间处理

文字分类

词义消歧

中文

实体链接

中文词汇分割

印地语

分块

词性标注

机器翻译

越南语

依赖解析

机器翻译

命名实体识别

词性标注

分词

最后以”中文-词汇分割”子类目为例,简单说明这个索引资源的呈现方式。

点击相应链接进入,首先是中文词汇分割这个任务的简要介绍。

下面列出了不同作者建立的基于不同搜索方式的单词分割模型,以及相应模型的发表时间。

接下来是评估指标,此类中为F1分数。下面以表格形式给出每种模型在不同数据集上获得的最佳F1分数。每个分数对应的研究论文链接和部分Github资源地址。

可以看到,表中中文词汇分割模型的最优F1分数均超过了96分,感兴趣的读者可以点击查看论文或Github资源。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24742
  • 自然语言处理

    关注

    1

    文章

    619

    浏览量

    13592
  • nlp
    nlp
    +关注

    关注

    1

    文章

    489

    浏览量

    22059

原文标题:盘点NLP最新进展:多语种40+任务最优结果任你查

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何设计ADC和DAC的基准源,以及基准源如何影响ADC与DAC那些性能?

    如何设计ADC和DAC的基准源,以及基准源如何影响ADC与DAC那些性能?有没有相关的资料参考?
    发表于 12-17 06:27

    当今数据中心新技术趋势

    当今数据中心的新技术趋势正以前所未有的速度推动着行业的变革与创新。随着云计算、大数据、人工智能等技术快速发展,
    的头像 发表于 10-24 15:15 498次阅读

    康谋分享 | AD/ADAS的性能概览:在AD/ADAS的开发与验证中“大海捞针”!

    在AD/ADAS开发与验证中,如何从海量数据快速获得性能概览,进而快速定位关键事件?本文康谋带您了解,如何利用IVEX智能概览功能,结合安
    的头像 发表于 10-23 09:24 2302次阅读
    康谋分享 | AD/ADAS的性能<b class='flag-5'>概览</b>:在AD/ADAS的开发与验证中“大海捞针”!

    关于数据转换器的基准电压选择和设计提示

    电子发烧友网站提供《关于数据转换器的基准电压选择和设计提示.pdf》资料免费下载
    发表于 09-20 09:38 0次下载
    <b class='flag-5'>关于</b><b class='flag-5'>数据</b>转换器的<b class='flag-5'>基准</b>电压选择和设计提示

    【「时间序列与机器学习」阅读体验】全书概览与时间序列概述

    ,可以将相似的时间序列分组,以便进一步理解时间序列数据中的结构和模式。 ●第6章“多维时间序列”:介绍多维时间序列在广告分析和业务运维领域的应用,包括如何利用OLAP技术对多维时间序列进行有效处理,以及
    发表于 08-07 23:03

    nlp神经语言和NLP自然语言的区别和联系

    神经语言(Neuro-Linguistic Programming,NLP) 神经语言是一种心理学方法,它研究人类思维、语言和行为之间的关系。NLP的核心理念是,我们可以通过改变我们的思维方式和语言
    的头像 发表于 07-09 10:35 802次阅读

    nlp自然语言处理的主要任务及技术方法

    自然语言处理(Natural Language Processing,简称NLP)是人工智能和语言学领域的一个分支,它研究如何让计算机能够理解、生成和处理人类语言。NLP技术在许多领域都有广泛
    的头像 发表于 07-09 10:26 1212次阅读

    nlp自然语言处理模型怎么做

    进展。本文将详细介绍NLP模型的构建过程,包括数据预处理、模型选择、训练与优化等方面。 数据预处理 数据预处理是
    的头像 发表于 07-05 09:59 668次阅读

    NLP技术在机器人中的应用

    在人工智能的广阔领域中,自然语言处理(NLP技术作为连接人类语言与机器智能的桥梁,正逐渐渗透到我们日常生活的方方面面,其中机器人技术便是一个尤为突出的应用领域。NLP
    的头像 发表于 07-04 16:04 526次阅读

    NLP技术在人工智能领域的重要性

    智能的桥梁,其重要性日益凸显。本文将从NLP的定义、发展历程、核心技术、应用领域以及对人工智能领域的深远影响等多个维度,深入探讨NLP技术
    的头像 发表于 07-04 16:03 591次阅读

    NLP模型中RNN与CNN的选择

    NLP中的应用场景、工作原理、优缺点,以及在选择时应考虑的关键因素,以期为读者提供一个全面而深入的理解。
    的头像 发表于 07-03 15:59 557次阅读

    光伏储能最新技术进展 最新光伏储能发电项目有哪些?

    光伏储能技术是指将太阳能通过光伏电池板转换为电能后,再通过储能系统进行存储和调节的技术。近年来,随着全球对可再生能源的需求不断增长,光伏储能技术得到了快速发展。以下是
    的头像 发表于 05-10 17:49 1990次阅读

    Web HMI快速实现PLC数据的远程监控

    随着web技术快速发展,越来越多的PLC设备集成web服务器。宏Web HMI帮助某自动化龙头企业轻松访问和连接西门子PLC中的web服务器,实现PLC内部关键数据的监控。
    的头像 发表于 03-27 10:49 621次阅读
    宏<b class='flag-5'>集</b>Web HMI<b class='flag-5'>快速</b>实现PLC<b class='flag-5'>数据</b>的远程监控

    语音数据在智能驾驶中的关键作用与应用

    一、引言 随着智能驾驶技术快速发展,语音识别技术在其中扮演着越来越重要的角色。而语音数据作为语音识别
    的头像 发表于 01-31 16:22 512次阅读

    语音数据在智能语音助手中的应用与挑战

    一、引言 随着人工智能技术的不断发展,智能语音助手已经成为了人们日常生活中不可或缺的一部分。语音数据在智能语音助手中发挥着重要作用,为系统提供了丰富的语音数据和信息,推动了智能语音助
    的头像 发表于 01-18 15:46 418次阅读