0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一些NER的英文数据集推荐

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2020-12-26 09:11 次阅读

1MUC Data Sets

https://www-nlpir.nist.gov/related_projects/muc/

2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/

3CoNLL-2003
CoNLL 2003是由新闻通讯社的文章以四种不同的语言(西班牙语、荷兰语、英语和德语)创建的,重点关注4个实体:PER(人员),LOC(位置),ORG(组织)和MISC(其他,包括所有其他类型的实体) https://www.clips.uantwerpen.be/conll2003/ner/


42010 I2B2
2010 I2B2 NER任务考虑了临床数据,重点关注临床问题、测试和治疗实体类型
https://www.i2b2.org/NLP/Relations/

5DDIExtraction2013(Drug NER)
重点关注药品、品牌、集团和药品n(未批准或新药)实体类型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html

6CHEMPROT(Similar to 5)
相比5更侧重于化学和药物实体,例如缩写、配方、家族、标识符等
https://biocreative.bioinformatics.udel.edu/

7 microbiology NER datasets
从PubMed和生物学网站收集,并且主要关注细菌、栖息地和地理位置实体
http://2016.bionlp-st.org/tasks/bb2 (需要FQ访问)

责任编辑:xj

原文标题:一些NER的英文数据集

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1186

    浏览量

    24465
  • nlp
    nlp
    +关注

    关注

    1

    文章

    465

    浏览量

    21888

原文标题:一些NER的英文数据集

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    为什么在一些路由器中使用ESP32的Active mode无法接收服务器的TCP数据呢?

    在“ARRIS”和其他一些路由器中,我们面临这个问题。 ① 在设置 AT+CIPRECVMODE=0 (Active mode)中,我们无法从服务器接收 TCP 数据。 ② 在同个服务器上,如果
    发表于 06-27 07:34

    一些有关通信电路的资料?

    有关嵌入式之间DSP、ARM、FPGA三者之间和这三款芯片和外部电路之间通信的一些资料,比如说芯片之间的并行通信和芯片和外部电路之间的串行通信,MODBUS、DP、CAN等,一些一些常用的通信协议的
    发表于 03-03 18:53

    一些无功补偿装置SVG的资料

    一些SVG电路原理和功能码相关的技术说明书,想了解一些SVG的工作原理和工作过程
    发表于 02-03 10:13

    M453VG6AE如何在ROM中存储一些自定义的数据

    芯片: M453VG6AE 我想芯片内部的ROM中存储一些自定义的数据,该怎么做? 必须要考虑个问题:如何选址才能防止与APROM,LDROM,配置区地址突冲?
    发表于 01-17 06:03

    请问PDMA集散-ping-pang模式,数据帧卡到了尾部和头部,这种该怎么处理比较好一些

    请问PDMA集散-ping-pang模式,数据帧卡到了尾部和头部,这种该怎么处理比较好一些? 比如数据帧100字节,缓存buff[
    发表于 01-16 07:50

    有关通信协议时一些问题?

    工业上应用到许多种协议,按通信同时刻发送的数据位数分为串行通信和并行通信,首先我见并行通信多在芯片之间进行通信,而串行通信则在外部设备和芯片之间进行的一些通信,对于常见的串行通信,比如
    发表于 01-14 00:58

    往Aducm320 Flash中写入了一些数据,如何才能读出来?

    往Aducm320Flash中写入了一些数据,如何才能读出来? ADUCM320关于擦除,写入,读写保护等操作在数据手册及例程上均有明确说明与相关例程,但是在读取方面我未发现有明确的描述如何操作,也无相关例程有所参考,故请提供
    发表于 01-12 07:41

    请问ADE9153A的autocalibration功能有没有一些测试数据或性能比较吗?

    请问ADE9153A的autocalibration功能有没有一些测试数据或性能比较吗?非常感谢!!
    发表于 12-25 07:45

    变频电机和YZR电机哪个更好一些

    变频电机和YZR电机,谁更好一些
    发表于 11-23 08:10

    ALTERA关于CCD的一些verilog实验程序分享

    ALTERA关于CCD的一些verilog实验程序
    发表于 09-26 08:03

    用哪种单片机设计计步器好一些

    用哪种单片机设计计步器好一些?为什么?
    发表于 09-26 07:54

    《 AI加速器架构设计与实现》+学习和一些思考

    :神经网络的结构、数据流向和基本运算类型 高效设计的核心问题是:阵列和阵列的组织形式,如何最大化的利用运算单元,减少无谓的开销(包括运算开销和储存开销) 读书报告的内容包括书籍内容和一些自己的学习理解
    发表于 09-16 11:11

    M453VG6AE如何在ROM中存储一些自定义的数据

    芯片: M453VG6AE 我想芯片内部的ROM中存储一些自定义的数据,该怎么做? 必须要考虑个问题:如何选址才能防止与APROM,LDROM,配置区地址突冲?
    发表于 08-29 06:47

    想往ROM中预存一些数据,需要怎么操作?

    请问想往ROM中预存一些数据,需要怎么操作?没有找到教程
    发表于 08-11 10:36

    ARM指令集体系结构(ISA)的一些功能介绍

    本指南介绍了特定于每个ARM指令集体系结构(ISA)的一些功能,并考虑了哪些应用程序最好地利用了这些功能。该指南的重点是Cortex-R。然而,我们也考虑Cortex-A和Cortex-M,在帮
    发表于 08-02 07:39