0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一些NER的英文数据集推荐

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2020-12-26 09:11 次阅读

1MUC Data Sets

https://www-nlpir.nist.gov/related_projects/muc/

2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/

3CoNLL-2003
CoNLL 2003是由新闻通讯社的文章以四种不同的语言(西班牙语、荷兰语、英语和德语)创建的,重点关注4个实体:PER(人员),LOC(位置),ORG(组织)和MISC(其他,包括所有其他类型的实体) https://www.clips.uantwerpen.be/conll2003/ner/


42010 I2B2
2010 I2B2 NER任务考虑了临床数据,重点关注临床问题、测试和治疗实体类型
https://www.i2b2.org/NLP/Relations/

5DDIExtraction2013(Drug NER)
重点关注药品、品牌、集团和药品n(未批准或新药)实体类型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html

6CHEMPROT(Similar to 5)
相比5更侧重于化学和药物实体,例如缩写、配方、家族、标识符等
https://biocreative.bioinformatics.udel.edu/

7 microbiology NER datasets
从PubMed和生物学网站收集,并且主要关注细菌、栖息地和地理位置实体
http://2016.bionlp-st.org/tasks/bb2 (需要FQ访问)

责任编辑:xj

原文标题:一些NER的英文数据集

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24639
  • nlp
    nlp
    +关注

    关注

    1

    文章

    487

    浏览量

    22010

原文标题:一些NER的英文数据集

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    一些常见的动态电路

    无论是模电还是数电,理论知识相对来说还是比较枯燥,各种电路原理理解清楚不算容易,换种生动形象的方式或许会增加一些趣味性,也更容易理解这些知识。下面整理了一些常见的电路,以动态图形的方式展示。 整流
    的头像 发表于 11-16 09:26 181次阅读
    <b class='flag-5'>一些</b>常见的动态电路

    分享一些常见的电路

    理解模电和数电的电路原理对于初学者来说可能比较困难,但通过一些生动的教学方法和资源,可以有效地提高学习兴趣和理解能力。 下面整理了一些常见的电路,以动态图形的方式展示。 整流电路 单相桥式整流
    的头像 发表于 11-13 09:28 189次阅读
    分享<b class='flag-5'>一些</b>常见的电路

    LED驱动器应用的一些指南和技巧

    电子发烧友网站提供《LED驱动器应用的一些指南和技巧.pdf》资料免费下载
    发表于 09-25 11:35 0次下载
    LED驱动器应用的<b class='flag-5'>一些</b>指南和技巧

    pycharm怎么训练数据

    安装了PyCharm。接下来,你需要安装一些用于数据处理和机器学习的库。在PyCharm中,你可以通过以下步骤安装库: 打开PyCharm,创建个新的项目。 转到“File” > “Settings
    的头像 发表于 07-11 10:10 556次阅读

    咨询一些关于LED灯具的问题

    各位大佬,咨询一些关于LED灯具的问题 120W的吸顶灯,用的非隔离式电源,用不到1年,灯具就会闪烁、频闪或不亮,主要是什么原因造成的?是不是驱动芯片太差?
    发表于 07-02 22:33

    细谈SolidWorks教育版的一些基础知识

    SolidWorks教育版是款广泛应用于工程设计和教育领域的三维建模软件。它具备直观易用的操作界面和强大的设计功能,为学生提供了个学习和实践的平台。在本文中,我们将详细探讨SolidWorks教育版的一些基础知识,帮助初学者
    的头像 发表于 04-01 14:35 313次阅读

    555成芯片有哪些缺点

    555成芯片尽管在电子应用中具有许多优点,但也存在一些缺点,这些缺点可能在一些特定的应用场景中限制其使用。
    的头像 发表于 03-26 14:53 926次阅读

    一些有关通信电路的资料?

    有关嵌入式之间DSP、ARM、FPGA三者之间和这三款芯片和外部电路之间通信的一些资料,比如说芯片之间的并行通信和芯片和外部电路之间的串行通信,MODBUS、DP、CAN等,一些一些常用的通信协议的
    发表于 03-03 18:53

    一些无功补偿装置SVG的资料

    一些SVG电路原理和功能码相关的技术说明书,想了解一些SVG的工作原理和工作过程
    发表于 02-03 10:13

    自动驾驶领域的数据汇总

    发自动驾驶论文哪少的了数据,今天笔者将为大家推荐篇最新的综述,总结了200多个自动驾驶领域的数据,大家堆工作量的时候也可以找
    的头像 发表于 01-19 10:48 946次阅读
    自动驾驶领域的<b class='flag-5'>数据</b><b class='flag-5'>集</b>汇总

    AI算力数据中心的一些挑战

    AI或者人工智能自1956年提出至今已有几十年的历史。过去的几十年里面,人工智能的热度经历了三次浪潮,第次提出人工智能之后出现一些新的技术,也应用到了工业生产上,但是很快大家发现所谓的人工智能还不是那么智能,波浪潮过去之后,
    发表于 12-25 11:25 525次阅读
    AI算力<b class='flag-5'>数据</b>中心的<b class='flag-5'>一些</b>挑战

    请问ADE9153A的autocalibration功能有没有一些测试数据或性能比较吗?

    请问ADE9153A的autocalibration功能有没有一些测试数据或性能比较吗?非常感谢!!
    发表于 12-25 07:45

    对于大模型RAG技术的一些思考

    大模型或者句向量在训练时,使用的语料都是较为通用的语料。这导致了这些模型,对于垂直领域的知识识别是有缺陷的。它们没有办法理解企业内部的一些专用术语,缩写所表示的具体含义。这样极大地影响了生成向量的精准度,以及大模型输出的效果。
    的头像 发表于 12-07 09:41 1090次阅读
    对于大模型RAG技术的<b class='flag-5'>一些</b>思考

    提高嵌入式代码质量的一些方法

    的事情搞复杂,我希望这些文字能给迷惑中的人们指出一些正确的方向,让他们少走一些弯路,基本做到一分耕耘一分收获。
    的头像 发表于 11-30 09:15 431次阅读

    单对以太网(SPE)线缆的一些主要特性、优点和应用

    单对以太网(SPE)线缆的一些主要特性、优点和应用 以太网(Ethernet)是种常见的局域网(LAN)技术,它通过传输数据包来连接计算机和其他网络设备。随着科技的发展,以太网也不断演进,其中
    的头像 发表于 11-27 16:19 927次阅读