0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一些NER的英文数据集推荐

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2020-12-26 09:11 次阅读

1MUC Data Sets

https://www-nlpir.nist.gov/related_projects/muc/

2CoNLL-2002
https://www.clips.uantwerpen.be/conll2002/ner/

3CoNLL-2003
CoNLL 2003是由新闻通讯社的文章以四种不同的语言(西班牙语、荷兰语、英语和德语)创建的,重点关注4个实体:PER(人员),LOC(位置),ORG(组织)和MISC(其他,包括所有其他类型的实体) https://www.clips.uantwerpen.be/conll2003/ner/


42010 I2B2
2010 I2B2 NER任务考虑了临床数据,重点关注临床问题、测试和治疗实体类型
https://www.i2b2.org/NLP/Relations/

5DDIExtraction2013(Drug NER)
重点关注药品、品牌、集团和药品n(未批准或新药)实体类型
https://www.cs.york.ac.uk/semeval-2013/task9/index.html

6CHEMPROT(Similar to 5)
相比5更侧重于化学和药物实体,例如缩写、配方、家族、标识符等
https://biocreative.bioinformatics.udel.edu/

7 microbiology NER datasets
从PubMed和生物学网站收集,并且主要关注细菌、栖息地和地理位置实体
http://2016.bionlp-st.org/tasks/bb2 (需要FQ访问)

责任编辑:xj

原文标题:一些NER的英文数据集

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据集
    +关注

    关注

    4

    文章

    1200

    浏览量

    24617
  • nlp
    nlp
    +关注

    关注

    1

    文章

    483

    浏览量

    21985

原文标题:一些NER的英文数据集

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    LED驱动器应用的一些指南和技巧

    电子发烧友网站提供《LED驱动器应用的一些指南和技巧.pdf》资料免费下载
    发表于 09-25 11:35 0次下载
    LED驱动器应用的<b class='flag-5'>一些</b>指南和技巧

    pycharm怎么训练数据

    安装了PyCharm。接下来,你需要安装一些用于数据处理和机器学习的库。在PyCharm中,你可以通过以下步骤安装库: 打开PyCharm,创建个新的项目。 转到“File” > “Settings
    的头像 发表于 07-11 10:10 502次阅读

    细谈SolidWorks教育版的一些基础知识

    SolidWorks教育版是款广泛应用于工程设计和教育领域的三维建模软件。它具备直观易用的操作界面和强大的设计功能,为学生提供了个学习和实践的平台。在本文中,我们将详细探讨SolidWorks教育版的一些基础知识,帮助初学者
    的头像 发表于 04-01 14:35 303次阅读

    555成芯片有哪些缺点

    555成芯片尽管在电子应用中具有许多优点,但也存在一些缺点,这些缺点可能在一些特定的应用场景中限制其使用。
    的头像 发表于 03-26 14:53 896次阅读

    一些有关通信电路的资料?

    有关嵌入式之间DSP、ARM、FPGA三者之间和这三款芯片和外部电路之间通信的一些资料,比如说芯片之间的并行通信和芯片和外部电路之间的串行通信,MODBUS、DP、CAN等,一些一些常用的通信协议的
    发表于 03-03 18:53

    一些无功补偿装置SVG的资料

    一些SVG电路原理和功能码相关的技术说明书,想了解一些SVG的工作原理和工作过程
    发表于 02-03 10:13

    自动驾驶领域的数据汇总

    发自动驾驶论文哪少的了数据,今天笔者将为大家推荐篇最新的综述,总结了200多个自动驾驶领域的数据,大家堆工作量的时候也可以找
    的头像 发表于 01-19 10:48 911次阅读
    自动驾驶领域的<b class='flag-5'>数据</b><b class='flag-5'>集</b>汇总

    AI算力数据中心的一些挑战

    AI或者人工智能自1956年提出至今已有几十年的历史。过去的几十年里面,人工智能的热度经历了三次浪潮,第次提出人工智能之后出现一些新的技术,也应用到了工业生产上,但是很快大家发现所谓的人工智能还不是那么智能,波浪潮过去之后,
    发表于 12-25 11:25 504次阅读
    AI算力<b class='flag-5'>数据</b>中心的<b class='flag-5'>一些</b>挑战

    请问ADE9153A的autocalibration功能有没有一些测试数据或性能比较吗?

    请问ADE9153A的autocalibration功能有没有一些测试数据或性能比较吗?非常感谢!!
    发表于 12-25 07:45

    对于大模型RAG技术的一些思考

    大模型或者句向量在训练时,使用的语料都是较为通用的语料。这导致了这些模型,对于垂直领域的知识识别是有缺陷的。它们没有办法理解企业内部的一些专用术语,缩写所表示的具体含义。这样极大地影响了生成向量的精准度,以及大模型输出的效果。
    的头像 发表于 12-07 09:41 1057次阅读
    对于大模型RAG技术的<b class='flag-5'>一些</b>思考

    提高嵌入式代码质量的一些方法

    的事情搞复杂,我希望这些文字能给迷惑中的人们指出一些正确的方向,让他们少走一些弯路,基本做到一分耕耘一分收获。
    的头像 发表于 11-30 09:15 421次阅读

    我们为什么需要了解一些先进封装?

    我们为什么需要了解一些先进封装?
    的头像 发表于 11-23 16:32 536次阅读
    我们为什么需要了解<b class='flag-5'>一些</b>先进封装?

    西门子伺服驱动器维修的一些基本知识

    西门子伺服驱动器维修的一些基本知识
    的头像 发表于 11-23 10:55 1648次阅读

    分享一些SystemVerilog的coding guideline

    本文分享一些SystemVerilog的coding guideline。
    的头像 发表于 11-22 09:17 663次阅读
    分享<b class='flag-5'>一些</b>SystemVerilog的coding  guideline

    PCB抄板的一些方法

    拆掉所有器多层板抄板件,并且将PAD孔里的锡去掉。用酒精将PCB清洗干净,然后放入扫描仪内,扫描仪扫描的时候需要稍调高一些扫描的像素, 以便得到较清晰的图像。
    的头像 发表于 11-15 17:04 860次阅读
    PCB抄板的<b class='flag-5'>一些</b>方法