自然语言基础技术之命名实体识别相对全面的介绍-电子发烧友网

本文对自然语言基础技术之命名实体识别进行了相对全面的介绍，包括定义、发展历史、常见方法、以及相关数据集，最后推荐一大波 Python 实战利器，并且包括工具的用法。

定义

先来看看维基百科上的定义：Named-entity recognition (NER) (also known as entity identification, entity chunking and entity extraction) is a subtask of information extraction that seeks to locate and classify named entity mentions in unstructured text into pre-defined categories such as the person names, organizations, locations, medical codes, time expressions, quantities, monetary values, percentages, etc.

命名实体识别（Named Entity Recognition，简称NER），又称作“专名识别”，是指识别文本中具有特定意义的实体，主要包括人名、地名、机构名、专有名词等。简单的讲，就是识别自然文本中的实体指称的边界和类别。

发展历史

命名实体识别这个术语首次出现在 MUC-6（Message Understanding Conferences），这个会议关注的主要问题是信息抽取（Information Extraction），第六届 MUC 除了信息抽取评测任务还开设了新评测任务即命名实体识别任务。

除此之外，其他相关的评测会议包括CoNLL（Conference on Computational Natural Language Learning）、ACE（Automatic Content Extraction）和IEER（Information Extraction-Entity Recognition Evaluation）等。

在MUC-6之前，大家主要是关注人名、地名和组织机构名这三类专业名词的识别。自MUC-6起，后面有很多研究对类别进行了更细致的划分，比如地名被进一步细化为城市、州和国家，也有人将人名进一步细分为政治家、艺人等小类。

此外，一些评测还扩大了专业名词的范围，比如CoNLL某年组织的评测中包含了产品名的识别。一些研究也涉及电影名、书名、项目名、研究领域名称、电子邮件地址、电话号码以及生物信息学领域的专有名词（如蛋白质、DNA、RNA等）。甚至有一些工作不限定“实体”的类型，而是将其当做开放域的命名实体识别和分类。

常见方法

早期的命名实体识别方法基本都是基于规则的。之后由于基于大规模的语料库的统计方法在自然语言处理各个方面取得不错的效果之后，一大批机器学习的方法也出现在命名实体类识别任务。宗成庆老师在统计自然语言处理一书粗略的将这些基于机器学习的命名实体识别方法划分为以下几类：

有监督的学习方法：这一类方法需要利用大规模的已标注语料对模型进行参数训练。目前常用的模型或方法包括隐马尔可夫模型、语言模型、最大熵模型、支持向量机、决策树和条件随机场等。值得一提的是，基于条件随机场的方法是命名实体识别中最成功的方法。

半监督的学习方法：这一类方法利用标注的小数据集（种子数据）自举学习。

无监督的学习方法：这一类方法利用词汇资源（如 WordNet）等进行上下文聚类。

混合方法：几种模型相结合或利用统计方法和人工总结的知识库。

值得一提的是，由于深度学习在自然语言的广泛应用，基于深度学习的命名实体识别方法也展现出不错的效果，此类方法基本还是把命名实体识别当做序列标注任务来做，比较经典的方法是 LSTM+CRF、BiLSTM+CRF。

python自然语言

最近，python自然语言是越来越火了，那么什么是自然语言。自然语言（Natural Language ）广纳了众多技术，对自然或人类

发表于 05-02 13:50

自然语言处理技术介绍

，包括：分词、词性标注、句法分析、命名实体识别，以及信息抽取领域的实体关系抽取等。2.1.分词分词是自然语言处理技术的基础构成之一，并且是其

发表于 09-27 09:57

hanlp汉语自然语言处理入门基础知识介绍

人工智能。自然语言处理涉及的几个层次：作为输入一共有两个来源，语音与文本。所以第一级是语音识别和OCR或分词（事实上，跳过分词虽然理所当然地不能做句法分析，但字符级也可以直接做不少应用）。接下来是形态学

发表于 01-02 14:43

HanLP分词命名实体提取详解

名、地名等都称之为实体。在工程领域，招投标文件里的这些实体信息至关重要。利用自然语言处理技术从形式各异的文件中提取出这些实体，能有效提高工作

发表于 01-11 14:32

HanLP-命名实体识别总结

的中国人名自动识别研究》，大家可以百度一下看看地名识别理论指导文章为：《基于层叠隐马尔可夫模型的中文命名实体识别》机构名识别机构名的

发表于 07-31 13:11

【推荐体验】腾讯云自然语言处理

`相信大家对NLP自然语言处理的技术都不陌生，它是计算机科学领域和AI领域中的一个分支，它与计算机和人类之间使用自然语言进行交互密切相关，而NLP的最终目标是使计算机能够像人类一样理解语言

发表于 10-09 15:28

什么是自然语言处理

什么是自然语言处理？自然语言处理任务有哪些？自然语言处理的方法是什么？

发表于 09-08 06:51

基于神经网络结构在命名实体识别中应用的分析与总结

近年来，基于神经网络的深度学习方法在自然语言处理领域已经取得了不少进展。作为NLP领域的基础任务—命名实体识别（Named Entity Recognition，NER）也不例外，神经网络结构在

发表于 01-18 09:24 •4715次阅读

思必驰中文命名实体识别任务助力AI落地应用

数据集基于清华大学开源的文本分类数据集THUCTC[2]，选出部分进行细粒度命名实体标注。原数据来源于Sina News RSS[3]。这项测评是中文自然语言处理领域的大规模赛事，有众多知名企业同台竞技

发表于 02-22 18:27 •1944次阅读

命名实体识别的迁移学习相关研究分析

命名实体识别（NER）是自然语言处理的核心应用任务之一。传统和深度命名实体识别方法严重依赖于大量具有相同分布的标注训练数据，模型可移植性差。

发表于 04-02 15:15 •8次下载

基于字语言模型的中文命名实体识别系统

造成的数据稀缺问题，以及传统字向量不能解决的一字多义问題，文中使用在大规模无监督数据上预训练的基于上下文相关的字向量，即利用语言模型生成上下文相关字向量以改进中文NER模型的性能。同时，为解决命名实体识别中的未登

发表于 04-08 14:36 •14次下载

关于边界检测增强的中文命名实体识别

引言 命名实体识别（Named Entity Recognition，NER）是自然语言处理领域的一个基础任务，是信息抽取等许多任务的子任务，旨在识别非结构化文本中属于预先定义的类别的

发表于 09-22 16:05 •3219次阅读

自然语言列举法描述法各自的特点

自然语言文本。在自然语言处理中，列举法和描述法是两种常见的方法。列举法列举法是一种基于规则的方法，它通过列举所有可能的情况来解决问题。在自然语言处理中，列举法通常用于词性标注、命名实体

发表于 07-03 14:13 •1253次阅读

nlp自然语言处理的主要任务及技术方法

自然语言处理（Natural Language Processing，简称NLP）是人工智能和语言学领域的一个分支，它研究如何让计算机能够理解、生成和处理人类语言。NLP技术在许多领域

发表于 07-09 10:26 •1367次阅读

图像识别技术包括自然语言处理吗

图像识别技术与自然语言处理是人工智能领域的两个重要分支，它们在很多方面有着密切的联系，但也存在一些区别。一、图像识别技术与

发表于 07-16 10:54 •991次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

自然语言基础技术之命名实体识别相对全面的介绍

评论

python自然语言

自然语言处理技术介绍

hanlp汉语自然语言处理入门基础知识介绍

HanLP分词命名实体提取详解

HanLP-命名实体识别总结

【推荐体验】腾讯云自然语言处理

什么是自然语言处理

基于神经网络结构在命名实体识别中应用的分析与总结

思必驰中文命名实体识别任务助力AI落地应用

命名实体识别的迁移学习相关研究分析

基于字语言模型的中文命名实体识别系统

关于边界检测增强的中文命名实体识别

自然语言列举法描述法各自的特点

nlp自然语言处理的主要任务及技术方法

图像识别技术包括自然语言处理吗