本文简绍了 HanLP 的使用方法,HanLP 是一系列模型与算法组成的 NLP 工具包,由大快搜索主导并完全开源,目前支持很多功能,项目主要是 Java 的,也支持 python,本文详细简绍 pyhanlp 的使用方法。
简介
HanLP 是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
HanLP 主要功能包括分词、词性标注、关键词提取、自动摘要、依存句法分析、命名实体识别、短语提取、拼音转换、简繁转换等等。
Github 地址:
https://github.com/hankcs/HanLP
官网:
http://hanlp.linrunsoft.com/
实战
1. 安装
2. 分词和词性标注
3.依存句法分析
4.关键词提取
5.摘要提取
6. 感知机词法分析器
7. 中国人名识别
8. 音译人名识别
9. 短语提取
10. 拼音转换
11. 繁简转换
代码已上传:
https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/HanLPDemo.ipynb
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
原文标题:一文掌握 HanLP 用法
文章出处:【微信号:AI_Thinker,微信公众号:人工智能头条】欢迎添加关注!文章转载请注明出处。
相关推荐
CharType.dat.yes 即可。相对比较简单。尝试HanLP主要处于各个开源自然语言处理工具包之间的差异,寻找一个适合学习的开源工具包。 HanLP调用方法HanLP几乎所有
发表于 11-09 10:15
如何在一段文本之中提取出相应的关键词呢? 之前我有想过用机器学习的方法来进行词法分析,但是在项目中测试时正确率不够。于是这时候便有了 HanLP-汉语言处理包 来进行提取关键词的想法。下载:.jar
发表于 11-09 14:54
HanLP的一个很大的好处是离线开源工具包,换而言之,它不仅提供免费的代码免费下载,而且将辛苦收集的词典也对外公开啦,此诚乃一大无私之举.我在安装的时候,主要参照这份博客
发表于 12-10 11:36
的解决方法,大家可以借鉴学习以下! 由于要使用hanlp进行分词,而我们的环境是python环境所以得安装pyhanlp,但是安装过程总是出现这样的问题看上去感觉是缺少了visual c++环境,于是
发表于 12-19 10:27
`本篇分享的依然是关于hanlp的分词使用,文章内容分享自 gladosAI 的博客,本篇文章中提出了一个问题,hanlp分词影响了实验判断结果。为何会如此,不妨一起学习一下 gladosAI
发表于 02-18 10:29
摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名
发表于 07-01 11:34
Python调用hanlp的方法此前有分享过,本篇文章分享自“逍遥自在017”的博客,个别处有修改,阅读时请注意!1.首先安装jpype首先各种坑,jdk和python 版本位数必须一致,我用
发表于 07-17 10:39
实体识别,她用了一个很有意思的方法,自己改了HanLP的词典,手动加了好多词,而且后期版本迭代中还有可能继续改。。。。改了HanLP的词典就意味着不能用maven直接导入仓库里的包了,只能直接将修改后
发表于 10-18 14:33
•182次阅读
【1】确定正确安装配置Java和Eclipse【2】下载HanLp的各种东西http://hanlp.linrunsoft.com/services.html 下载这四个文件到本地,我是放在桌面的一
发表于 10-18 14:46
•357次阅读
!")java.lang.System.out.println("hello world")jpype.shutdownJVM()出错调试,原因已说;测试成功会有输出。下面启动虚拟机跑hanlp2.下载各种安装包使用自定义
发表于 10-18 15:01
•214次阅读
地不让我做中文分词处理(老报错).无奈之下,我只能使用第三方的分词工具.由于standford的源码是java,我寻找了一个与之对应的分词工具,即hanlp.HanLP的安装使用 HanLP的一个很大
发表于 10-18 15:05
•218次阅读
HanLP官方GitHub地址HanLP在java项目中配置HanLP推荐使用Maven方法在poem.xml中加入以下代码
com.hankcs
发表于 11-29 14:38
•1001次阅读
摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,hanlp是一个自然语言处理包,能更好的根据上下文的语义,人名,地名
发表于 11-29 15:01
•342次阅读
,在https://github.com/hankcs/HanLP/releases网站下载hanlp.jar包、模型data包、配置文件hanlp.properties,新建一个文件夹Han
发表于 11-29 15:02
•200次阅读
示波器的使用方法并非很难,重点在于正确使用示波器的使用方法。往期文章中,小编对模拟示波器的使用方法和数字示波器的使用方法均有所介绍。为增进大家对示波器的
发表于 12-24 20:37
•3257次阅读
评论