将汉字转为拼音,可以用于批量汉字注音、文字排序、拼音检索文字等常见场景。
现在互联网上有许多拼音转换工具,基于Python的开源模块也不少,今天给大家介绍一个功能特性最多的模块: ** pypinyin
** ,它支持以下特性:
-
- 根据词组智能匹配最正确的拼音。
-
- 支持多音字。
-
- 简单的繁体支持, 注音支持。
-
- 支持多种不同拼音/注音风格。
-
- 命令行工具一键转化
1.准备
开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章:超详细Python安装指南 进行安装。
(可选1) 如果你用Python的目的是数据分析,可以直接安装Anaconda:Python数据分析与挖掘好帮手—Anaconda,它内置了Python和pip.
(可选2) 此外,推荐大家用VSCode编辑器,它有许多的优点:Python 编程的最好搭档—VSCode 详细指南。
请选择以下任一种方式输入命令安装依赖 :
- Windows 环境 打开 Cmd (开始-运行-CMD)。
- MacOS 环境 打开 Terminal (command+空格输入Terminal)。
- 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install pypinyin
2.基本使用
最普通的拼音转化方法如下:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心')
# [['zhōng'], ['xīn']]
识别多音字:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心', heteronym=True) # 启用多音字模式
# [['zhōng', 'zhòng'], ['xīn']]
设置输出风格,只识别首字母:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
pinyin('中心', style=Style.FIRST_LETTER) # 设置拼音风格
# [['z'], ['x']]
修改音调输出位置,在相应字母的后面显示音调,或者拼音的最后显示音调:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
# TONE2 在相应字母的后面显示音调
pinyin('中心', style=Style.TONE2, heteronym=True)
# [['zho1ng', 'zho4ng'], ['xi1n']]
# TONE3 拼音的最后显示音调
pinyin('中心', style=Style.TONE3, heteronym=True)
# [['zhong1', 'zhong4'], ['xin1']]
不考虑多音字的情况:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
lazy_pinyin('中心') # 不考虑多音字的情况
# ['zhong', 'xin']
不使用v来代替ü:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
lazy_pinyin('战略', v_to_u=True) # 不使用 v 表示 ü
# ['zhan', 'lüe']
标记轻声:
# Python实用宝典
from pypinyin import pinyin, lazy_pinyin, Style
# 使用 5 标识轻声
lazy_pinyin('衣裳', style=Style.TONE3, neutral_tone_with_five=True)
# ['yi1', 'shang5']
使用命令行一键识别拼音:
# Python实用宝典
python -m pypinyin 音乐
# yīn yuè
3.高级使用
自定义拼音显示风格
我们可以通过** register()
**来实现自定义拼音风格的需求:
from pypinyin import lazy_pinyin
from pypinyin.style import register
@register('kiss')
def kiss(pinyin, **kwargs):
return '
-
互联网
+关注
关注
54文章
11103浏览量
102991 -
开源
+关注
关注
3文章
3244浏览量
42384 -
python
+关注
关注
56文章
4781浏览量
84445
发布评论请先 登录
相关推荐
评论