资料介绍
软件简介
NCChineseConverter 是一个 基于 Objective-C 的中文简繁正转换库. 除此之外, 本项目还包括一个 Python 的词库转换工具.
本库的基本实现原理: 从 Mediawiki 提供的字典中提取数据, 转换为自己需要的格式, 然后用最大正向匹配算法进行字符替换.
特点
-
可以只使用单一词库
-
可扩充自定义词库
-
提供 NSString 的 Category
使用方法
-
用词典工具生成词典
-
把生成的词典放在项目的 Resources 目录下
-
按如下方式引用转换库和调用
#import "NCChineseConverter.h" … NSString *oriString = @""; NSString *result = [[NCChineseConverter sharedInstance] convert:oriString withDict:NCChineseConverterDictTypezh2TW]; …
Tool
下载词库并生成词典:
python dictgenerator.py
用本地词库生成词典(适用于已经下载了词库文件):
python dictgenerator.py n
利用词典工具会在当前目录生成如下词典文件:
-
zh2TW.txt (简体 -> 台湾正体)
-
zh2HK.txt (简体 -> 港澳繁体)
-
zh2SG.txt (简体 -> 新马繁体)
-
zh2CN.txt (繁体/正体 -> 大陆简体)
方便起见, 我在 dictionary 目录中放了转换好的词典文件. 目录名称即为词典生成时间.
注意: 请勿修改文件名, 转换库是严格按照文件名来读取词典的.
自定义扩充转换词组
词典工具是根据 Mediawiki 的词库来进行词典生成, 所以要等待 Mediawiki 的词库更新才能得到新的词典. 如果你有一些 Mediawiki 里没有的词语要扩充, 则可以使用该方法来使用.
使用前缀相同的字典文件来进行自定义词组的扩充, 转换库会自动加载对应的扩充字典.
比如, 把你自己的 简体 -> 台湾正体 词典命名为 zh2TW.custom.txt, 这样转换库就可以自动加载这个词典并在转换时使用.
备注
虽然词典工具一次生成四个词典, 但是你可以视情况只使用其中一个或多个. 需要注意的是如果你没有在项目中放入某个词典文件, 那么要避免在代码里调用该字典.
未来改进
-
增加更多转换词库
-
使用 Double-array Trie Tree 来构造原始字典, 提高搜索速度
-
改进分词算法
背景
简繁正的问题在此不多说, 都是历史遗留问题, 具体情况可以自行查看 Wikipedia, 用自己的思考去判断(漢字簡化爭論). 在此只讨论技术相关问题.
简繁转换不是单纯的从一个字转换为另一个字, 他包含很多内容, 如:
-
各种繁体/正体. 如: 港澳繁体, 台湾正体. 再加上各个华人地区的中文(如新加坡)使用等.
-
简体和繁体的对照往往不止一对一, 而是一对二, 一对三, 甚至一对五(多繁對一簡問題)
目前比较常用的转换方式主要是 Wikipedia 的转换方式 和 OpenCC.
Wikipedia 进行简繁转换的操作流程参见: 繁简处理
OpenCC 的库相对比较专业. 不过这是一个 C 库, 所以如果要在 iOS 下使用, 则需要自己把库编译成 iOS 可以使用的库再进行调用.
参考
- STM32固件库使用手册的中文版 0次下载
- STM32固件库使用手册中文版以及技术手册中文版pdf 0次下载
- 基于VB的转换Access数据库为Excel文件实验
- 推挽正激零电流转换DC-DC变换器的研究与实现
- 西门子S7_200模拟量转换库的使用 48次下载
- 宽输入范围电路模式DC-DC升压转换器芯片XL6009 17次下载
- 面向云数据库的属性基加密和查询转换中间件 5次下载
- AN1246中文手册之如何在Microchip图形库中创建控件
- dsPIC DSC DTMF 生成库的详细中文资料概述
- 如何对dsPIC33E系列器件使用采样率转换库的详细中文资料概述
- Stellaris软件库的安装,特性介绍和资源说明详细中文概述 5次下载
- linux_C函数库中文手册 14次下载
- STM32固件库说明(中文版) 0次下载
- orcad与dxdesigner库转换器
- 简繁体字转换软件下载
- proteus元件转换方向快捷键 proteus元件库没有的元件怎样搞 5624次阅读
- 聊聊日志即数据库 529次阅读
- 对象转换工具:MapStruct 库 898次阅读
- Linux中的静态库和共享库 850次阅读
- 正输出和负输出DC-DC转换器使用相同的合格器件 1163次阅读
- 长期降低成本:正输出和负输出DC-DC转换器使用相同的合格器件 680次阅读
- 关于STEP7库功能字符串转换 3661次阅读
- Smart200库文件添加的Scale指令 1.5w次阅读
- 基于LTC7149的正至负转换器解决方案 730次阅读
- 云数据库和自建数据库的区别及应用 4412次阅读
- 如何实现电平转换,多种方法 1.1w次阅读
- 如何使用采用SPI Flash存储中文字符库的方法说明 6254次阅读
- 将负脉冲转换为正脉冲 9312次阅读
- STM32标准库改为HAL库的程序实现 3.4w次阅读
- 如何将Altium Designer 6.0的库档转换成99se的格式 6031次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多