hanlp源码解读之字符正规化CharTable

概述：字符正规化是指在分词之前把繁体转成简体、大写转成小写等，在自然语言处理中这是必不可以的一个步骤！在hanlp中的实现方法是基于词典的，也就是正规则字符对照表。就是“data/dictionary/other/CharTable.txt” 这个词典，打开后是下面这个样子的！

«=《

「=“

」=”

『=‘

』=’

【=《

〗="

〝="

〞="

と=之

ふ=子

ル=儿

ㄖ=日

丟=丢

在java程序中如何实现呢，相信大部分人会想用到用HashMap缓存起来不就可以了吗！当然，这个方法是可行的，但是HashMap在数据量比较大时，时间复杂度是接近O(n)的。这也是为什么加载词典用trie树，而不是直接用HashMap的原因了,当然内存也是一个方面，本篇文章不会讨论！下面我们来看下hanlp代码里的具体实现。

在hanlp中，是采用一维数据实现的，下面一步步来看源码的实现！源码位于com.hankcs.hanlp.HanLP包下的CharTable类中，这个类主是要加把 CharTable.txt加载到一维数组中。为了方便阅读，下面直接在代码中加入注释!

在分词之前会首化调用正规化接口（在启用正规化的情况下）

public List seg(char[] text)

{

assert text != null;

if (HanLP.Config.Normalization)

{

CharTable.normalization(text);//执行正规化

}

return segSentence(text);

}

下面来看下CharTable.normalization(text);这个函数的实现：这个函数极其简单，就是对text中的每个字符查询一维数据COVERT,看到这里应该就能明白，正规化最重要的就是加载txt文件到CONVERT数组中

public static void normalization(char[] charArray)

{

assert charArray != null;

for (int i = 0; i < charArray.length; i++)

{

charArray[i] = CONVERT[charArray[i]];

}

下面看具本的代码，敝人在代码中都加入了注释，此处不再另行讲解

/**

* 字符正规化表

* @author hankcs

public class CharTable

{

/**

* 正规化使用的对应表

* 存储原理是CONVERT[line.charAt(0)] = CONVERT[line.charAt(2)];

* line.charAt(0)是词典中的源始字符（如①），line.charAt(2)是正规化后的字符（如一）

* ①=一

* ②=二

* ④=四

* ⑤=伍

* 这样以来在正规化时直接 charArray[i] = CONVERT[charArray[i]];就可以了，时间复杂度是O(1)

public static char[] CONVERT;

static

{

long start = System.currentTimeMillis();

if (!load(HanLP.Config.CharTablePath))//通过static语句块加载词典，hanlp中所有的词典都是这种方法加载的

{

logger.severe("字符正规化表加载失败");

System.exit(-1);

}

logger.info("字符正规化表加载成功：" + (System.currentTimeMillis() - start) + " ms");

}

/**

* 首先偿试加载CharTable.txt.bin序列化词典，首次编译好词典会序列化到CharTable.txt.bin中

* 如果CharTable.txt.bin不存在，则加载CharTable.txt文件

* 对于这个词典来说加载CharTable.txt.bin和CharTable.txt在效率上基本上是没有区别的，因为不存在编译的过程

* 便CoreNatureDictionary.txt这类词典因为要编译成trie树，是需要一定时间的

* @param path

* @return

private static boolean load(String path)

{

String binPath = path + Predefine.BIN_EXT;

if (loadBin(binPath)) return true;//二进制的词典存在直接读入到CONVERT数组中即可

CONVERT = new char[Character.MAX_VALUE + 1];

for (int i = 0; i < CONVERT.length; i++)//这个循环用来初始化数组，避免在使用时出现null的情况

{

CONVERT[i] = (char) i;

}

IOUtil.LineIterator iterator = new IOUtil.LineIterator(path);//读入txt对照表

while (iterator.hasNext())

{

String line = iterator.next();

if (line == null) return false;

if (line.length() != 3) continue;

CONVERT[line.charAt(0)] = CONVERT[line.charAt(2)];//这个其实就是正规化时的对照表，虽然简单的一条语句就实现了，但是这种思考问题的方式和编码风格还是非常值和得学习的

}

logger.info("正在缓存字符正规化表到" + binPath);

IOUtil.saveObjectTo(CONVERT, binPath);

return true;

}

/**

* 这个函数主要用来加载.bin对照表到CONVERT数组中

* @param path

* @return

private static boolean loadBin(String path)

{

try

{

ObjectInputStream in = new ObjectInputStream(IOUtil.newInputStream(path));

CONVERT = (char[]) in.readObject();

in.close();

}

catch (Exception e)

{

logger.warning("字符正规化表缓存加载失败，原因如下：" + e);

return false;

}

return true;

}

/**

* 将一个字符正规化

* @param c 字符

* @return 正规化后的字符

public static char convert(char c)

{

return CONVERT[c];

}

public static char[] convert(char[] charArray)

{

char[] result = new char[charArray.length];

for (int i = 0; i < charArray.length; i++)

{

result[i] = CONVERT[charArray[i]];

}

return result;

}

public static String convert(String charArray)

{

assert charArray != null;

char[] result = new char[charArray.length()];

for (int i = 0; i < charArray.length(); i++)

{

result[i] = CONVERT[charArray.charAt(i)];

}

return new String(result);

}

/**

* 正规化一些字符（原地正规化）

* @param charArray 字符

public static void normalization(char[] charArray)

{

assert charArray != null;

for (int i = 0; i < charArray.length; i++)

{

charArray[i] = CONVERT[charArray[i]];

}

文章来源于亚当-adam的博客

阅读全文

字符型、指针型等变量等该如何初始化

　对于数值类型的变量往往初始化为0，但对于其他类型的变量，如字符型、指针型等变量等该如何初始化呢？

2024-03-18 11:02:57

Helix QAC—源码级静态自动化测试工具

Helix QAC概述 Helix QAC是一款源码级静态自动化测试工具，主要用于C/C++代码的完全自动化静态分析工作，提供一个高效、健壮

2024-03-15 16:59:11

EMC技术：基础概念到应用的解读？

EMC技术：基础概念到应用的解读？|深圳比创达电子

2024-03-11 11:55:05

C语言字符串编译函数介绍

在C语言中，字符串实际上是使用null字符O'终止的一维字符数组。因此，一个以null结尾的字符串，包含了组成字符串的字符。

2024-03-07 16:18:54

172

OneFlow Softmax算子源码解读之BlockSoftmax

写在前面：笔者这段时间工作太忙，身心俱疲，博客停更了一段时间，现在重新捡起来。本文主要解读 OneFlow 框架的第二种 Softmax 源码实现细节，即 block 级别的 Softmax。

2024-01-08 09:26:49

289

OneFlow Softmax算子源码解读之WarpSoftmax

写在前面：近来笔者偶然间接触了一个深度学习框架 OneFlow，所以这段时间主要在阅读 OneFlow 框架的 cuda 源码。官方源码基于不同场景分三种方式实现 Softmax，本文主要介绍其中一种的实现过程，即 Warp 级别 Softmax，适用于矩阵宽度不超过 1024 的情况。

2024-01-08 09:24:18

286

labview扫描字符串怎么用

LabVIEW 是一种流程化编程语言和开发环境，主要用于控制、测量和监测系统。在 LabVIEW 中，扫描字符串是一项常见的任务，它允许用户按照一定的模式从输入字符串中提取所需的信息。下面我将详细

2023-12-29 10:12:21

361

KUKA 机器人系统函数StrFind()-在字符串里查找

搜索字符串变量用功能 StrFind() 可以搜索字符串变量的字符串。 Result = StrFind( StartAt, StrVar[], StrFind[], CaseSens )

2023-12-27 10:36:25

253

C#网络串口调试助手源码

非常牛B网络串口调试助手C#源码，支持添加多条协议

2023-12-27 09:45:30

labview扫描字符串怎么用

LabVIEW是一种图形化编程语言，用于开发控制、测量和监控系统。虽然它主要用于工程和科学领域，但也可以用于处理文本和字符串。在LabVIEW中，可以使用字符串处理函数来扫描字符串。以下是一些常用

2023-12-26 16:58:59

455

labview中怎么对字符串中的进行实时处理

LabVIEW是一种用于开发控制、测试和测量系统的可视化编程环境，它提供了许多处理字符串的功能。在LabVIEW中，可以使用不同的函数和工具来实时处理字符串。下面我将详细介绍一些常见的方法和技术

2023-12-26 14:12:16

405

IGBT和模块的标准体系解读

2023-12-14 11:38:45

443

qt源码编译安装遇到的问题

QT源码make通过后执行make install时报错。

2023-12-09 15:56:22

s7-200字符串赋值指令

S7-200是一款由西门子公司生产的可编程控制器（PLC），被广泛应用于工业自动化领域。在S7-200的指令集中，字符串赋值指令是一项重要的功能，它用于将字符串值赋给指定的变量。本文将详细介绍

2023-12-08 14:44:06

772

oracle字符串split成多个

Oracle是一种广泛使用的关系型数据库管理系统，它提供了许多强大的功能和函数，用于处理和操作数据。其中之一就是字符串分割（split）方法，该方法用于将一个字符串按照指定的分隔符分割成多个子字符

2023-12-06 09:54:59

635

oracle判断字符串包含某个字符

字符串操作是任何编程语言中都非常重要的一部分，Oracle数据库作为目前最常用的关系型数据库之一，也提供了丰富的字符串操作函数和方法。在本文中，我们将详细解析如何在Oracle中判断一个字符串是否

2023-12-06 09:53:14

4143

oracle中拼接字符串函数

在Oracle中，我们可以使用 CONCAT 函数来拼接字符串。CONCAT 函数接受两个参数，它将这两个参数连接起来并返回相应的字符串结果。语法示例： CONCAT(string1

2023-12-06 09:49:52

715

如何去掉oracle字符型数据里的null

去掉Oracle字符型数据中的NULL值可以通过以下几种方法实现。在介绍这些方法之前，首先需要了解Oracle数据库中的NULL值是什么。 NULL值在Oracle数据库中代表缺少值或未知值。它不

2023-12-06 09:46:55

278

php的源码是开放的吗

PHP是一种开源的脚本语言，其源代码完全开放并可免费获取、使用和修改。这篇文章将详细介绍PHP的源码开放性。一、PHP的源码开放性 PHP的源码是以PHP License（PHP许可证）的形式开放

2023-12-04 15:57:51

435

MEMS加速计的参数应用和解读

2023-12-01 15:59:18

300

字符数组和字符串有没有区别？

2023-11-30 16:39:45

296

MySQL替换字符串函数REPLACE

MySQL是目前非常流行的开源数据库管理系统之一，它具有强大的功能和性能。其中之一的字符串函数REPLACE，可以用于替换字符串中的指定字符或字符串。在本文中，我们将详细讨论MySQL替换字符串函数

2023-11-30 10:44:21

283

c语言如何把字符变成ascii码

C语言是一种广泛应用的编程语言，用于开发各种类型的程序。在C语言中，字符可以表示为ASCII码（美国信息交换标准码）的整数值。ASCII码是一种最常用的字符编码方案，其中每个字符都被赋予一个唯一

2023-11-26 10:34:12

1175

c语言怎么输出ascii码对应的字符

C语言是一种广泛应用于系统编程的高级编程语言，它可以用于处理各种数据类型，包括字符类型。ASCII码是一种广泛用于计算机系统中表示字符的编码方式，通过将字符映射到对应的数字，可以在计算机系统中进

2023-11-26 10:32:58

2525

一文解读GNSS信号对网络中授时应用的益处

涨知识 | 一文解读GNSS信号对网络中授时应用的益处

2023-11-24 14:26:19

213

c语言怎么用scanf输入字符串

在C语言中，我们可以使用scanf函数来接收用户的输入。scanf函数有很多种用法，其中一种用法就是用来接收字符串。要接收字符串，我们可以使用"%s"格式说明符。下面是一个简单的示例

2023-11-24 10:03:09

816

c语言字符串定义

C语言是一种强大而广泛使用的编程语言，字符串是其中一个非常重要的概念。在C语言中，字符串是由一系列字符组成的数组，它可以表示文本、数字等各种类型的数据。在本文中，我们将详尽、详实、细致地介绍C语言

2023-11-24 10:02:01

643

python如何统计字符串中字母个数

Python中统计字符串中字母个数的方法有多种，下面我会详细介绍一些常用的方法。方法一：使用循环遍历字符串该方法通过循环遍历字符串中的每一个字符，并判断是否为字母来统计字母个数。代码如下

2023-11-23 16:29:00

2569

linux正则表达式匹配字符串

在Linux操作系统中，正则表达式是一种强大的模式匹配工具，它可以用于在文本中查找、替换和筛选特定的字符串。准确掌握正则表达式的语法和常见应用，对于Linux系统的管理员和开发人员来说

2023-11-23 10:26:11

274

linux搜索文件里的字符串

在Linux系统中，我们可以使用各种方法来搜索文件中的字符串。在本文中，我将为您详细介绍几种常用的方法和工具。让我们开始吧！ grep命令 grep命令是Linux上最常用的搜索工具之一。它可

2023-11-23 10:20:29

428

python输出固定长度的字符串

Python 是一种强大而灵活的编程语言，具有许多用于处理字符串的功能。在 Python 中，有多种方法可以输出固定长度的字符串。下面将详细介绍这些方法。方法一：使用字符串拼接在 Python

2023-11-22 10:41:38

964

python中数字字符和数字值有何不同

数字字符和数字值在Python中有着明显的区别。数字字符是指代表数字的字符，如'1'、'2'、'3'，而数字值则是实际的数值，如1、2、3。 Python是一种强类型语言，它要求变量的类型明确。数字字符

2023-11-22 09:51:43

426

Python将字符元素替换成数字

Python提供了多种方法将字符元素替换成数字。在本文章中，我将详尽、详实、细致地介绍其中的几种常见方法。使用replace()函数： replace()函数是Python字符串对象的内置方法

2023-11-22 09:48:58

289

python怎么把字符串变成数字

Python是目前广泛应用的一种编程语言，它以简洁、易读和灵活的特性被广大开发者所喜爱。在Python中，字符串和数字是两种常见的数据类型。字符串是由字符组成的一系列字符序列，而数字则表示数值或数学

2023-11-22 09:47:25

1009

修改查询将clob转成字符类型

在进行Oracle数据库查询时，我们经常会遇到clob类型的数据，这是一种用于存储大型字符数据的数据类型。在一些情况下，我们可能需要将clob类型的数据转换为字符类型，以便进行一些操作或者方便数据

2023-11-21 11:31:19

294

怎么把clob字段转换为字符串

CLOB字段是一种用于保存大量文本的数据类型，通常用于存储超过4000个字符的内容。在某些情况下，我们可能需要将CLOB字段转换为字符串进行处理或展示。在Oracle数据库中，将CLOB字段转换

2023-11-21 10:46:23

3674

C语言课程设计案例精编-源码

电子发烧友网站提供《C语言课程设计案例精编-源码.rar》资料免费下载

2023-11-21 10:39:58

200个经典C程序【源码】

电子发烧友网站提供《200个经典C程序【源码】.zip》资料免费下载

2023-11-21 10:34:23

oracle怎么把clob字段转换为字符串

将CLOB字段转换为字符串，可以使用PL/SQL中的DBMS_LOB包提供的函数来实现。在Oracle数据库中，CLOB（Character Large Object）是用于存储大量字符数据

2023-11-21 10:32:27

3022

178个C语言算法源码下载

电子发烧友网站提供《178个C语言算法源码下载.zip》资料免费下载

2023-11-21 09:35:10

C语言指纹识别源码分享

电子发烧友网站提供《C语言指纹识别源码分享.rar》资料免费下载

2023-11-18 14:50:53

java字符串转化为日期格式

在Java中，字符串转化为日期格式是一个常见的需求。日期格式在处理时间相关的操作时非常重要，它可以用来表示一段时间的开始和结束，也可以用来计算时间差等。本文将详细介绍如何将一个字符串转化为日期格式

2023-11-17 16:38:36

577

字符串如何转换成日期型

随着计算机技术的不断发展，我们经常遇到需要处理日期的情况。在编程中，字符串是最常见的日期输入格式，在许多情况下，我们需要将字符串转换为日期类型以便进行日期计算和比较。本篇文章将详细介绍如何使用不

2023-11-17 16:27:28

4258

mysql字符串包含某个字符串

MySQL是一种开源的关系型数据库管理系统，被广泛用于构建Web应用程序和其他大型数据驱动的应用。在进行MySQL数据库查询时，经常需要使用字符串包含操作，即判断一个字符串是否包含另一个字符串。本文

2023-11-16 14:52:22

774

mysql数据库默认字符编码是什么

编码是一种将字符映射到二进制数据的方式。它定义了字符在计算机中的存储和传输方式，决定了计算机如何解读和显示不同的字符。为什么需要字符编码：由于不同国家和地区有不同的字符集，而计算机只能处理二进制数据，因此需要通过字符编码将各种字符集转换为

2023-11-16 14:50:07

515

mysql8.0默认字符集是什么

MySQL 8.0 默认字符集是 utf8mb4。 MySQL 8.0 是当前最新的开源关系型数据库管理系统，由Oracle公司开发和维护。MySQL 8.0 默认字符集是 utf8mb4，这个字符

2023-11-16 14:48:47

904

epoll源码分析

对上述4个函数进行源码分析。源码来源由于epoll的实现内嵌在内核中，直接查看内核源码的话会有一些无关代码影响阅读。为此在GitHub上写的简化版TCP/IP协议栈，里面实现了epoll逻辑

2023-11-13 11:49:27

430

字符型LCD显示器的应用和例程

字符型显示器的应用越来越普遍。熟悉一些字符型显示器的使用显得非常重要。我们还可以使用一些特殊的字符型显示器来作为机器人的表情显示。今天的例程是显示一些英文字符。下面就来看一下今天的例程吧！

2023-11-09 10:03:55

321

Python 小坑之字符串驻留

本文整理了许多字符串驻留的坑，部分整合自wtfpython英文版，并增加了大量的后续说明。 # example1: >>> a = "wtf" >>> b = "wtf

2023-11-03 11:55:43

200

使用doxygen分析MCAL源码的层次架构

阅读MCAL源码包中的源码，猜测MCAL可能只是MCU底层SDK向AutoSAR的一个适配接口。

2023-11-02 12:25:23

466

BASH shell脚本篇—字符串处理

Bash字符串也是一种数据类型，它用于表示文本而不是数字，它是一组可能还包含数字的字符的组合。

2023-10-16 11:25:54

290

PCB字符有什么含义？答案就在这里

每一块电路板上面都会出现PCB字符，今天捷多邦小编围绕PCB字符给大家讲解，让大家更了解PCB电路板。

2023-10-16 10:52:16

501

Labview 16进制转字符串源程序

2023-10-11 18:05:20

java的字符流分析

上次聊到了 java 的字符流 Reader ，今天来看看它的好朋友 Writer 字符流。 Writer java 中的 IO 输出流不是只有 OutputStream 还有按字符输出

2023-10-10 15:38:39

309

解读BGA、CSP封装中的球窝缺陷

简要解读BGA、CSP封装中的球窝缺陷

2023-10-08 08:47:53

329

代码字符串分割方法

我们写代码的时候，经常会遇到这样一个场景，那就是分割字符串。比如说把一个字符串分成N个，或者说按照N个字符分割。我们今天就来看看怎么每隔N个字符分割字符串。首先我们就使用 JDK 中内置

2023-09-25 11:42:37

371

Faster Transformer v2.1版本源码解读

写在前面：本文将对 Faster Transformer v2.1 版本源码进行解读，重点介绍该版本基于 v1.0 和 v2.0 所做的优化内容，剖析源码作者优化意图。 1 v2.1 版本发布背景

2023-09-19 11:39:00

660

解决你的PCB喷印机字符问题点

PCB线路板上总有小小的字符，他们就是来自于PCB喷印机的，今天捷多邦小编来跟大家说说关于PCB喷印机字符的问题

2023-09-18 10:46:13

439

LED矩阵的源码程序

LED的驱动程序源码

2023-09-13 16:12:53

Faster Transformer v1.0源码详解

解读的内容仅限 Faster Transformer v1.0 版本，更高版本的源码将在后续文章中继续解读。

2023-09-08 10:20:33

479

如何修改YOLOv8的源码

很多人也想跟修改YOLOv5源码一样的方式去修改YOLOv8的源码，但是在github上面却发现找到的YOLOv8项目下面TAG分支是空的，然后就直接从master/main下面把源码克隆出来一通

2023-09-04 10:02:54

1036

迅为RK3568开发板保姆级3900页手册_415期视频_426G文档

信号量第一期-驱动基础 >嵌入式学习之Linux驱动 1.学习Linux驱动基本要求 2.什么是Linux驱动 3.初步认识Linux源码 4.编写第一个驱动helloworld 5.

2023-08-11 11:14:50

智造之眼®字符检测应用

Kenexs字符检测系统能够对字符进行识别和判断，提高零部件出厂字符编号识别和检测的自动化水平，解决生产实际问题，提高效率。

2023-07-29 18:26:39

555

一文详解字符集编码

软件开发人员经常遇到“中文乱码”、“软件不能显示日文”等类似问题。真相只有一个——对字符集编码没有一个系统的认知。

2023-07-18 09:57:31

414

PCB板上的字符莫名消失之谜

明明PCB上设计了字符，为什么收到板子后，线路板上的字符全部消失，是设计的错，还是生产的过，请走进今天的案例分析，了解案例背后的秘密。

2023-07-14 14:11:40

608

正规厂家的信誉与口碑，选择可靠的OLED拼接屏供应商

OLED拼接屏无线互动控制中心是一种重要的设备，用于集中控制和管理多个OLED拼接屏。拼缝模组的尺寸选择需要根据实际需求和预算来确定。选择正规的OLED拼接屏厂家可以保证产品质量和售后服务的可靠性。通过综合考虑以上因素，您可以选择适合自己需求的正规OLED拼接屏，并获得良好的显示效果和用户体验。

2023-07-13 13:49:32

217

国外服务器在哪里买便宜？海外正规idc服务器商推荐

海外正规IDC服务器商是指在国外拥有数据中心的专业公司，提供云计算、托管式服务器等网络基础设施服务。海外正规IDC服务器商服务一般包括有服务器托管、云服务器租用、数据中心租用、安全服务、服务器

2023-07-10 09:46:37

1889

C++字符串string

string是C++编程语言中的字符串。在C++中字符串处理可以使用c语言字符串形式char *，也可以使用string类格式。

2023-07-10 00:26:50

844

ubuntu下如何下载nuttx源码

2023-07-07 14:41:47

645

如何使用lib cuDF通用API巧妙地转换字符串列

在 RAPIDS libcudf 中掌握字符串转换

2023-07-05 16:30:44

244

Python字符编码转换

UNICODE字符串可以与任意字符编码的字节进行相互转换，如图：那么大家很容易想到一个问题，就是不同的字符编码的字节可以通过Unicode相互转换吗？答案是肯定的。 Python2中的字符串进行

2023-07-05 16:25:23

791

Python2与Python3中对字符串的支持

其实Python3中对字符串支持的改进，不仅仅是更改了默认编码，而是重新进行了字符串的实现，而且它已经实现了对UNICODE的内置支持，从这方面来讲Python已经和JAVA一样优秀。下面我们来看

2023-07-05 16:15:42

497

Python字符与字节

一个字符不等价于一个字节，字符是人类能够识别的符号，而这些符号要保存到计算的存储中就需要用计算机能够识别的字节来表示。一个字符往往有多种表示方法，不同的表示方法会使用不同的字节数。这里所说

2023-07-05 15:55:43

630

如何遍历中文字符串

今天和大家分享下如何遍历中文字符串，主要是如何打印中文字符，因为中文字符串每个字符占用不只一个字节的空间，如果我们逐个字节遍历，会出现奇怪的结果。而UTF-8编码写的中文字符是有特定结构的，我们可以

2023-07-03 09:15:26

351

怎么选择正规LED透明屏厂家？

选择正规LED透明屏厂家，最终也是为了挑选更适合自己的高品质产品，那么拥有时间沉淀的老工厂在这方面获得的专利更多，产品不断的更新迭代，可以应用的场景也会更多，产品的选材也会更加的放心，使用寿命也会大大提升。那么，怎么选择正规LED透明屏厂家？

2023-06-30 15:50:05

686

C语言如何将字符串处理成函数的原理解析

编程时，经常用到进制转换、字符转换。比如软件界面输入的数字字符串，如何将字符串处理成数字呢？今天就和大家分享一下。

2023-06-30 14:11:11

368

HTA：将十六进制数转换为 ASCII 字符串

说明使用该指令，可以将在输入 IN 中指定的十六进制数转换为 ASCII 字符串。转换结果存储到参数 OUT 指定的地址中。使用参数 N，可指定待转换十六进制字节的数量。由于 ASCII 字符

2023-06-26 11:01:42

1682

C浮点数与字符转换工具

C浮点数与字符转换工具免费下载。

2023-06-19 18:17:43

图形搜索模式的算法原理及应用方法

图案匹配（正规化相关）需要进行大量的计算处理。如果要处理所有的图像输入信息，则需要相当长的处理时间。通过限制需要处理的像素数量，可以减少数据量，缩短处理时间。这种操作被称为“拉开间隔”“压缩”。

2023-06-13 15:03:14

349

一文带你搞懂字符集编码

软件开发人员经常遇到“中文乱码”、“软件不能显示日文”等类似问题。真相只有一个——对字符集编码没有一个系统的认知。

2023-06-09 10:20:21

972

图解大模型训练之：Megatron源码解读2，模型并行

前文说过，用Megatron做分布式训练的开源大模型有很多，我们选用的是THUDM开源的CodeGeeX（代码生成式大模型，类比于openAI Codex）。选用它的原因是“完全开源”与“清晰的模型架构和预训练配置图”，能帮助我们高效阅读源码。我们再来回顾下这两张图。

2023-06-07 15:08:24

2181

Java算法大全源码包开源源码

2023-06-07 14:58:44

Java电子病历编辑器源码，B/S电子病历编辑器源码

B/S电子病历编辑器源码：电子病历编辑器，简称EMRE（EMR Editor），是电子病历系统的核心关键基础技术。

2023-06-01 16:25:14

657

OpenHarmony 3.2 Release新特性解读之驱动HCS

HCS（HDF Configuration Source）是HDF驱动框架的配置描述源码，内容以Key-Value为主要形式。它实现了配置代码与驱动代码解耦，便于开发者进行配置管理。 HC-GEN

2023-05-31 10:30:18

编程中用到的字符编码知识点

字符集就是字符的集合，如常见的 ASCII字符集，GB2312字符集，Unicode字符集等。这些不同字符集之间最大的区别是所包含的字符数量的不同。

2023-05-30 10:11:27

385

格式化输入

(通常指键盘) 读取输入的信息，并将读入任何固有类型的数据自动变换成适当的机内格式。其格式为: scanf(\"<格式化字符串>\"，<地址表

2023-05-26 11:21:45

使用LabVIEW实现 DeepLabv3+ 语义分割含源码

2023-05-26 10:23:01

522

SAS：常用字符处理函数介绍

如果n为负数，则SCAN选择字符串中从字符串末尾开始的单词。如果|n|大于字符串中的字数，则SCAN返回一个空白值。

2023-05-19 10:15:39

4945

node.js实战源码

2023-05-16 18:06:51

Python中检查字符串包含的方法

Python 有多种处理字符串的方法。今天我们介绍如何检查一个字符串中是否包含另一个字符串。

2023-05-14 16:02:53

12958

直播源码平台搭建：直播源码技术推拉流的实现（一）

直播源码推拉流技术成为了直播行业不可或缺的重要支撑部分。今天我就向大家介绍直播源码技术推流的实现。

2023-05-10 16:23:52

2247

主键不用随机字符串用什么？主键自增？

主键不用随机字符串用什么？主键自增？主键自增就是最佳方案吗？有没有其他坑？

2023-05-09 09:04:34

336

热知识！直播源码开发的平台功能强大最重要：如何挑选正确的一对一直播源码

在直播源码火爆的今天，各类直播源码层出不穷，拥有一套专业正确的直播源码开发出的平台才会功能强大，反之，直播源码搭建的平台将不会为企业带来利益，可能会损害企业利益！

2023-05-06 14:29:09

364

870

云HIS源码基层卫生健康云HIS源码

对外接口管理。商业级源码，带电子病历，过四级，有演示！云his系统源码 SaaS应用功能易扩统一对外接口管理.

2023-04-12 15:42:45

674

C语言定义字符串的几种方法

C语言中定义字符串有哪些方法？

2023-03-31 09:41:49

2720

字符串的相关知识

TCL 中的数据类型只有一种：字符串。这些字符串可以是字母、数字、布尔值、标点符号等特殊字符的组合。在某些特殊命令的作用下，字符串可以向其他数据类型转换。下面将系统的讲解或回顾下字符串的相关知识。

2023-03-29 11:41:37

749

Linux中字符设备的创建过程

Linux中很多设备都是字符设备，使用ls -l查看/dev下的设备，前面带c的都是字符设备。

2023-03-24 11:29:11

1767

已全部加载完成

搜索历史

hanlp源码解读之字符正规化CharTable

评论