Python字符与字节-电子发烧友网

一个字符不等价于一个字节，字符是人类能够识别的符号，而这些符号要保存到计算的存储中就需要用计算机能够识别的字节来表示。一个字符往往有多种表示方法，不同的表示方法会使用不同的字节数。这里所说的不同的表示方法就是指字符编码，比如字母A-Z都可以用ASCII码表示（占用一个字节），也可以用UNICODE表示（占两个字节），还可以用UTF-8表示（占用一个字节）。字符编码的作用就是将人类可识别的字符转换为机器可识别的字节码，以及反向过程。

UNICDOE才是真正的字符串，而用ASCII、UTF-8、GBK等字符编码表示的是字节串。关于这点，我们可以在Python的官方文档中经常可以看到这样的描述"Unicode string" , " translating a Unicode string into a sequence of bytes"

我们写代码是写在文件中的，而字符是以字节形式保存在文件中的，因此当我们在文件中定义个字符串时被当做字节串也是可以理解的。但是，我们需要的是字符串，而不是字节串。一个优秀的编程语言，应该严格区分两者的关系并提供巧妙的完美的支持。JAVA语言就很好，以至于了解Python和PHP之前我从来没有考虑过这些不应该由程序员来处理的问题。遗憾的是，很多编程语言试图混淆“字符串”和“字节串”，他们把字节串当做字符串来使用，PHP和Python2都属于这种编程语言。最能说明这个问题的操作就是取一个包含中文字符的字符串的长度：

对字符串取长度，结果应该是所有字符串的个数，无论中文还是英文
对字符串对应的字节串取长度，就跟编码(encode)过程使用的字符编码有关了(比如：UTF-8编码，一个中文字符需要用3个字节来表示；GBK编码，一个中文字符需要2个字节来表示)

注意：Windows的cmd终端字符编码默认为GBK，因此在cmd输入的中文字符需要用两个字节表示

>>> # Python2

>>> a = 'Hello,中国' # 字节串，长度为字节个数 = len('Hello,')+len('中国') = 6+2*2 = 10

>>> b = u'Hello,中国' # 字符串，长度为字符个数 = len('Hello,')+len('中国') = 6+2 = 8

>>> c = unicode(a, 'gbk') # 其实b的定义方式是c定义方式的简写，都是将一个GBK编码的字节串解码（decode）为一个Uniocde字符串

>>>

>>> print(type(a), len(a))

(, 10)

>>> print(type(b), len(b))

(, 8)

>>> print(type(c), len(c))

(, 8)

>>>

Python3中对字符串的支持做了很大的改动。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

编码

编码

+关注

关注
6

文章
942

浏览量
54814
字符

字符

+关注

关注
0

文章
233

浏览量
25199
python

python

+关注

关注
56

文章
4792

浏览量
84630

探究python字节码

就是Python的“字节码”文件。(但在Python 3上却难觅其踪 -- 原因是它们不再与.py文件出现在同一个目录中，而是放在一个名为__pycache__的子目录中了)。或许你也已听说过这是一种

发表于 05-22 15:48

python字符串拼接方式了解

python字符串拼接的方式在Python的实际开发中，很多都需要用到字符串拼接，python中字符

发表于 12-06 10:09 •1032次阅读

字符流和字节流有什么那区别

字符流在Java中，根据处理的数据单位不同，分为字节流和字符流。字符流是由字符组成的，例如 FileReader、FileWriter、Bu

发表于 12-20 17:46 •8051次阅读

Python转义字符使用总结资料免费下载

本文档的主要内容详细介绍的是Python转义字符使用总结资料免费下载主要内容包括了：Python转义字符，Python

发表于 01-17 17:24 •6次下载

什么是复制字符串？Python如何复制字符串

连续几篇文章都在写 Python 字符串，这出乎我的意料了。但是，有的问题，不写不行，特别是那种灵机一动想到的问题，最后你发现，很多人根本不懂却又误以为自己懂了。那就继续刨根问底，探究个明白吧

发表于 11-25 10:32 •3011次阅读

Python字符的实例详细说明

本文档的主要内容详细介绍的是Python字符的实例详细说明包括了：Python 转义字符，Python

发表于 10-14 17:13 •7次下载

Python字符数统计函数程序

Python字符数统计函数程序免费下载。

发表于 05-25 14:35 •19次下载

2.2 python字符串类型

2.2 python字符串类型 1. 如何定义字符串？字符串是Python中最常用的数据类型之一。使用单引号或双引号来创建

发表于 02-17 17:08 •1422次阅读

Python-字符串

字符串就是一串字符，是编程语言中表示文本的数据类型，在Python中使用一对双引号 "" 或者一对单引号来定义.

发表于 02-16 15:05 •1137次阅读

python字符串有哪些特定方法

python字符串序列操作也适用于列表和元组。 python字符串还有独有方法，即字符串对象的函数，其他对象不可调用，只有

发表于 02-23 15:02 •704次阅读

python字符串编写有哪些方法

python通过反斜杠\开头来转义特殊字符。比如用’\n’转义换行符。 len()函数中，一个转义字符占1个长度。

发表于 02-23 15:02 •488次阅读

浅析python字符串模式匹配

python字符串可以通过re模块的模式匹配来处理文本。

发表于 02-23 15:04 •2326次阅读

Python2与Python3中对字符串的支持

其实Python3中对字符串支持的改进，不仅仅是更改了默认编码，而是重新进行了字符串的实现，而且它已经实现了对UNICODE的内置支持，从这方面来讲Python已经和JAVA一样优秀。

发表于 07-05 16:15 •728次阅读

Python字符编码转换

UNICODE字符串可以与任意字符编码的字节进行相互转换，如图：那么大家很容易想到一个问题，就是不同的字符编码的字节可以通过Unicode

发表于 07-05 16:25 •1087次阅读

字节流和字符流有什么区别？看完就知道！

字节流和字符流有什么区别？看完就知道！字节流和字符流是Java I/O系统中的两个重要概念，用于处理输入和输出的数据。首先，字节流是以

发表于 12-09 14:57 •1474次阅读