pythonascii转utf8_python编码乱码问题

Python是一种面向对象的解释型计算机程序设计语言，由荷兰人发明，第一个公开发行版发行于1991年。Python是纯粹的自由软件，源代码和解释器CPython遵循 GPL协议。Python语法简洁清晰，特色之一是强制用空白符作为语句缩进。

Python具有丰富和强大的库。它常被昵称为胶水语言，能够把用其他语言制作的各种模块（尤其是C/C++）很轻松地联结在一起。常见的一种应用情形是，使用Python快速生成程序的原型（有时甚至是程序的最终界面），然后对其中有特别要求的部分，用更合适的语言改写，比如3D游戏中的图形渲染模块，性能要求特别高，就可以用C/C++重写，而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题，某些可能不提供跨平台的实现。

Python ascii 编码转化为utf-8编码

实现代码如下：

123456a = ‘abce’

# print type（a）

b = a.decode（“ascii”）

# print type（b）

c = a.decode（“ascii”）.encode（“utf-8”）

# print type（c）

在python中进行编码转换都是通过unicode作为中间值实现的。所以要先decode成unicode字符，然后再使用encode转换成utf-8编码的str。可以把注释取消了，看下转换过程中的类型。

ASCII 是一种字符集，包括大小写的英文字母、数字、控制字符等，它用一个字节表示，范围是 0-127 Unicode分为UTF-8和UTF-16。

UTF-8变长度的，最多 6 个字节，小于 127 的字符用一个字节表示，与 ASCII 字符集的结果一样，ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理。

　　 pythonascii转utf8_python编码乱码问题

Python 从 2.2 开始支持 Unicode ，函数 decode（ char_set ）可以实现其它编码到 Unicode 的转换，函数 encode（ char_set ）实现 Unicode 到其它编码方式的转换。

比如

［python］ view plain copy（“你好”）.decode（ “GB2312”）

将得到

u‘\u4f60\u597d’，

即 “你”和“好“的 Unicode 码分别是 0x4f60 和 0x597d

再用

［python］ view plain copy（u‘\u4f60\u597d’）.encode（”UTF-8“）

将得到

‘\xe4\xbd\xa0\xe5\xa5\xbd’

它是 “你好”的UTF-8编码结果。

python中使用 unicode的关键：unicode是一个类，函数unicode（str，”utf8“）从utf8编码（当然也可以是别的编码）的字符串str生成 unicode类的对象，而函数unc.encode（”utf8“）将unicode类的对象unc转换为（编码为）utf8编码（当然也可以是别的编码）的字符串。于是，编写unicode相关程序，需要做的事情是 * 获取数据（字符串）时，用unicode（str， ”utf8“）生成unicode对象 * 在程序中仅使用unicode对象，对程序中出现的字符串常量都以u”字符串“的形式书写 * 输出时，可将unicode对象转换为任意编码输出，使用str.encode（”some_encoding“）

［python］ view plain copy》》》 unicode（”你好“， ”utf8“）

u‘\u4f60\u597d’

》》》 x = _

》》》 type（x）

》》》 type（”你好“）

》》》 x.encode（”utf8“）

‘\xe4\xbd\xa0\xe5\xa5\xbd’

》》》 x.encode（”gbk“）

‘\xc4\xe3\xba\xc3’

》》》 x.encode（”gb2312“）

‘\xc4\xe3\xba\xc3’

》》》 print x

你好

》》》 print x.encode（”utf8“）

你好

》》》 print x.encode（”gbk“）

？？？

以上是测试结果（Ubuntu 6.06，locale为utf8），注意type（x）和type（”你好“）的区别。从编码上可以看出utf8编码与gbk不同。在utf8的 locale设置下，打印x按该环境变量编码（我猜我猜我猜猜猜），而打印x.encode（”gbk“）则是乱码。

python编码乱码问题ascii unicode utf-8

基础知识部分

首先需明白python2.7默认使用的是ascii，而现在python3.x默认使用的是unicode。下面内容基于python2.7。

一、文件编码

一般文件使用的是utf-８或者bgk编码进行存储。但是由于python2.7默认使用ascii，所以python2.7在运行py后缀文件时也是默认以ascii编码读取文件。如果文件中没有中文不会出现问题。但是如果有中文的话，由于中文编码超出了ascii编码范围，所以python2.7将会报错。

所以我们需要在文件头部添加：

#coding:utf-8

或者

#！/usr/bin/python

# -*- coding： utf-8 -*-1234

来告诉python2.7此文件要用utf-8编码来读取。

在文件中设置后我们可以使用 a = u‘哈’；python会自动使用utf-8来读取汉字，并将其转换为Unicode对象。1

二、字符串编码

python2.7和字符串相关的数据类型，分别是标准字符串（str）是单字节字符序列，Unicode字符串（unicode）是双字节字符序列。。

python的解码，编码是python自动进行的，如果我们没有指明解码方式，python 就会使用 sys.defaultencoding 指明的方式来解码。python2.7的函数str（）和unicode（）默认将对象转成ascii编码。

但是对于中文，ascii编码是无法表示的。因此我们需要用sys.setdefaultencoding（‘utf-8’）来设置string对象默认的编码。

import sys

reload（sys）

sys.setdefaultencoding（‘utf-8’） 123

那么字符串如何在str和unicode间进行转换呢？python提供了两个函数：

b = u‘哈’ //b为unicode对象

b.encode（‘utf-8’） //将b从unicode类型转为utf-8类型

b.decode（‘utf-8’） //将b从utf-8类型转换为Unicode类型123

三、window控制台输出

window控制台默认使用gbk编码。如果你设置了

# -*- coding： utf-8 -*-1

python直接按照utf-8输出到控制台。所以我们可以改变文件编码：

# -*- coding： gbk -*-1

或者使用unicode类型进行输出，会自动转换。

阅读全文

ASCII(34275) ASCII(34275)
python(82776) python(82776)
UTF8(6976) UTF8(6976)

[TViX] TVX高清播放机NFS协议共享中文不再乱码

的网络功能，一直未能让人满意。 9月8日,TVX发布了最新固件1.4.14,最大的改进就是增加了对UTF-8编码,及其他各种字符编码的手动选择，NFS共享问题是否可以解决了呢？第一时间，下载固件升级

2009-09-11 11:14:02

unicode如何转GBK字库制作

UTF-8（8 位元，Universal Character Set/Unicode Transformation Format）是针对 Unicode 的一种可变长度字符编码。UCS 字符

2023-08-14 10:45:22

python opencv运动检测代码分享

　　本文实例为大家分享了 python opencv 运动检测的具体代码，供大家　　参考，具体内容如下　　# -*- coding:utf-8 -*-　　__author__ = ‘kingking

2023-07-20 11:44:26

Python字符编码转换

# -*- coding:utf- 8 -*-utf_8_a = '我爱中国' gbk_a = utf_8_a. decode ( 'utf-8' ). encode ( 'gbk' ) print (gbk_a. decode ( 'gbk' )) 输出结果：我爱中国 Python3中定义的字符串默认

2023-07-05 16:25:23

570

Python中的默认编码

我们使用Pycharm来编写Python程序时会指定工程编码和文件编码为UTF-8，那么Python代码被保存到磁盘时就会被转换为UTF-8编码对应的字节（encode过程）后写入磁盘。当执行Python代码文件中的代码时，Python解释器在读取Python代码文件中的字节串之后，需要将其转换为

2023-07-05 16:11:02

489

Python编码与解码

先做下科普：UNICODE字符编码，也是一张字符与数字的映射，但是这里的数字被称为代码点（code point），实际上就是十六进制的数字。 Python官方文档中对Unicode字符串、字节串

2023-07-05 15:59:49

376

python读写西门子PLC例子

client.py 存取西门子PLC数据的客户端例子 #!/usr/bin/env python# -*- coding: utf-8 -*-# Project: pi4b_aliyuniot# File: snap_client.py# Author : Long.Xu # QQ:26564

2023-04-18 10:30:19

为什么不建议在MySQL中使用UTF-8？

Unicode 字符集包含了上百万个字符。最简单的编码是 UTF-32，每个字符使用 32 位。这样做最简单，因为一直以来，计算机将 32 位视为数字，而计算机最在行的就是处理数字。但问题是，这样太浪费空间了。

2023-03-13 10:37:36

290

pip安装报错：UnicodeDecodeError 'utf-8' codec can't decode byte 0xc3 in position 4解决方法

continuation byte 因为windows下命令行的代码页为GBK，但是程序编码是UTF-8。解决办法找到python安装目录下\\Lib\\site-packages\\pip

2023-01-13 09:50:10

2844

8路NPN转PNP，5V电平转24V电平，信号转换模块 IBF108

品特点：●8路NPN信号转PNP信号高速转换●8路0-5V电平转0-24V电平●8路TTL电平转0-24V电平●8路NPN信号转TTL电平●8路0-24V电平转0-5V电平●支持输入信号和输出信号

2023-01-05 14:59:15

编码器失灵、乱码等现象的解决办法

家用电器上的旋转开关偶尔会出现失灵、乱码等现象，造成设备无法正常使用，但其实，旋转开关的问题主要是由于内部的编码器造成的，那为何会发生这种现象呢？

2022-12-28 14:47:11

1815

详细介绍python中文件操纵相关知识

encoding:可以不写。不写参数，默认的编码本是操作系统默认的编码本。windows默认gbk，linux默认utf-8，mac默认utf-8。

2022-09-13 11:40:17

458

UTF8String是如何编码的？

是同一组抽象字符（我们使用术语“抽象”来指出它们实际上是相同的，但它们的编码不同），并且由于BMPString 是UniversalString 和UTF8String 意味着IA5String 是这些字符串类型的前128 个抽象字符。

2022-08-26 09:55:26

1114

python程控电源编程(2)

# -*- coding: utf-8 -*-#!/usr/bin/python"""Module implementing Watch_MainWindow. @Author: TOBY

2022-01-12 12:45:06

STM32CudeIDE：串口发送汉字乱码

一、乱码用STM32CudeIDE建立一个工程，写了一个串口发送，发现：发送英文正常，但发送中文会乱码这是中文编码格式不对需要设置一下，有两个地方需要设置一下，把编码方式改成GBK，在文本文件编码

2021-12-24 18:39:17

"stm32单片机平台上ASCII(GBK,GB2312)转unicode转UTF-8"

成ASCII(GBKGB2312)。现在升级STM32单片机程序，发现需要UTF-8编码，APP和服务器最好不动，不然修改太大。所以就出现了ASCII(GBKGB2312)转unicode转UTF-8需求以下ASCII(GBKGB2312)，统称为GBK，因为ASCII是GB2312子集，G

2021-11-30 15:06:05

单片机中UTF-8如何转换得到GBK编码

概述我们在单片机开发中常会遇到需要将UTF-8转换为GBK编码的需求。在我们了解各种编码格式的情况下可知，UFT-8不能直接转成GBK，需中转成unicode再转换为gbk。而unicode

2021-11-26 10:51:04

嵌入式开发putty串口打印乱码

波特率设置有问题。编码格式问题可以参考https://blog.csdn.net/sun_168/article/details/8123329更改编码格式即可，即：一般设置为utf-8即可。波特率设置错误这类问题好像没有人提到。串口连接时如果波特率设置有问题，可能导致乱码甚至无输出。怎么

2021-11-02 18:21:02

无线wifi中文名字乱码的解决方案

用户配置了中文ssid的名字，如XX超市，发现无线终端搜索到的信号是乱码，乱码原因可以查看KB1000124940 。编码方式就不多说了。通过web界面输入中文名称SSID ，但是登录console口后，命令查看相同SSID模板，发现对应的是乱码名称

2021-01-01 17:25:00

84525

解决Python解释器读取的字符集识别问题

解决大部分的问题。那么它解决的是什么问题呢？我们需要理解两个概念： 1）、# -*- coding: utf-8 -*- 的作用是声明 python源代码文件的编码格式。

2020-12-31 11:04:05

1017

Python中最基本的10个内容

时会遇上乱码问题，其原因是字符集的编码问题。Linux和Mac默认的编码集是UTF8，而Windows则是

2020-12-11 11:54:08

1398

Python的编码规范是怎么样的

建议使用Emacs 的Python-mode 默认值： 4 个空格一个缩进层次。对于确实古老的代码，若不希望产生混乱，可以继续使用8 空格的制表符。在Emacs 的Python-mode 中会自动

2020-08-12 16:03:00

MySQL中utf8和utf8mb4有什么区别

MySQL在5.5.3之后增加了这个utf8mb4的编码，mb4就是most bytes 4的意思，专门用来兼容四字节的unicode。

2020-04-12 19:21:24

12242

从ASCII码->Unicode-> UTF-8历史变迁，及其差异

从ASCII码->Unicode->UTF-8历史变迁，及其差异

2020-02-27 15:56:19

1821

如何进行GB2312、 BIG5、UTF8和Unicode之间的互换

本文档的主要内容详细介绍的是如何进行GB2312、 BIG5、UTF8和Unicode之间的互换。先转成宽字符

2019-04-16 17:27:37

PHP和UTF-8乱码问题的解决方法资料分析

PHP乱码问题，UTF-8乱码问题比较常见，通过下面的方法基本上就可以解决php乱码问题了，确实总结的不错。

2019-02-28 17:59:43

Python官方竟然给出了一种编码规范PEP 8

autopep8 能够将 Python 代码自动格式化为 PEP 8 风格，它使用 pycodestyle 工具来决定代码中的哪部分需要被格式化，这能够修复大部分 pycodestyle 工具中报

2019-01-02 10:24:53

2861

开发者发文表达了他觉得 Python不行的8大原因

"""string""" 或 ```string```；如果想使用二进制文件，那么需要使用 b'binary' 或 r'raw'；有时需要使用 str(string) 将字符串转换为字符串，或使用 string.encode('utf-8') 将其转换为 utf8。

2018-12-25 11:36:04

2262

Python将被抛弃？Python之父宣布推出Python核心决策层

昨天，Python 之父 Guido van Rossum 在 Python 邮件组里发邮称，他将退出 Python 核心决策层，而转居幕后。

2018-07-14 09:01:40

3415

ascii和utf8的区别_ASCII编码与UTF-8的关系

UTF-8是一种针对Unicode的可变长度字符编码，又称万国码。由Ken Thompson于1992年创建。现在已经标准化为RFC 3629。UTF-8用1到6个字节编码Unicode字符。ASCII是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。

2018-01-30 13:34:11

24603

安装QtCreator去完成C++第一个程序

是UTF8，而控制台中的字符编码是按GB2312解释的，所以就乱了。要消除也很简单，把源码的编码改成GB2312就行了。或者不要输出中文字符。

2018-01-13 11:07:39

33851

php数据库读出乱码是说明原因及其解决方法

原先是GB2312编码的，却以UTF-8编码打开再保存。要解决上述乱码问题，首先需要知道开发中哪些环节涉及到了编码：

2017-11-19 15:53:41

2392

UNICODE,GBK,UTF-8区别

Unicode编码，简要解释UCS、UTF、BMP、BOM等名词。这是一篇程序员写给程序员的趣味读物

2011-03-28 10:28:50

2200

JSP技术中文乱码的研究

JSP技术广泛应用于动态网页制作，但在应用中文字符时常常出现乱码。以前有关JSP技术中文乱码的研究，只是侧重于对常见的几种中文乱码情况分析，并从网页代码方面进行研究，然后给出相应的代码，缺少对造成中文乱码原因的研究。本文从造成乱码的根本原因入手

2011-01-14 17:29:41

已全部加载完成

搜索历史

pythonascii转utf8_python编码乱码问题

评论

[TViX] TVX高清播放机NFS协议共享中文不再乱码

unicode如何转GBK字库制作

python opencv运动检测代码分享

Python字符编码转换

Python中的默认编码

Python编码与解码

python读写西门子PLC例子

为什么不建议在MySQL中使用UTF-8？

pip安装报错：UnicodeDecodeError 'utf-8' codec can't decode byte 0xc3 in position 4解决方法

8路NPN转PNP，5V电平转24V电平，信号转换模块 IBF108

编码器失灵、乱码等现象的解决办法

详细介绍python中文件操纵相关知识

UTF8String是如何编码的？

python程控电源编程(2)

STM32CudeIDE：串口发送汉字乱码

"stm32单片机平台上ASCII(GBK,GB2312)转unicode转UTF-8"

单片机中UTF-8如何转换得到GBK编码

嵌入式开发putty串口打印乱码

无线wifi中文名字乱码的解决方案

解决Python解释器读取的字符集识别问题

Python中最基本的10个内容

Python的编码规范是怎么样的

MySQL中utf8和utf8mb4有什么区别

从ASCII码->Unicode-> UTF-8历史变迁，及其差异

如何进行GB2312、 BIG5、UTF8和Unicode之间的互换

PHP和UTF-8乱码问题的解决方法资料分析

Python官方竟然给出了一种编码规范PEP 8

开发者发文表达了他觉得 Python不行的8大原因

Python将被抛弃？Python之父宣布推出Python核心决策层

ascii和utf8的区别_ASCII编码与UTF-8的关系

安装QtCreator去完成C++第一个程序

php数据库读出乱码是说明原因及其解决方法

UNICODE,GBK,UTF-8区别

JSP技术中文乱码的研究