Python字符编码和转码-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Python字符编码和转码

阅读量：2198 次

发布时间：2019-05-02

本文共 490 字，大约阅读时间需要 1 分钟。

一：Python2

python2默认编码格式是ascii码，解释器解释代码时会将代码以及代码中的字符串等转换成ascii码再执行。这样会导致字符串输出或传输时，与当前环境编码格式不同的话会显示乱码。

我们可以通过 代码文件开头编码声明 改变编码格式，告知解释器 以什么编码格式 解释文件内容，例如：在文件头声明了 #_*_coding:utf-8*_

在有#_*_coding:utf-8*_的情况下，字符串变量如果写成name=u"字符串"格式，那这个字符串就是unicode格式解释和保存的；不加这个u就是utf-8格式

二：Python3

python3默认文件编码格式就是utf-8,所以可以直接在代码中写中文，不需要文件头声明编码了。

字符串变量默认会被unicode格式解释和存储，不需要再显式加 u 前缀。

三：转码

　　一个原则：所有字符集的转换，都要先decode成为unicode，再encode成为其他格式，不能直接转其他格式，否则会解析失败成为乱码。

转载于:https://www.cnblogs.com/ygj0930/p/10935853.html

你可能感兴趣的文章

(PAT 1061) Dating (字符串处理)

(PAT 1118) Birds in Forest (并查集)

数据结构拓扑排序

(PAT 1040) Longest Symmetric String (DP-最长回文子串)

(PAT 1145) Hashing - Average Search Time (哈希表冲突处理)

(1129) Recommendation System 排序

PAT1090 Highest Price in Supply Chain 树DFS

(PAT 1096) Consecutive Factors (质因子分解)

(PAT 1019) General Palindromic Number (进制转换)

(PAT 1073) Scientific Notation (字符串模拟题)

(PAT 1080) Graduate Admission (排序)

Play on Words UVA - 10129 (欧拉路径)

mininet+floodlight搭建sdn环境并创建简答topo

【linux】nohup和&的作用

Set、WeakSet、Map以及WeakMap结构基本知识点

【NLP学习笔记】（一）Gensim基本使用方法

【NLP学习笔记】（二）gensim使用之Topics and Transformations

【深度学习】LSTM的架构及公式

【python】re模块常用方法

剑指offer 19.二叉树的镜像

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-05-19 23:15:52 当前IP: 18.226.87.83 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我