博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python字符编码和转码
阅读量:2198 次
发布时间:2019-05-02

本文共 490 字,大约阅读时间需要 1 分钟。

 

一:Python2

  1. python2默认编码格式是ascii码,解释器解释代码时会将代码以及代码中的字符串等转换成ascii码再执行。这样会导致字符串输出或传输时,与当前环境编码格式不同的话会显示乱码。
  2. 我们可以通过 代码文件开头编码声明  改变编码格式,告知解释器 以什么编码格式 解释文件内容,例如:在文件头声明了 #_*_coding:utf-8*_
  3. 在有#_*_coding:utf-8*_的情况下,字符串变量如果写成name=u"字符串"格式,那这个字符串就是unicode格式解释和保存的;不加这个u就是utf-8格式

 

二:Python3

  1. python3默认文件编码格式就是utf-8,所以可以直接在代码中写中文,不需要文件头声明编码了。
  2. 字符串变量默认会被unicode格式解释和存储,不需要再显式加 u 前缀。

 

三:转码

  一个原则:所有字符集的转换,都要先decode成为unicode,再encode成为其他格式,不能直接转其他格式,否则会解析失败成为乱码。

转载于:https://www.cnblogs.com/ygj0930/p/10935853.html

你可能感兴趣的文章
(PAT 1061) Dating (字符串处理)
查看>>
(PAT 1118) Birds in Forest (并查集)
查看>>
数据结构 拓扑排序
查看>>
(PAT 1040) Longest Symmetric String (DP-最长回文子串)
查看>>
(PAT 1145) Hashing - Average Search Time (哈希表冲突处理)
查看>>
(1129) Recommendation System 排序
查看>>
PAT1090 Highest Price in Supply Chain 树DFS
查看>>
(PAT 1096) Consecutive Factors (质因子分解)
查看>>
(PAT 1019) General Palindromic Number (进制转换)
查看>>
(PAT 1073) Scientific Notation (字符串模拟题)
查看>>
(PAT 1080) Graduate Admission (排序)
查看>>
Play on Words UVA - 10129 (欧拉路径)
查看>>
mininet+floodlight搭建sdn环境并创建简答topo
查看>>
【linux】nohup和&的作用
查看>>
Set、WeakSet、Map以及WeakMap结构基本知识点
查看>>
【NLP学习笔记】(一)Gensim基本使用方法
查看>>
【NLP学习笔记】(二)gensim使用之Topics and Transformations
查看>>
【深度学习】LSTM的架构及公式
查看>>
【python】re模块常用方法
查看>>
剑指offer 19.二叉树的镜像
查看>>