python编码

Dimples 2020-04-18

参考文章:https://blog.csdn.net/yanghuan313/article/details/63262477

python编码:encode()

将Unicode字符按照编码规则(如UTF-8)编成字节序列。

>>> a = u"测试"
>>> a.encode("UTF-8")
‘\xe6\xb5\x8b\xe8\xaf\x95‘

python解码:decode()

将字节序列按照编码规则(如UTF-8)解释成unicode。

>>> a = b"测试"
>>> a.decode("GBK")
u‘\u5a34\u5b2d\u762f‘

 默认编码(str) 总结
python2 bytes(字节字符串) unicode(文本字符串)str 对象有一个encode方法,bytes 对象有一个decode方法,str有个encode()方法,unicode有个decode()方法,但永远不要使用它们。
python3

Unicode(文本字符串)

bytes(字节字符串)

str 对象有一个encode方法,bytes 对象有一个decode方法

# python2
>>> a = "测试"
>>> type(a)
<type ‘str‘>
>>> a.decode("GBK")
u‘\u5a34\u5b2d\u762f‘
>>> type(a.decode("GBK"))
<type ‘unicode‘>

>>> b = u"测试"
>>> type(b)
<type ‘unicode‘>
>>> b.encode("GBK")
‘\xb2\xe2\xca\xd4‘
>>> type(b.encode("GBK"))
<type ‘str‘>

# python3

>>> a = "测试"
>>> type(a)
<class ‘str‘>
>>> a.encode("UTF-8")
b‘\xe6\xb5\x8b\xe8\xaf\x95‘
>>> type(a.encode("UTF-8"))
<class ‘bytes‘>
>>>
>>> b = b"测试"
File "<stdin>", line 1
SyntaxError: bytes can only contain ASCII literal characters.
>>> b = b"wangsl"
>>> type(b)
<class ‘bytes‘>
>>> b.decode("UTF-8")
‘wangsl‘
>>> type(b.decode("UTF-8"))
<class ‘str‘>

 # b‘‘表示bytes(二进制)类型;str表示unicode(字符)类型
# 如下是互相转换方式
b‘‘ = str.encode(‘utf-8‘)
str = b‘‘.decode(‘utf-8‘)

相关推荐