winmeanyoung 2014-05-28
文献:http://www.verydemo.com/demo_c122_i32539.html
....................................................................
其实各种本地字符集的英文名是Coded Character Set,要转换为Coded,肯定是要encode了,同样,从里面解出来也应该叫decode……
decode就是把其他编码转换为unicode,等同于unicode函数;encode就是把unicode编码的字符串转换为特定编码。在pyshell里继续:
a是Str类型的,所以再用encode会报错。用print输出时会调用默认编码转换为系统编码?
Python print编码
b是unicode类型,打印时需要先encode(编码)成系统编码
Python 代码
Python print编码里默认的encode和decode是strict模式,所以会直接抛出Error,而Java里是默认replace模式,所以在处理servlet时经常会看到一串?????在decode时传入第二个参数errors为'replace'可以和Java相同,但总是没成功,还不知道为什么。
1. 首先,我得知道这个文件具体采用的是什么样的编码,如果是ISO-8859我将会把它转成UTF-8,其他的ASCII这些都先不做处理,这里可以使用file filename或者是enca iconv