小技巧:unicode作编码转换失败怎么办
来源: 作者:zhaoweikid 发布时间:2007-09-10 阅读次数:
unicode函数是用来把其他编码的字符串转换为unicode的函数。
有的时候由于原字符串的编码不对,或者是字符串有一些小问题可能会造成转换失败。
可以试试unicode的第三个参数写成 ignore ,就是忽略错误的意思。
看下面,这个地方如果不加unicode的第三个参数必然会出错,因为这个字符串是有点问题的,但可以忽略过去,不伤大雅。
#-*- encoding: utf-8 -*-
a = 'Fwd: [zeuux] 缁熶竴杩涜CPyUG/鍟勬湪楦?鑷敱杞欢T鎭?棰勮锛?'
print a
print unicode(a, "utf-8", "ignore")
可以把最后一行改为
print unicode(a, "utf-8")
试试,肯定会报错的。
有的时候由于原字符串的编码不对,或者是字符串有一些小问题可能会造成转换失败。
可以试试unicode的第三个参数写成 ignore ,就是忽略错误的意思。
看下面,这个地方如果不加unicode的第三个参数必然会出错,因为这个字符串是有点问题的,但可以忽略过去,不伤大雅。
#-*- encoding: utf-8 -*-
a = 'Fwd: [zeuux] 缁熶竴杩涜CPyUG/鍟勬湪楦?鑷敱杞欢T鎭?棰勮锛?'
print a
print unicode(a, "utf-8", "ignore")
可以把最后一行改为
print unicode(a, "utf-8")
试试,肯定会报错的。
上一篇:用python下载网页,超级简单! 下一篇:python使用FTP