摆脱字符串变量中的无效unicode字符

问题描述 投票:0回答:2

我已经在python3请求中放入了get命令(不确定是否措辞不错,将其转换为json,并进行了解析以接收名称:

'Harrison Elementary School \U0001f3eb'

我抬起头,Unicode字符代表一所学校,Unicode School Character。但是当我打印它时,我得到:

return codecs.charmap_encode(input,self.errors,encoding_table)[0]
UnicodeEncodeError: 'charmap' codec can't encode character '\U0001f3eb' in position 27: character maps to <undefined>

我真的不在乎拥有那个Unicode字符。对我而言,这并不重要。

如何从此字符串或我遇到的任何字符串中删除该unicode字符和任何其他invalid字符?

python-3.x unicode string-parsing
2个回答
0
投票

字符不是真的无效,只是undefined,所以在编码时,您经常可以告诉编码器如何处理错误:


0
投票

首先,您必须确定为什么字符无效。似乎在您尝试打印字符串时生成了错误消息,这意味着无法使用默认的输出编码来编码Unicode字符。对于print,应为sys.stdout.encoding

© www.soinside.com 2019 - 2024. All rights reserved.