打印带有UTF-8编码字符的字符串，例如：“\u00c5\u009b\”

Question

我想打印这样编码的字符串：

"Cze\u00c5\u009b\u00c4\u0087"

但我不知道如何。示例字符串应打印为：“Cześć”。

我尝试过的是：

str = "Cze\u00c5\u009b\u00c4\u0087"
print(str) 
#gives: CzeÅÄ

str_bytes = str.encode("unicode_escape")
print(str_bytes) 
#gives: b'Cze\\xc5\\x9b\\xc4\\x87'

str = str_bytes.decode("utf8")
print(str) 
#gives: Cze\xc5\x9b\xc4\x87

哪里

print(b"Cze\xc5\x9b\xc4\x87".decode("utf8"))

给出“Cześć”，但我不知道如何将

"Cze\xc5\x9b\xc4\x87"

字符串转换为

b"Cze\xc5\x9b\xc4\x87"

字节。

我也知道问题是使用

"unicode_escape"

参数对基本字符串进行编码后字节表示中的额外反斜杠，但我不知道如何摆脱它们 -

str_bytes.replace(b'\\\\', b'\\')

不起作用。

Answer 1

使用

raw_unicode_escape

：

text = 'Cze\u00c5\u009b\u00c4\u0087'
text_bytes = text.encode('raw_unicode_escape')
print(text_bytes.decode('utf8')) # outputs Cześć

Answer 2

“名称”：“Aleksan dra D\u00c5\u0082ugok\u00c4\u0099cka”，“uri”：“https://www.facebook。 com/aleksandra.padzik"

打印带有UTF-8编码字符的字符串，例如：“\u00c5\u009b\”

问题描述投票：0回答：2

2个回答

最新问题

打印带有UTF-8编码字符的字符串，例如：“\u00c5\u009b\”

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2