加载和读取JSON文件的正确方法包含Python中的特殊字符

问题描述 投票:1回答:1

我正在使用JSON文件,其中包含一些未知编码的字符串,如下例所示:

"L\u00c3\u00aa Nguy\u00e1\u00bb\u0085n Ph\u00c3\u00ba"

我已经在json.load()环境中使用Python 3.7函数加载了此文本,并尝试使用在Internet上找到的一些方法对其进行编码/解码,但是我仍然无法按预期获得正确的字符串。 (在这种情况下,它必须为Lê Nguyễn Phú。)>

我的问题是,他们使用的是哪种编码方法,以及如何在Python中以正确的方式解析此文本?

因为JSON文件来自我无法处理的外部来源,所以我无法知道文本编码过程或对其进行任何更改。

[更新]更多详细信息:

JSON文件如下所示:

{
 "content":"L\u00c3\u00aa Nguy\u00e1\u00bb\u0085n Ph\u00c3\u00ba"
}

首先,我加载了JSON文件:

 with open(json_path, 'r') as f:
        data = json.load(f)

但是当我提取内容时,这不是我期望的:

string = data.get('content', '')
print(string)

'Lê Nguyá»\x85n Phú'
    

我正在处理JSON文件,其中包含一些未知编码的字符串,如下例所示:“ L \ u00c3 \ u00aa Nguy \ u00e1 \ u00bb \ u0085n Ph \ u00c3 \ u00ba”我已经使用json.load加载了此文本()函数...

python json python-3.x string unicode
1个回答
6
投票

某人采用“LêNguyễnPhú”,将其编码为UTF-8,然后采用所得的系列[[bytes

© www.soinside.com 2019 - 2024. All rights reserved.