如何在pandas DataFrame中转换或解码Unicode字符?

问题描述 投票:1回答:1

我正在使用pandas从excel文件中读取一些数据并进行了一些行遍历以生成一个python字典,然后将其放入json文件中。

问题是我在json文件中获得了Unicode字符:

"C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar"

如上所示,我不想要Unicode'\ u00a0',而是希望在我的json文件中使用它的解码字符表示。

从pandas本身读取excel文件时,有什么方法可以进行这种转换(或过滤或其他任何调用)?或者有没有办法在使用json.dump()写入json文件时这样做?

python excel pandas unicode data-analysis
1个回答
1
投票

使用json.dumps(..., ensure_ascii=False)

foo = "C V M College of Fine Arts,\u00a0 Vallabh Vidyanagar"

import json
print(json.dumps({'foo':foo}, ensure_ascii=False))

收益:

{"foo": "C V M College of Fine Arts,  Vallabh Vidyanagar"}
© www.soinside.com 2019 - 2024. All rights reserved.